我们都非常习惯通过 MySQL 的 IN 函数 来查询特定集合的数据,比如为了在 books 表中找出李雷、韩梅梅和安华写的书,我们可以有如下的 SQL(可以通过 SQL Fiddle 查看示例):
SELECT * FROM books WHERE `books`.`author` IN ('李雷','韩梅梅','安华');
数据库返回如下结果:
author | title | |
---|---|---|
安华 | 暴走漫画 | |
李雷 | 蓝色生死恋 | |
韩梅梅 | 冰与火之歌 | |
韩梅梅 | 天国的阶梯 | |
李雷 | 这个杀手不太冷 | |
韩梅梅 | 阿甘正传 |
虽然这样确实能够返回所有李雷、韩梅梅和安华写过的书,但是返回的数据的排序方式是默认按照数据在数据库中的存储顺序,假如我们需要的返回结果是同时按照 IN 查询条件里边的参数顺序来排序呢?这个时候我们就需要利用到 MySQL FIELD 这个函数了,FIELD 函数本来是 MySQL 提供用来查询某一个字符串在给定字符串元组中的索引位置的,比如这个官方例子:
SELECT FIELD('ej', 'Hej', 'ej', 'Heja', 'hej', 'foo'); # -> 2
如果将其应用在 ORDER BY
排序条件中,就可以根据指定字段的值在给定参数列表中的索引数值,进而将查询结果按照参数列表排序了(示例请访问 SQL Fiddle ):
SELECT * FROM books WHERE `books`.`author` IN ('李雷','韩梅梅','安华') ORDER BY FIELD(author, '李雷','韩梅梅','安华');
这一次,返回的结果则是:
author | title | |
---|---|---|
李雷 | 蓝色生死恋 | |
李雷 | 这个杀手不太冷 | |
韩梅梅 | 冰与火之歌 | |
韩梅梅 | 天国的阶梯 | |
韩梅梅 | 阿甘正传 | |
安华 | 暴走漫画 |
可以发现,这一次,我们得到的结果就是按照条件参数列表 '李雷','韩梅梅','安华'
进行排序后得到了。
本文提到的 FIELD
函数,毕竟只是 MySQL 数据库内置提供的一种函数,除非你非常明确你的项目就是只用 MySQL 数据库,否则,你的 SQL 代码在未来迁移到其他数据库的过程中就会遇到语法兼容性问题(只是 PostgreSQL 数据库不支持 FIELD)。
我们都知道,数据库在进行 ORDER BY
排序的时候,除非它是按照某个已经存在索引的键的值进行排序,否则数据库则需要通过计算 ORDER BY
中表达式的值并且按照查询结果建立新的临时表,这个过程会带来额外的时间开销跟内存开销,对数据库本身就是一种性能负担。这样的方式在单一数据库多个数据库客户端连接的时候,可能对数据库造成太大负担。
尽管使用 FIELD
函数可能带来兼容性以及性能方面的隐患,但是 FIELD
的使用并非全是有损之处。
比如在与 Ruby 的 active_record 结合时,这种通过数据库直接完成排序等 SQL 语句可以方便我们构建 ActiveRecord::Relation 对象,因为我们不再需要先将查询结果集从内存中转为数组排序,再进行二次查询,可以帮助我们减少 N+1 查询问题 ,后者也是常见的影响数据库服务器性能的现象之一。除此之外,这样的写法也可以有效地帮助我们简化代码,保持代码简洁。
但是在不需要对数据进行二次查询或者查询数据量太大的情况下,我反而建议可以通过 Ruby 的 Array#sort_by
方法对数据进行排序,这样的话,排序的任务就转移给了客户端代码,排序任务的压力就自然分散,减轻了服务器端的压力。
Array#sort_by
)的方式。