讨论: SELECT TOP N问题 (2)
发布时间:2006-10-14 2:44:53   收集提供:gaoqian
Hi,everyone:

今天继续讨论SELECT TOP N问题.
1. DB2的M 2
在前一篇讨论中提到,由于DB2的SUBQUERY不支持ORDER BY子句,因此无法构造M2. 实际上,DB2提供了一组新的函数,称为 OLAP FUNCTIONS, 可以很好的支持TOP N问题.
M2:
SELECT * FROM
   (    SELECT MYKEY,RANK() OVER (ORDER BY ORD_COL DESC) AS MYRANK
        FROM MYTABLE ) AS RANKED_TABLE
WHERE MYRANK<=N

利用OLAP函数,除了上一篇中所提方法,DB2的M1又可以表示为:
SELECT * FROM
   (    SELECT MYKEY,ROW_NUMBER() OVER (ORDER BY ORD_COL DESC) AS MYRANK
        FROM MYTABLE ) AS RANKED_TABLE
WHERE MYRANK<=N

2. 除了M1, M2两种TOP N外,还有一种被DB2称为 DENSE_RANK, (M3). 通过下例分别说明.
M1: TOP 3 -- 1(4,101), 2(5,101), 3(1, 100) 或者1(4,101), 2(5,101), 3(2, 100)
M2: TOP 3 -- 1(4,101), 1(5,101), 3(1, 100), 3(2, 100)
M3: TOP 3 -- 1(4,101), 1(5,101), 2(1, 100), 2(2, 100), 3(3,99)
在DB2中, M3如此实现:
SELECT * FROM
   (  SELECT MYKEY,DENSE_RANK() OVER (ORDER BY ORD_COL DESC) AS MYRANK
      FROM MYTABLE ) AS RANKED_TABLE
WHERE MYRANK<=N

3. 为避免DBMSs的方言问题, M2,M3可以有如下标准(SQL 92)表示:
M2:
SELECT * FROM MYTABLE M1 WHERE N>
   (   SELECT COUNT(*) FROM MYTABLE M2
       WHERE M2.ORD_COL>M1.ORD_COL);
注意: 两个比较符都是 >
M3:
SELECT * FROM MYTABLE M1 WHERE N>
   (   SELECT COUNT(DISTINCT M2.ORD_COL) FROM MYTABLE M2
       WHERE M2.ORD_COL>M1.ORD_COL);
注意: 与M2的不同在于DISTINCT的使用
至于M1, 我目前还没有想到合适的标准写法,请补充.

4. 关于MYSQL
相对于各主流RDBMS来说,MYSQL要简单,幼稚地多. 在运行MYSQL时发现居然不支持SUBQUERY. 因此MYSQL中的TOP N问题要复杂一些.
SELECT * FROM MYTABLE, MYTABLE M2
WHERE M2.ORD_COL>=M1.ORD_COL
GROUP BY M1.MYKEY
HAVING COUNT(M2.ORD_COL) <=N
但是,这个语句是有问题的. 一个极端的例子: 当所有的ORD_COL的数值都一样时. 如果哪位想到了如何解决这个问题,请补充.

----------------------------------------------------------------------------------
各语句已经测试过, EXAMPLE:
create table mytable(mykey int, ord_col int);
insert into mytable values(1, 100);
insert into mytable values(2, 100);
insert into mytable values(3, 99);
insert into mytable values(4, 101);
insert into mytable values(5, 101);

fang  6/26/2000
 
 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50