飘易博客(作者:Flymorn)
订阅《飘易博客》RSS,第一时间查看最新文章!
飘易首页 | 留言本 | 关于我 | 订阅Feed

SQL语句SELECT TOP用法小结

Author:Flymorn Source:飘易博客
Categories:数据库 PostTime:2008-4-15 15:59:07
正 文:
    今天很是郁闷,因为我以下的这些文字是第二次打入,艾,断线,提交失败,数据清空 ,看来要改进我的后台系统了……

    前段时间,我编写了一套ASP+MSSQL的房产程序;今天有一位用户找到我说,她无法发布信息了,系统提示:重复信息,拒绝发布。我的反应就是很正常,因为这是我故意设置的,就是为了防止重复信息;但用户说她没看到重复信息,怎么系统也拒绝发布呢。而我也只是采用了简单的select top n的查询进行判断而已,并且这个n设置仅仅为30啊。

    近些时间来,我也发现一些细节问题。有不少用户有意无意地在标题里加上一些无意义的阿拉伯数字,我明白:这些用户也同样的遇到了重复信息拒绝发布的困扰了,这样做也是为了规避这样的限制。结合今天的这位向我反应问题的用户,我意识到:可能是我的程序判断有误了。

    马上本地localhost测试,果然,我发布了一条3个月前的标题相同的信息,系统也提示重复信息,拒绝发布;而这个3个月前的id数字距现在有2万多了的差距了,远远超出了我的select top 30的查询了。

    打开代码,数据库为mssql 2000:

dim rs,sql
Set rs = Server.CreateObject ("ADODB.Recordset")
sql="select top 30 * from data where title='"&title1&"' order by id desc"
rs.Open sql,conn,1,3
if rs.eof then
'入库操作
else
'重复,拒绝发布
end if

    上面的这段代码是有错误的。它和我的原意相反。sql语句里同时存在where和top语句的时候,并且where条件列不是合适的索引,程序执行的是全表扫描,首先是查找符合where条件的记录,而这里的top限制形同虚设。如果全表是百万级别以上的数据表,那么就这么一个简单的判断,就有可能拖垮数据库。

    我们可以采用变通的方法,就是去掉sql查询里的where条件,放入到循环体内做判断;比如采用piaoyi以下这样的代码:

dim rs,sql,cf
cf=0 '初始化重复标识为0
Set rs = Server.CreateObject ("ADODB.Recordset")
sql="select top 30 * from data order by id desc"
rs.Open sql,conn,1,3
do while not rs.eof
if rs("title")=title1 and datediff("h",rs("time"),now())<24 then
'标题相同,且在24小时内发帖
cf=1 ''重复标识为1
exit do
end if
rs.movenext
loop

if cf=0 then
'入库操作
elseif cf=1 then
'拒绝发布重复信息
end if

    如果你希望使用selcet top语句,并且还要附带where条件,那么条件中的列就得是合适的索引,如聚集索引、复合索引里的主列等,同时,where条件里也要尽量避开使用函数,or,判断NULL等会引起全部扫描的语句。这一点要记住,不然执行的是全表扫描。

    另外,也有人问道,如何选出第N条到第2N条记录呢。这样的sql语句就可以了:
“select top n * from TABLE_NAME where id not in (select top n id from TABLE_NAME order by id desc) order by id desc”。

    一个小的细节问题,如果不注意的话,有可能拖累整个程序的稳定性、健壮性;当数据量不大的时候,这种影响可能感觉不出来,而当数据量达到一定的程度的时候,比如有100人同时进行插入数据的操作时,系统很有可能假死,iis崩溃掉。而这,不是我希望看到的。
作者:Flymorn
来源:飘易博客
版权所有。转载时必须以链接形式注明作者和原始出处及本声明。
上一篇:JS获取表单值,提交时自动复制内容到剪贴板
下一篇:【工具】SEO查询工具收集整理
17条评论 “SQL语句SELECT TOP用法小结”
2008-4-15 19:50:05
不知道飘易写博是怎样写的,我都是在自己电脑上先写好,再发布的。随时保存。
2 Flymorn
2008-4-16 8:35:56
呵呵,我写博是直接在后台打字的;
不过,针对这个情况,我已经加强了后台系统,提交的同时,自动复制内容到剪贴板了;
这样,即使提交失败,断线啥的,都可以从剪贴板里重新粘贴进去 :)
3 lee
2008-7-17 17:17:26
sqlite中的limit也不能和where联用吗
4 幻舞者
2008-7-29 18:39:45
我记得应该是order by的字段中有内容重复的话才会是top失效吧
我在首页中调用的时候top和where联合使用的,也没有说会让top失效,否则我首页显示的列表就不是我要求的N个了
5 Tom Sawyer
2008-7-30 16:12:09
" 如果你希望使用selcet top语句,就不要附带where条件,这一点要记住,不然执行的是全表扫描。" 是不是执行表扫描,取决于where条件的字段中有没有合适的索引。有了合适的索引,带where条件的select top语句是不会执行表扫描的。

楼主得出这样的结论,是因为本来就不存在合适的索引,如果不用top就必定导致表扫描,而带where条件的select top语句,因为where子句先于top执行,在没有合适的索引的情况下,导致表扫描。对于不带where条件的select top语句,SQL Server执行时会忽略剩下的记录,top不是ANSI SQL所支持的,是SQL Server特有的。
6 flymorn
2008-7-30 19:00:50
Tom解说的非常精彩,感谢Tom。
2008-10-5 21:51:53
我记得应该是order by的字段中有内容重复的话才会是top失效吧

4 幻舞者说的没错.我觉得楼主应该改下文章了.会误导人的...
8 flymorn
2008-10-5 22:57:37
to何苦,本文讨论的主题是select top,where下是否执行表扫描的问题,也即5楼TOM说的有无合适的索引下是否执行表扫描。
9 改进
2008-11-6 14:24:14
可以在 do while i<7
..............
i=i+1
i是最古老的控制循环的方法吧
10 doraemon
2010-7-17 15:13:50
我记得应该是order by的字段中有内容重复的话才会是top失效吧
--

4楼这是啥意思?
我这有内容重复也没失效啊!

SELECT TOP 5 * FROM Students
Where SGrade<7 ORDER BY SGrade

我的SGrade是存在很多重复记录的啊!QQ79915957
11 水边
2010-8-3 15:15:13
这个where是否执行表扫描和top没有关系吧
不管有没有top,都是按照where的条件来进行索引扫描或全表扫描
top只是在扫描到足够的记录时,忽略以后的未扫描的记录

不明白楼主这个top失效的结论怎么得出的
12 你好
2010-10-18 9:48:48
select top N * from T where[ ] order by []
1.如果存在合适的Index,会按照where[]执行索引扫描
2.按照order by[] sort
3.取出前N行
楼主执行顺序理解错
13 test
2011-1-12 13:50:36
学习一下 select top 。。。。。。 迷惑中
2011-4-26 10:20:51
我想问一下想要取数据库里的2-10条记录语句应该怎么写
15 飘易
2011-4-26 12:35:56
楼上的,方法:先top 10,在循环里忽略第一条即可。
16 top
2011-9-25 10:00:49
DECLARE @ProductID INT
SELECT @ProductID = TOP 5 * FROM [Order Details] ORDER BY Quantity DESC
PRINT @ProductID
这段代码中  不能将TOP 赋于@ProductID 么
2012-12-20 11:06:45
if conn.execute("select count(id) from (select top 30 id,title,time from data order by id desc) as data where title='"&title1&"' and datediff('h',[tile],'"&now()&"')<24")(0)>0 then
'重复操作
end if
发表评论
名称(*必填)
邮件(选填)
网站(选填)

记住我,下次回复时不用重新输入个人信息
© 2007-2010 飘易博客 Www.Piaoyi.Org 原创文章版权由飘易所有 渝ICP备07006361号