700万数据随机取10条仅用不到10ms？ | 学步园

返回顶部
查看留言
转到底部

现在的位置: 首页 > 综合 > 正文

700万数据随机取10条仅用不到10ms？

2012年07月06日 ⁄ 综合 ⁄ 共 1219字 ⁄ 字号小中大 ⁄ 评论关闭

虽然有点唬人,但是在实际开发中,确实会遇到此类需求但是要求又不是很严格,那样的话用这个方式还是比较不错的选择

呵呵以下内容转载来自csdb论坛

blog文章
http://blog.csdn.net/jinjazz/archive/2009/04/16/4084142.aspx

SQL code

set nocount on
--75151448行数据
select count(*) from syscolumns a,syscolumns b,syscolumns c 
set statistics time on
 
 select top 10 * from(
select a.name as name,left(b.name,10) as name1, checksum(newid()) as hash
    from syscolumns a,syscolumns b,syscolumns c )t
 where hash%100=0
 
set statistics time off
set nocount off

SQL Server 执行时间:

CPU 时间 = 16 毫秒，占用时间 = 4 毫秒。

这么bt？不过仔细一看是唬人的，这个是伪随机，后面数百万的大部分数据是一辈子都不会有机会显示的。但这是一个思路，where hash%100=0 这句话当中的100是个关键的因素。

要做到真的随机，至少需要hash%700000，同样的机器需要20秒，不过个人觉得已经很不错了。如果是hash%70000则是2秒，可以看出这基本是个线性关系。此思路应该比order by newid更加实用吧，order by newid()的top 10 我在运行了2分半还没有反应后放弃了。

返回

【上篇】linux命令之grep用法
【下篇】DataKeyNames工作

作者: jintian68

该日志由 jintian68 于12年前发表在综合分类下，最后更新于 2012年07月06日.
转载请注明: 700万数据随机取10条仅用不到10ms？ | 学步园 +复制链接

抱歉!评论已关闭.

返回首页

Copyright © 2013-2018 学步园保留所有权利.
软文销售 QQ客服：2265327166

点击这里给我发消息

（其他合作也可洽谈）