现在的位置: 首页 > 综合 > 正文

700万数据随机取10条仅用不到10ms?

2012年07月06日 ⁄ 综合 ⁄ 共 1219字 ⁄ 字号 评论关闭

虽然有点唬人,但是在实际开发中,确实会遇到此类需求但是要求又不是很严格,那样的话用这个方式还是比较不错的选择

呵呵 以下内容转载 来自csdb论坛

blog文章
http://blog.csdn.net/jinjazz/archive/2009/04/16/4084142.aspx

SQL code
set nocount on
--75151448行数据
select count(*) from syscolumns a,syscolumns b,syscolumns c 
set statistics time on
 
 select top 10 * from(
select a.name as name,left(b.name,10) as name1, checksum(newid()) as hash
    from syscolumns a,syscolumns b,syscolumns c )t
 where hash%100=0
 
set statistics time off
set nocount off

SQL Server 执行时间:

  CPU 时间 = 16 毫秒,占用时间 = 4 毫秒。

这么bt?不过仔细一看是唬人的,这个是伪随机,后面数百万的大部分数据是一辈子都不会有机会显示的。但这是一个思路,where hash%100=0 这句话当中的100是个关键的因素。

要做到真的随机,至少需要hash%700000,同样的机器需要20秒,不过个人觉得已经很不错了。如果是hash%70000则是2秒,可以看出这基本是个线性关系。此思路应该比order by newid更加实用吧,order by newid()的top 10 我在运行了2分半还没有反应后放弃了。

抱歉!评论已关闭.