现在的位置: 首页 > 综合 > 正文

语句执行效率说明

2014年11月09日 ⁄ 综合 ⁄ 共 6432字 ⁄ 字号 评论关闭

语句执行效率说明(仅供参考)

之前收集的一些资料仅供参考, 不一定完全正确... 有错误望指正 


1、操作符号: NOT IN操作符 

此操作是强列推荐不使用的,因为它不能应用表的索引。推荐方案:用NOT EXISTS 或(外连接+判断为空)方案代替 "IS NULL", "<>", "!=", "!>", "!<", "NOT", "NOT EXISTS", "NOT IN", "NOT LIKE", "LIKE '%500'",因为他们不走索引全是表扫描。NOT IN会多次扫描表,使用EXISTS、NOT EXISTS、IN、LEFT OUTER JOIN来替代,特别是左连接,而Exists比IN更快,最慢的是NOT操作. 如果列的值含有空,以前它的索引不起作用,现在2000的优化器能够处理了。相同的是IS
NULL,"NOT", "NOT EXISTS", "NOT IN"能优化她,而"<>"等还是不能优化,用不到索引。 


2、注意union和union all的区别。union比union all多做了一步distinct操作。能用union all的情况下尽量不用union。 


3、查询时尽量不要返回不需要的行、列。另外在多表连接查询时,尽量改成连接查询,少用子查询。。 


4、尽量少用视图,它的效率低。对视图操作比直接对表操作慢,可以用存储过程来代替它。特别的是不要用视图嵌套,嵌套视图增加了寻找原始资料的难度。 

我们看视图的本质:它是存放在服务器上的被优化好了的已经产生了查询规划的SQL。对单个表检索数据时,不要使用指向多个表的视图, 

直接从表检索或者仅仅包含这个表的视图上读,否则增加了不必要的开销,查询受到干扰.为了加快视图的查询,MsSQL增加了视图索引的功能。 


5、创建合理的索引,对于插入或者修改比较频繁的表,尽量慎用索引。因为如果表中存在索引,插入和修改时也会引起全表扫描。 

索引一般使用于where后经常用作条件的字段上。 


6、在表中定义字段或者存储过程、函数中定义参数时,将参数的大小设置为合适即可,勿设置太大。这样开销很大。 


7、Between在某些时候比IN速度更快,Between能够更快地根据索引找到范围。用查询优化器可见到差别。 

select * from chineseresume where title in ('男','女') 

Select * from chineseresume where between '男' and '女'是一样的。由于in会在比较多次,所以有时会慢些。 


8、在必要是对全局或者局部临时表创建索引,有时能够提高速度,但不是一定会这样,因为索引也耗费大量的资源。他的创建同是实际表一样。 


9、WHERE后面的条件顺序影响 

WHERE子句后面的条件顺序对大数据量表的查询会产生直接的影响,如 

Select * from zl_yhjbqk where dy_dj = '1KV以下' and xh_bz=1 

Select * from zl_yhjbqk where xh_bz=1 and dy_dj = '1KV以下' 

以上两个SQL中dy_dj(电压等级)及xh_bz(销户标志)两个字段都没进行索引,所以执行的时候都是全表扫描,如果dy_dj = '1KV以下'条件在记录集内比率为99%,而xh_bz=1的比率只为0.5%,在进行第一条SQL的时候99%条记录都进行dy_dj及xh_bz的比较,而在进行第二条SQL的时候0.5%条记录都进行dy_dj及xh_bz的比较,以此可以得出第二条SQL的CPU占用率明显比第一条低。所以尽量将范围小的条件放在前面。。 


10、用OR的字句可以分解成多个查询,并且通过UNION 连接多个查询。他们的速度只同是否使用索引有关,如果查询需要用到联合索引,用 UNION all执行的效率更高.多个OR的字句没有用到索引,改写成UNION的形式再试图与索引匹配。一个关键的问题是否用到索引。 


11、没有必要时不要用DISTINCT和ORDER BY,这些动作可以改在客户端执行。它们增加了额外的开销。这同UNION和UNION ALL一样的道理。 


12、使用in时,在IN后面值的列表中,将出现最频繁的值放在最前面,出现得最少的放在最后面,这样可以减少判断的次数 


13、当用SELECT INTO时,它会锁住系统表(sysobjects,sysindexes等等),阻塞其他的连接的存取。创建临时表时用显示声明语句,在另一个连接中SELECT * from sysobjects可以看到 SELECT INTO 会锁住系统表, Create table 也会锁系统表(不管是临时表还是系统表)。所以千万不要在事物内使用它!!!这样的话如果是经常要用的临时表请使用实表,或者临时表变量。 


14、一般在GROUP BY和HAVING字句之前就能剔除多余的行,所以尽量不要用它们来做剔除行的工作。他们的执行顺序应该如下最优:select 的Where字句选择所有合适的行,Group By用来分组个统计行,Having字句用来剔除多余的分组。这样Group By和Having的开销小,查询快.对于大的数据行进行分组和Having十分消耗资源。如果Group BY的目的不包括计算,只是分组,那么用Distinct更快 


15、一次更新多条记录比分多次更新每次一条快,就是说批处理好 


16、慎用临时表,临时表存储于tempdb库中,操作临时表时,会引起跨库操作。尽量用结果集和表变量来代替它。 


17、尽量将数据的处理工作放在服务器上,减少网络的开销,如使用存储过程。存储过程是编译好、优化过,并且被组织到一个执行规划里、且存储在数据库中的 SQL语句,是控制流语言的集合,速度当然快。 


18、不要在一段SQL或者存储过程中多次使用相同的函数或相同的查询语句,这样比较浪费资源,建议将结果放在变量里再调用。这样更快。 


19、按照一定的次序来访问你的表。如果你先锁住表A,再锁住表B,那么在所有的存储过程中都要按照这个顺序来锁定它们。如果你(不经意的)某个存储过程中先锁定表B,再锁定表A,这可能就会导致一个死锁。如果锁定顺序没有被预先详细的设计好,死锁很难被发现

o

oracle优化SQL语句的若干方法  

2012-04-11 16:47:40|  分类: oracle|字号 订阅

  1、操作符号: NOT IN操作符

此操作是强列推荐不使用的,因为它不能应用表的索引。

 

推荐方案:用NOT EXISTS 或(外连接+判断为空)方案代替 "IS NULL", "<>", "!=", "!>", "!<", "NOT", "NOT IN", "NOT LIKE", "LIKE '%500'",

因为他们不走索引全是表扫描。

NOT IN会多次扫描表,

使用EXISTS、NOT EXISTS、IN、LEFT OUTER JOIN来替代,特别是左连接,

而Exists比IN更快,最慢的是NOT操作。

使用in时,在IN后面值的列表中,将出现最频繁的值放在最前面,出现得最少的放在最后面,这样可以减少判断的次数

 

一般来说,在Oracle数据库中,我们对tb表的name字段进行模糊查询会采用下面两种方式:
       1.select * from tb where name like '%XX%';
       2.select * from tb where instr(name,'XX')>0;

instr(title,'手册')>0  相当于  title like '%手册%'

 instr(title,'手册')=1  相当于  title like '手册%'

 instr(title,'手册')=0  相当于  title not like '%手册%'

 特殊用法:

  select   id, name from users where instr('101914, 104703', id) > 0; 
             它等价于 
         select   id, name from users where id = 101914 or id = 104703;

 若是在name字段上没有加索引,两者效率差不多,基本没有区别。
      为提高效率,我们在name字段上可以加上非唯一性索引:
      create index idx_tb_name on tb(name);
      这样,再使用

select * from tb where instr(name,'XX')>0;

这样的语句查询,效率可以提高不少,表数据量越大时两者差别越大。但也要顾及索引数据重新排序的影响。

 

2、注意union和union all的区别。union比union all多做了一步distinct操作。能用union all的情况下尽量不用union。

 

3、查询时尽量不要返回不需要的行、列。另外在多表连接查询时,尽量改成连接查询,少用子查询。

 

4、尽量少用视图,它的效率低。对视图操作比直接对表操作慢,可以用存储过程来代替它。特别的是不要用视图嵌套,嵌套视图增加了寻找原始资料的难度。

我们看视图的本质:它是存放在服务器上的被优化好了的已经产生了查询规划的SQL。对单个表检索数据时,不要使用指向多个表的视图,

直接从表检索或者仅仅包含这个表的视图上读,否则增加了不必要的开销,查询受到干扰.

 

5、创建合理的索引,对于插入或者修改比较频繁的表,尽量慎用索引。因为如果表中存在索引,插入和修改时也会引起全表扫描。

索引一般使用于where后经常用作条件的字段上。

 

6、在表中定义字段或者存储过程、函数中定义参数时,将参数的大小设置为合适即可,勿设置太大。这样开销很大。

 

7、Between在某些时候比IN速度更快,Between能够更快地根据索引找到范围。select * from chineseresume where title in ('男','女')

Select * from chineseresume where between '男' and '女'是一样的。

由于in会在比较多次,所以有时会慢些。

8、ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名

例如:表 TAB1 16,384 条记录

      表 TAB2 1      条记录

 

选择TAB2作为基础表 (最好的方法)

     select count(*) from tab1,tab2  

执行时间0.96秒

选择TAB2作为基础表 (不佳的方法)

     select count(*) from tab2,tab1  

执行时间26.09秒

 

9、ORACLE采用自下而上的顺序解析WHERE子句,

SELECT …

FROM EMP E

WHERE  SAL > 50000

AND    JOB = ‘MANAGER’

AND    25 < (SELECT COUNT(*) FROM EMP

             WHERE MGR=E.EMPNO);

低效,执行时间156.3秒

SELECT …

FROM EMP E

WHERE 25 < (SELECT COUNT(*) FROM EMP

             WHERE MGR=E.EMPNO)

AND    SAL > 50000

AND    JOB = ‘MANAGER’;

高效,执行时间10.6秒

 

10、没有必要时不要用DISTINCT和ORDER BY,它们增加了额外的开销。这些动作可以改在客户端执行。

 

14、一般在GROUP BY和HAVING字句之前就能剔除多余的行,所以尽量不要用它们来做剔除行的工作。

他们的执行顺序应该如下最优:select 的Where字句选择所有合适的行,Group By用来分组个统计行,Having字句用来剔除多余的分组。

这样Group By和Having的开销小,查询快.对于大的数据行进行分组和Having十分消耗资源。

 

15、 使用DECODE函数来减少处理时间

使用DECODE函数可以避免重复扫描相同记录或重复连接相同的表.

例如:

   SELECT COUNT(*),SUM(SAL)

   FROM EMP

   WHERE DEPT_NO = 0020

   AND ENAME LIKE ‘SMITH%’;

 

   SELECT COUNT(*),SUM(SAL)

   FROM EMP

   WHERE DEPT_NO = 0030

   AND ENAME LIKE ‘SMITH%’;

 

你可以用DECODE函数高效地得到相同结果

SELECT COUNT(DECODE(DEPT_NO,0020,’X’,NULL)) D0020_COUNT,

        COUNT(DECODE(DEPT_NO,0030,’X’,NULL)) D0030_COUNT,

        SUM(DECODE(DEPT_NO,0020,SAL,NULL)) D0020_SAL,

        SUM(DECODE(DEPT_NO,0030,SAL,NULL)) D0030_SAL

FROM EMP WHERE ENAME LIKE ‘SMITH%’;

 

类似的,DECODE函数也可以运用于GROUP BY 和ORDER BY子句中.

 

16、计算记录条数

     和一般的观点相反, count(*) 比count(1)稍快 , 当然如果可以通过索引检索,对索引列的计数仍旧是最快的. 例如 COUNT(EMPNO)

 

17、减少对表的查询

在含有子查询的SQL语句中,要特别注意减少对表的查询.

例如:

     低效

          SELECT TAB_NAME

          FROM TABLES

          WHERE TAB_NAME = ( SELECT TAB_NAME

                                FROM TAB_COLUMNS

                                WHERE VERSION = 604)

          AND DB_VER= ( SELECT DB_VER

                           FROM TAB_COLUMNS

                           WHERE VERSION = 604)

     高效

          SELECT TAB_NAME

          FROM TABLES

          WHERE  (TAB_NAME, DB_VER)

                              = ( SELECT TAB_NAME, DB_VER)

                   FROM TAB_COLUMNS

                   WHERE VERSION = 604)

 

     Update 多个Column 例子:

     低效:

           UPDATE EMP

           SET EMP_CAT = (SELECT MAX(CATEGORY) FROM EMP_CATEGORIES),

              SAL_RANGE = (SELECT MAX(SAL_RANGE) FROM EMP_CATEGORIES)

           WHERE EMP_DEPT = 0020;

     高效:

           UPDATE EMP

           SET (EMP_CAT, SAL_RANGE)

                       = (SELECT MAX(CATEGORY) , MAX(SAL_RANGE)

                       FROM EMP_CATEGORIES)

              HERE EMP_DEPT = 0020;

18、避免在索引列上使用NOT

 

我们要避免在索引列上使用NOT, NOT会产生在和在索引列上使用函数相同的

影响. 当ORACLE”遇到”NOT,他就会停止使用索引转而执行全表扫描.

 

低效: (索引失效)

SELECT …

FROM DEPARTMENT

WHERE DEPT_CODE IS NOT NULL;

 

高效: (索引有效)

SELECT …

FROM DEPARTMENT

WHERE DEPT_CODE >=0

抱歉!评论已关闭.