现在的位置: 首页 > 综合 > 正文

优化SQL的执行速度

2013年10月14日 ⁄ 综合 ⁄ 共 2096字 ⁄ 字号 评论关闭

在项目开发中,页面的反应速度是非常重要的,改善页面反应速度的方法有很多。

但一般的问题多数是出现在数据库访问的SQL上面。

比如:重复多次访问数据库,SQL速度很低等。

重复多次访问数据库需要修改逻辑来减少数据库的访问。而SQL的执行速度可以通过仔细调试解决。

下面是一些SQL的性能调试方法.整理于网络内容。

1. IN和EXISTS

    --1.慢
    SELECT  name
    FROM    Personnel
    WHERE   birthday IN (SELECT  birthday
                           FROM     Celebrities);

    --2.快
    SELECT  P.name
    FROM    Personnel AS P
    WHERE   EXISTS   (SELECT
                      FROM Clelebrities AS C
                      WHERE P.birthday = C.birthday);

    其中EXISTS (SELECT * FROM …)的写法比EXISTS (SELECT 列名 FROM …)的写法好。

2.  COUNT(*) 和 COUNT(列名)

  COUNT(列名)较快

3. GROUP BY 使用index。

   GROUP BY col1 如果不能使用index。 GROUP BY col1,col2能够使用index的话,改为 GROUP BY col1,col2。

4. ORDER BY 使用index。

  和GROUP BY同理。

5. UNION、INTERSECT、EXCEPT 后面加上ALL 关键字

  如果对重复数据不是很敏感的时候,在UNION、INTERSECT、EXCEPT 后面加上ALL 关键字后,性能会得到提升。

6. 下面的一些写法也会造成使用了index。

/* 1.index的col_1列有运算 */
SELECT * 
  FROM SomeTable
 WHERE col_1 * 1.1 > 100;

这种情况改为 WHERE col_1  > 100/1.1即可。

WHERE  col_1 IS NULL;

使用了is null的时候也是使用不了index的。这个时候可以做个函数index来解决。

WHERE  SUBSTR(col_1, 1, 1) = 'a';

index的列使用了函数。这个时候可以做个函数index来解决。

WHERE  col_1 <> 100;

使用了否定形式。 (<>, !=,NOT EQUAL, NOT IN)也是一样的。

比如通过 col_1 < 100 OR col_1 > 100这种变换的形式来解决。

 WHERE  col_1 > 100  OR col_2 = 'abc';

OR的时候最好改为in。 如果非要使用OR的话,追加bitmap index。

× SELECT  *   FROM  SomeTable  WHERE  col_1  LIKE '%a';
× SELECT  *   FROM  SomeTable  WHERE  col_1  LIKE '%a%';
○ SELECT  *   FROM  SomeTable  WHERE  col_1  LIKE 'a%';

Like的时候,只有前方一致能够使用index。

后方一致可以通过REVERSE转换后,改为前方一致就可以了。部分一致可以写个函数,追加函数index就可以了。

× SELECT * FROM SomeTable WHERE col_1 = 10;
○ SELECT * FROM SomeTable WHERE col_1 = '10';
○ SELECT * FROM SomeTable WHERE col_1 = CAST(10, AS CHAR(2));

col_1为char类型,类型不匹配的时候,不能使用index。改为类型一致。

 ○ SELECT * FROM SomeTable WHERE col_1 = 10 AND col_2 = 100 AND col_3 = 500;
 ○ SELECT * FROM SomeTable WHERE col_1 = 10 AND col_2 = 100 ;
 × SELECT * FROM SomeTable WHERE col_1 = 10 AND col_3 = 500 ;
 × SELECT * FROM SomeTable WHERE col_2 = 100 AND col_3 = 500 ;
 × SELECT * FROM SomeTable WHERE col_2 = 100 AND col_1 = 10 ;

假设col_1, col_2, col_3 列上有index,如果顺序不对的话不能使用index。

rowid(Oracle)、oid(PostgreSQL)如果知道行号的话,行号访问最快。

× SELECT * FROM SomeTable;
○ SELECT col_1, col_2, col_3 FROM SomeTable;

最好只取需要的数据。这样可以减少零时表的大小,也能减少网络的通信量。

× SELECT col_1, col2 FROM SomeTable ;
○ SELECT S.col_1, S.col2 FROM SomeTable S ;

每个表都最好有一个别名。

    SELECT *
      FROM  Address  
     WHERE prefecture IN ('记录数最多', '记录数较多', '记录一般', '很少');

In的时候,记录最多的项目靠左边。

通过这些调整吗,改善SQL的执行计划。PostgreSQL中还可以自己临时关闭一些join的方式来实现自己的执行计划。

更多层面还是要理解SQL的执行逻辑,产生最少的循环判断,做成最少的临时表,使用最恰当的index等等来提高整体性能

抱歉!评论已关闭.