现在的位置: 首页 > 综合 > 正文

python性能优化

2013年10月06日 ⁄ 综合 ⁄ 共 1380字 ⁄ 字号 评论关闭

     性能的优化,无非是从两个方面做。一方面是架构上的优化,使用更高性能的架构;另一方面就是从代码层面,更改代码的写法、算法,从而进行优化。

     在我看来,不同的程序员,由于思想的不同、性格的不同,写出来的程序,也一定不同。好的代码,应该是一件艺术品,应该是精雕细琢、巧夺天工的。这样才会有最优雅的外观,最强大的性能。下面就一点点说明,如何将python的性能,从代码层面,提高一倍、十倍、甚至百倍。

慎用python内置函数

python内置函数,只是为了应对通用情况。在很多情况下,内置函数的性能,远远不如自己写的,有针对性的函数。动动手,换个算法,就能把性能提高一倍以上。

1,例子:把字符串 '01_HX' 分别提取出'_'前面和'_'后面的字符串。

你会怎么做?用split('_'),还是切片?我想,很多朋友肯定都会用split('_')。

我们来看一下性能差距:

使用切片操作,在I5的苹果机上,每秒可以运行127万次。

使用split('_'),在I5的苹果机上,每秒可以运行90万次。

可以看出,简简单单换一个内置函数,换一点算法,就可以把效率提高40%以上!

 

测试代码如下:

#! /usr/bin/env python
#coding=utf-8

import time

s = '01_HX'

#---------- test 1---------------
start_time = time.time()
print "start_time:", start_time

j = 1

while 1:
    j += 1
    a = s[0:2]
    a2 = s[3:5]
    end_time = time.time()
    if end_time - start_time >= 1 :
        break
print "loop_num:", j
print "end_time: ",end_time
print a,a2

#---------- test 2---------------

start_time = time.time()
print "start_time:", start_time
j = 1
while 1:
    j += 1
    a = s.split('_')
    end_time = time.time()
    if end_time - start_time >= 1 :
        break
print "loop_num:", j
print "end_time: ",end_time
print a

 

测试结果如下:

start_time: 1362031838.14
loop_num: 1274972
end_time:  1362031839.15
01 HX
start_time: 1362031839.15
loop_num: 900801
end_time:  1362031840.16
['01', 'HX']

 

2, 用range()函数生成序列,与自定义序列

(1)a = range(0,6)

(2)a = [0, 1, 2, 3, 4, 5]

分别测试了一下,结果如下:

loop_num: 1029877

loop_num: 1602341

结论:还是自己显式定义序列,效率更高。

3, 生成一个序列的副本:用copy,与用切片特性

a = [0, 1, 2, 3, 4, 5]

(1)b = copy.copy(a)

(2)b = a[:]

分别测试了一下,结果如下:

loop_num: 677838

loop_num: 1530012

结论:变通的切片应用作为拷贝,比浅拷贝函数效率更高。注意,深拷贝效率很低!

抱歉!评论已关闭.