复杂性的计量

现在的位置: 首页 > 综合 > 正文

复杂性的计量

2012年07月31日 ⁄ 综合 ⁄ 共 2043字 ⁄ 字号小中大 ⁄ 评论关闭

复杂性的计量

算法的复杂性是算法运行所需要的计算机资源的量，需要的时间资源的量称作时间复杂性，需要的空间（即存储器）资源的量称作空间复杂性。这个量应该集中反映算法中所采用的方法的效率，而从运行该算法的实际计算机中抽象出来。换句话说，这个量应该是只依赖于算法要解的问题的规模、算法的输入和算法本身的函数。如果分别用N、I和A来表示算法要解问题的规模、算法的输入和算法本身，用C表示算法的复杂性，那么应该有：

C =F(N,I,A)

其中F(N,I,A)是N,I,A的一个确定的三元函数。如果把时间复杂性和空间复杂性分开，并分别用T和S来表示，那么应该有：

T =T(N,I,A) (2.1)

和 S =S(N,I,A) (2.2)

通常，我们让A隐含在复杂性函数名当中，因而将（2.1）和（2.2）分别简写为

T =T(N,I)

和 S =S(N,I)

由于时间复杂性和空间复杂性概念类同，计算方法相似，且空间复杂性分析相对地简单些，所以下文将主要地讨论时间复杂性。

下面以T(N,I)为例，将复杂性函数具体化。

根据T(N,I)的概念，它应该是算法在一台抽象的计算机上运行所需的时间。设此抽象的计算机所提供的元运算有k种，他们分别记为O₁,O₂,..,O_k；再设这些元运算每执行一次所需要的时间分别为t₁,t₂,..,t_k 。对于给定的算法A，设经过统计，用到元运算O_i的次数为e_i，i=1,2,..,k ，很明显，对于每一个i，1<=i<=k，e_i是N和I的函数，即e_i=e_i(N,I)。那么有：

(2.3)

其中t_i，i=1,2,..,k,是与N,I无关的常数。

显然，我们不可能对规模N的每一种合法的输入I都去统计e_i(N,I),i=1,2,…,k。因此T(N,I)的表达式还得进一步简化，或者说，我们只能在规模为N的某些或某类有代表性的合法输入中统计相应的e_i, i=1,2,…,k，评价时间复杂性。

下面只考虑三种情况的复杂性，即最坏情况、最好情况和平均情况下的时间复杂性，并分别记为T_max(N )、T_min(N)和T_avg(N )。在数学上有：

(2.4)

(2.5)

(2.6)

其中，D_N是规模为N的合法输入的集合；I^*是D_N中一个使T(N,I^*)达到T_max(N)的合法输入，是D_N中一个使T(N,)到T_min(N)的合法输入；而P(I)是在算法的应用中出现输入I 的概率。

以上三种情况下的时间复杂性各从某一个角度来反映算法的效率，各有各的用处，也各有各的局限性。但实践表明可操作性最好的且最有实际价值的是最坏情况下的时间复杂性。下面我们将把对时间复杂性分析的主要兴趣放在这种情形上。

一般来说，最好情况和最坏情况的时间复杂性是很难计量的，原因是对于问题的任意确定的规模N达到了T_max(N)的合法输入难以确定，而规模N的每一个输入的概率也难以预测或确定。我们有时也按平均情况计量时间复杂性，但那时在对P(I)做了一些人为的假设（比如等概率）之后才进行的。所做的假设是否符合实际总是缺乏根据。因此，在最好情况和平均情况下的时间复杂性分析还仅仅是停留在理论上。

现在以上一章提到的问题1的算法Search为例来说明如何利用(2.4)-(2.6)对它的T_max、T_min和T_avg进行计量。这里问题的规模以m计算，算法重用到的元运算有赋值、测试和加法等三种，它们每执行一次所需的时间常数分别为a,t,和s 。对于这个例子，如假设c在A中，那么容易直接看出最坏情况的输入出现在c=A[m]的情形，这时：

T_max(m)=a+2mt+(m-1)s+(m-1)a+t+a=(m+1)a+(2m+1)t+(m-1)s (2.7)

而最好情况的输入出现在c=A[1]的情形。这时：

(2.8)

至于T_avg(m)，如前所述，必须对D_m上的概率分布做出假设才能计量。为简单起见，我们做最简单的假设：D_m上的概率分布是均等的，即P(A[i]=c)=1/m 。若记T_i=T(m,I_i)，其中I_i表示A[i]=c的合法输入，那么：

(2.9)

而根据与(2.7)类似的推导，有：

代入(2.9) ，则：

这里碰巧有：

T_avg(m)=(T_max(m)+T_min(m))/2

但必须指出，上式并不具有一般性。

类似地，对于算法B_Search照样可以按(2.4)-(2.6)计算相应的T_max(m)、T_min(m)和T_avg(m)。不过，我们这里只计算T_max(m) 。为了与Search比较，仍假设c在A中，即最坏情况的输入仍出现在c=A[m]时。这时，while循环的循环体恰好被执行了logm +1 即k+1 次。因为第一次执行时数据的规模为m，第二次执行时规模为m/2等等，最后一次执行时规模为1。另外，与Search少有不同的是这里除了用到赋值、测试和加法三种原运算外，还用到减法和除法两种元运算。补记后两种元运算每执行一次所需时间为b和d ，则可以推演出：

(2.10)

比较(2.7)和(2.10) ，我们看到m充分大时，在最坏情况下B_Search的时间复杂性远小于Search的时间复杂性。

【上篇】用Layer.search快速查询图元
【下篇】老男孩影评

作者: crumble

该日志由 crumble 于12年前发表在综合分类下，最后更新于 2012年07月31日.
转载请注明: 复杂性的计量 | 学步园 +复制链接

抱歉!评论已关闭.

学步园

复杂性的计量

复杂性的计量

作者: crumble

书签

最新文章New

本站推荐

返回首页