现在的位置: 首页 > 综合 > 正文

【模式识别】独立成分分析 ICA 中的几种方法

2013年05月27日 ⁄ 综合 ⁄ 共 813字 ⁄ 字号 评论关闭

 

 K-L 变换,也就是PCA,得到的是MSE下的最优结构,但有时对于分类效果并不是很好。所以我们引入了ICA。如果是PCA是使二阶积累量为0的话,那么ICA就是前四阶积累量都是0.那ICA是什么意思呢?

类别信息的源头是一组独立的分量,但是类别信息表现出来的是一组互相相关的分量,当然这组分量的个数应该大于独立分量的个数。我们的任务就是去除这种互相关;使分量由相关的一组,变为无关的一组,也就是独立成分。

 那具体该怎么做呢?我们一下有这么三个方法:

 

(一)累积量法

 

k1(z) = E[zi] ;

k2(z) = E[zizj] ;

k3(z) = E[zizizk] ;

k4(z) = E[zizjzkzl]  -  E[zizj] E[zkzl] - E[zizk] E[zlzj] -  E[zizl] E[zkzj];

对于一般的随即变量,PDF(概率密度函数)都是对称分布的。所以k1和k3为0.
那么,要使k2为0,我们旧的使用主成分分析就好,也就是PCA。所以第一步就是先做PCA,求的PCA的线性变换矩阵。
y = Ax
第二步,我们要做的是进行k4的最小化, 根据数学可知,k4的最小化,也就是求一个正交矩阵,使下面的式子最大。(交叉积累量最小也就是自积累量最大。)
max Obj(B) = SUM(k4(yi)2
之后结合上述信息,我们有:x = (BA)y. ICA变换矩阵 W = BA。
(2)最大熵法
你可能会问,我们要降低特征的维数,这是压缩,为什么还要最大化熵呢?压缩的话不是熵越小越好么?
的确,熵越小表示压缩效果越好,但那是无损压缩;对于本身我们已经确定下压缩能力的有损压缩模型而言,最大的接近原有的熵就意味着最大的保留了信息。所以我们用最大化熵的办法。
其中:z = f(Wy + b); f 为Sigmoid函数。
(公式比较复杂,我就不写了)
结果还是用迭代优化的算法
dW = (WT)-1 + (1 - 2z)yT
db = 1 - 2z
(3)最小互信息法
原理和(2)比较像,这里从略。

 

【上篇】
【下篇】

抱歉!评论已关闭.