PCA主成分分析
优点:降低数据的复杂性,识别最重要的多个特征。
缺点:不一定需要, 且可能损失有用信息。
适用数据类型:数值型数据。
PCA背景知识:
移动坐标轴
考虑上图中的大量数据点。如果要求我们画出一条直线,这条线要尽可能覆盖这些点, 那么最长的线可能是哪条?我做过多次尝试。在上中 , 3条直线中B 最长 。在PCA中,我们对数据的坐标进行了旋转,该旋转的过程取决于数据的本身。第一条坐标轴旋转到覆盖数据的最大方差位置,即图中的直线B
。数据的最大方差给出了数据的最重要的信息。
在选择了覆盖数据最大差......
阅读全文