1.噪声处理办法:
1、分箱法:平均值平滑,中值平滑,边界值平滑
2、聚类法识别孤立点:outlier,在分类中可以使用SVDD方法求取孤立点
3、回归的方法,这种方法需要求到模型
4、基于概率方面可以求取孤立点
5、用到的去噪声的方法有S-G滤波法
2.数据变换:
使用数据归一化处理,把不同的属性的数据,把数据变换到同一个量纲上。
数据压缩:
数据压缩分为有损压缩和无损压缩,比较常用用的有小波变换和主成分析,小波变换对于稀疏或者倾斜数据以及具有有序属性的数据具有良好的压缩效果。主成分析主要用在特征提取方面,现在用的比较多的是KPCA