一、数据挖掘,又称为数据库中知识发现(Knowledge Discovery from Database,简称KDD),它是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程。数据挖掘的定义过程描述如下图所示:
从图中可以看出,整个知识挖掘过程是由若干挖掘步骤组成,而数据挖掘仅仅是其中的一个主要步骤。整个KDD的主要步骤有:
1、 数据清洗(data cleaning),其作用就是清除数据噪声和与挖掘主体明显无关的数据;
2、 数据集成(data integration),其作用就是将来自多数据源中的相关数据组合到一起;
3、 数据转换(data transformation),其作用就是将数据转换为易于进行数据挖掘的数据存储形式;
4、 数据挖掘(data mining),它是知识挖掘的一个基本步骤,其作用就是利用智能方法挖掘数据模式或规律知识;
5、 模式评估(pattern evaluation),其作用就是根据一定评估标准(interesting measure)从挖掘结果筛选出有意义的模式知识;
-->
- 该日志由 hobbyist 于10年前发表在综合分类下,最后更新于 2014年01月26日.
- 转载请注明: 数据挖掘基础一 | 学步园 +复制链接