现在的位置: 首页 > 综合 > 正文

数据挖掘基础一

2014年01月26日 ⁄ 综合 ⁄ 共 454字 ⁄ 字号 评论关闭
 

一、数据挖掘,又称为数据库中知识发现(Knowledge Discovery from Database,简称KDD),它是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程。数据挖掘的定义过程描述如下图所示:


从图中可以看出,整个知识挖掘过程是由若干挖掘步骤组成,而数据挖掘仅仅是其中的一个主要步骤。整个KDD的主要步骤有:

1、  数据清洗(data cleaning),其作用就是清除数据噪声和与挖掘主体明显无关的数据;

2、  数据集成(data integration),其作用就是将来自多数据源中的相关数据组合到一起;

3、  数据转换(data transformation),其作用就是将数据转换为易于进行数据挖掘的数据存储形式;

4、  数据挖掘(data mining),它是知识挖掘的一个基本步骤,其作用就是利用智能方法挖掘数据模式或规律知识;

5、  模式评估(pattern evaluation),其作用就是根据一定评估标准(interesting measure)从挖掘结果筛选出有意义的模式知识;

-->

作者:

抱歉!评论已关闭.