现在的位置: 首页 > 综合 > 正文

BlogDigger开发计划(draft)

2012年02月29日 ⁄ 综合 ⁄ 共 395字 ⁄ 字号 评论关闭

BlogDigger开发计划

人员:raywill,issac,blueSnail,ajim,geoffry,s

阶段1.数据预处理阶段,2.分类器设计阶段,3.组装测试阶段,4.Web整合阶段

1.数据预处理阶段

要求:定义一套完整的数据表示标准,标准中要包含完整的对象信息,如字体·大小·内容·地址等等,为分类器处理数据和“窗口密度分析”打下基础。

2.分类器设计阶段

要求:通过一定数量页面的学习,能够准确地将目标分类,为提取目标提供一套完整的解决方案。

包含两个子阶段:

2.1 内容分析

2.2 N邻域分析

3.组装测试阶段

4.Web整合阶段

要求

每个阶段都要有完备的文档记录,特别要记录下在设计过程中参考了那些文档,尊重第一作者。
完成任务固然重要,更重要的是每个人在完成任务的过程中能学习到新的知识,同时有所创新。

初级目标

在本领域中达到90%的正确率。

最终目标

任意领域适用,成为一个信息整合中心。

抱歉!评论已关闭.