现在的位置: 首页 > 综合 > 正文

老紫竹网页采集系统-0.2版发布(LzzSearch 0.2)

2013年01月31日 ⁄ 综合 ⁄ 共 558字 ⁄ 字号 评论关闭

 老紫竹网页采集系统(LzzSearch)变更历史
===================================

2009-02-03 v0.2
------------------------
* 增加了对Lucene 2.4 的支持,保存采集内容并对提供搜索和内容更新
* 使用了庖丁解牛做中文分词
* 修正了 StrTools 里面对于<br />不能正确文本替换的BUG
* 增加了专用的TestLucene的演示程序
* 更改test目录名为demo
* 的Lucene的索引目录在applicationContext.xml里面进行修改,默认为 d:/indexpaoding/lzzSearch
* 调整了项目目录,将需要的5个jar都放到了项目内部,无需单独下载了
* 注意:庖丁所需要的dic我已经放到了系统内部,在src/dic下面
     并且更新了paroding-analysis.jar里面的 paoding-dic-home.properties文件的配置

2009-02-02 v0.1
------------------------
* 基于Spring的配置,可以轻松的增加采集的站点
* 采集点包含标题,作者,发布时间和内容四部分
* 采集后的内容由用户自行

 

 

下载与反馈地址:

老紫竹网页采集系统-0.2版发布(LzzSearch 0.2)

 

【上篇】
【下篇】

抱歉!评论已关闭.