现在的位置: 首页 > 综合 > 正文

老紫竹网页采集系统-0.2版发布(LzzSearch 0.2)

2013年01月31日 ⁄ 综合 ⁄ 共 558字 ⁄ 字号小中大 ⁄ 评论关闭

老紫竹网页采集系统(LzzSearch)变更历史
===================================

2009-02-03 v0.2
------------------------
* 增加了对Lucene 2.4 的支持，保存采集内容并对提供搜索和内容更新
* 使用了庖丁解牛做中文分词
* 修正了 StrTools 里面对于<br />不能正确文本替换的BUG
* 增加了专用的TestLucene的演示程序
* 更改test目录名为demo
* 的Lucene的索引目录在applicationContext.xml里面进行修改,默认为 d:/indexpaoding/lzzSearch
* 调整了项目目录，将需要的5个jar都放到了项目内部,无需单独下载了
* 注意：庖丁所需要的dic我已经放到了系统内部，在src/dic下面
并且更新了paroding-analysis.jar里面的 paoding-dic-home.properties文件的配置

2009-02-02 v0.1
------------------------
* 基于Spring的配置，可以轻松的增加采集的站点
* 采集点包含标题，作者，发布时间和内容四部分
* 采集后的内容由用户自行

下载与反馈地址：