现在的位置: 首页 > 综合 > 正文

又开源了一个项目

2013年12月09日 ⁄ 综合 ⁄ 共 156字 ⁄ 字号 评论关闭

在google  code上又开源了一个项目(http://code.google.com/p/lightwords/ ):

 

lightwords是一个中分分词引擎,用双数组Trie树作为词典结构,采用最短N路径算法构造词图粗切分,后期加工采用隐马尔科夫模型(HMM)进行人名地名识别和词性标注。开发语言是C++。

抱歉!评论已关闭.