红联Linux门户
Linux帮助

中文分词软件包 LibMMSeg

发布时间:2012-11-19 21:31:31来源:红联作者:empast
LibMMSeg 是Coreseek.com为 Sphinx 全文搜索引擎设计的中文分词软件包,其在GPL协议下发行的中文分词法,采用Chih-Hao Tsai的MMSEG算法。

LibMMSeg 采用C++开发,同时支持Linux平台和Windows平台,切分速度大约在300K/s(PM-1.2G),截至当前版本(0.7.1)LibMMSeg没有为速度仔细优化过,进一步的提升切分速度应仍有空间。

主页:http://www.coreseek.cn/opensource/mmseg/

下载:http://www.coreseek.cn/uploads/csft/3.2/mmseg-3.2.14.tar.gz

来自:开源中国社区
文章评论

共有 0 条评论