LibMMSeg 是Coreseek.com为 Sphinx 全文搜索引擎设计的中文分词软件包,其在GPL协议下发行的中文分词法,采用Chih-Hao Tsai的MMSEG算法。
LibMMSeg 采用C++开发,同时支持Linux平台和Windows平台,切分速度大约在300K/s(PM-1.2G),截至当前版本(0.7.1)LibMMSeg没有为速度仔细优化过,进一步的提升切分速度应仍有空间。
主页:http://www.coreseek.cn/opensource/mmseg/
下载:http://www.coreseek.cn/uploads/csft/3.2/mmseg-3.2.14.tar.gz
来自:开源中国社区

