红联Linux门户
Linux帮助

结巴0.17版发布 Python中文分词组件

发布时间:2012-10-12 11:25:54来源:红联作者:empast
"结巴"中文分词:做最好的Python中文分词组件。

此release主要包含以下两点更新:

1) 将词典文件dict.txt排序后存储,提升了Trie树构建速度,使得组件初始化时间缩短了10%;
2) 增强了人名词语的训练,增强了未登录人名词语的识别能力

主页:https://github.com/fxsjy/jieba

来自:开源中国社区
文章评论

共有 0 条评论