红联Linux门户
Linux帮助

结巴分词0.30发布,Python中文分词组件

发布时间:2013-07-01 16:00:21来源:红联作者:empast
Chagelog:

2013-07-01: version 0.30
==========================
1) 新增jieba.tokenize方法,返回每个词的起始位置
2) 新增ChineseAnalyzer,用于支持whoosh搜索引擎
3)添加了更多的中英混合词汇
4)修改了一些py文件的加载方法,从而支持py2exe,cxfree打包为exe

官方首页:https://github.com/fxsjy/jieba

来自:开源中国社区
文章评论

共有 0 条评论