红联Linux门户
Linux帮助

结巴分词0.26发布,Python中文分词组件

发布时间:2013-04-07 14:56:55来源:红联作者:empast
本次的主要更新:

1) 改进了对标点符号的处理,之前的版本会过滤掉所有的标点符号;

2) 允许用户在自定义词典中添加词性;

3) 改进了关键词提取的功能jieba.analyse.extract_tags;

4) 修复了一个在pypy解释器下运行的bug.

在线演示:http://jiebademo.ap01.aws.af.cm/

来自:开源中国社区
文章评论

共有 0 条评论