Gensim 是用于主题模型、文档索引和海量文本的相似检索的 Python 库,目标受众是自然语言处理(NLP)和信息检索(IR)社区。
Gensim 3.1.0 已发布,主要更新如下:
大幅度优化 LSI 模型训练
将常用术语添加至 Phrases
新增 segment_wiki.py 脚本
FastText 测试提速
优化 SlicedCorpus.__len__
word_vec 将返回不可变量
不再支持 win x32,新增滚动构建
软件详情:https://github.com/RaRe-Technologies/gensim/releases/tag/3.1.0
下载地址:https://github.com/RaRe-Technologies/gensim/archive/3.1.0.zip
来自:开源中国社区

