spaCy 2.0.0 发布了,spaCy 是一个 Python 和 CPython 的 NLP 自然语言文本处理库。
通过使用最新的深度学习技术,发布了 spaCy 的最新版本,使得在可扩展的云计算工作流程中运行spaCy变得更容易。 spaCy 2.0.0 已经修复了60多个bug,包括几个长期存在的问题,为7种语言增加了13个神经网络模型,并为8种新语言添加了 alpha 标记化支持。 还重新编写了几乎所有的使用指南,API文档和代码示例。
主要特性和改进:
[list][*]NEW: Convolutional neural network models for English, German, Spanish, Portuguese, French, Italian, Dutch and multi-language NER. Substantial improvements in accuracy over the v1.x models.
[*]NEW: Vectors class for managing word vectors, plus trainable document vectors and contextual similarity via convolutional neural networks.
[/list]
bug 修复:
[list][*]Fix issue #125, #228, #299, #377, #460, #606, #930: Add full Pickle support.
[*]Fix issue #152, #264, #322, #343, #437, #514, #636, #785, #927, #985, #992, #1011: Fix and improve serialization and deserialization of Doc objects.
[/list]
软件详情:https://github.com/explosion/spaCy/releases/tag/v2.0.0
下载地址:https://github.com/explosion/spaCy/archive/v2.0.0.zip
来自:开源中国社区

