首页
系统教程
Linux入门
Linux管理
Linux技巧
Linux命令
Ubuntu
Linux服务器
Linux数据库
Linux开发
通用技术
发行版
企业应用
实验室
当前位置:
红联Linux门户
>
Linux软件下载
结巴分词0.23发布,Python中文分词组件
发布时间:2012-12-13 10:24:37
来源:红联
作者:empast
结巴分词:做最好的中文分词组件
0.23版主要修复了之前版本不能识别中英混合词语的问题。
由于之前的版本在"初分"阶段便把中文和英文分开了,所以不能识别中英混合的词语, 比如“B超”,“T恤”。
现在,用户还可以通过自定义词典来添加新的混合词,比如“长袖T恤”,“江南style"
主页:
https://github.com/fxsjy/jieba
来自:开源中国社区
文章评论
共有
0
条评论
频道文章
邮件处理API Mailet
解析HTTP客户端 Generic Apache Request Library
C语言的PING库 liboping
VectorLinux 7.1发布,Linux操作系统
Ristretto - 轻量级的图片查看器
Apache Tika 1.9发布,内容抽取工具集合
GMLive 0.21发布
Rspamd 0.9.8发布,反垃圾邮件系统
PHP 7.0.0 Alpha 2发布
Apache Hama现支持Hadoop YARN
最新教程
Apache Accumulo 1.7.4发布,K/V存储方案
flatpickr 4.4.2发布,Javascript日期选择器
Java工具集Hutool 4.0.9发布,bug修复
PHPUnit 7.0.3发布,PHP单元测试框架
Apache Ant 1.9.11和1.10.3发布,初步支持JUnit5
Apache Groovy 2.4.15发布,改进JDK9/10支持
KDE Plasma 5.12.4发布,简化任务视图
Laravel v5.6.14发布,PHP开发框架
Infinispan 9.2.1.Final发布,分布式集群缓存系统
Hibernate Validator 6.0.9发布,进一步改进性能
随机推荐
Ubuntu下安装飞信
应用服务器开发库 libADSL
解析HTTP客户端 Generic Apache Request Library
Rails即时消息通讯包 ActionMessenger
Java邮件接口 JavaMail
易用的光盘ISO文件编辑器 ISO Master
VectorLinux 7.1发布,Linux操作系统
Apache Tika 1.9发布,内容抽取工具集合
RedOffice办公软件For Linux版下载
PHP 7.0.0 Alpha 2发布