jcseg发布1.8.0版了:
1.加入了停止词过滤功能,jcseg为该类词条专门加了lex-stopword.lex词库文件。并且在jcseg.properties中加入了jcseg.clearstopword开关选项。1开启停止词去除功能,0关闭该功能,默认是关闭的。
2.优化了字符串缓冲的使用,原本的jcseg中频繁的创建StringBuilder,可想而知会造成不必要的内存申请和回收资源消耗,这个版本中Jcseg引入了IStringBuffer类,主类切分过程中,所有的方法中重复利用一个全局的IStringBuffer缓冲区。
项目主页:http://code.google.com/p/jcseg/
下载地址:http://code.google.com/p/jcseg/downloads/list
来自:开源中国社区