Apache Lucene 4.2 来了!!! 值得关注的改进内容:
Lucene 4.2 使用新的默认编码器 (Lucene42Codec) ,使用更高效的 docvalues 格式,FST 排序,更少的定位开销,改进数值压缩;更小的术语向量
简化 Doc values external 和编码器 API 以及实现,数值类型合并后只包含三种类型 (NUMERIC, BINARY, SORTED); PerFieldDocValuesFormat 可让你为每个字段设置不同格式
facet 模块的重构和性能提升,大约 3.8 倍的提升
facet 模块的 DrillDownQuery 支持 multi-select
新的 DrillSideways 类用于对 facet 标签的计数
添加额外的 docvalues 类型 (SORTED_SET) 用于支持多值
FSTs 更小,FST包支持超过 2GB 大小
新的 LiveFieldValues 类可以实时获取值
增加新的 classification 模块
对 4.1 版本的优化和 bug 修复
从这些改变上可看出 4.2 版本是不兼容 4.1 的索引。
项目主页:http://lucene.apache.org/
下载地址:http://www.apache.org/dyn/closer.cgi/lucene/java/
来自:开源中国社区