Apache Lucene 4.1 发布了,包含一些 bug 修复、优化和提升,值得关注的有:
Lucene 4.1 使用新的默认编码器 (Lucene41Codec) 基于前一个体验的 “Block” 索引格式,用于提升性能,提供提供追加和 Pulsing 操作
默认的编码器优化了索引的存储,如果只有一个文档包含某个 Term ,则直接在 Term 字典中存储文档 id,而不是在独立的文件中存储文档id
默认编码器实现了高校的压缩存储字段的实现,使用 LZ4 进行压缩
写文件时采用追加方式,不再进行搜索操作
新的 suggest实现 ---- AnalyzingSuggester
facet 模块实现近乎实时的搜索支持
全新的 Highlighter (postingshighlighter)
增加 FilterStrategy 到 FilteredQuery 实现更灵活的过滤查询执行
添加 CommonTermsQuery用于加速高频 Term 的查询速度,Term 的频度可在查询时间高效的检测,无需耗费索引准备时间
4.0 的 bug 修复和其他的优化
更完整的列表请下载后查看 CHANGES.txt 文件。
项目主页:http://lucene.apache.org/
下载地址:http://www.apache.org/dyn/closer.cgi/lucene/java/
来自:开源中国社区

