红联Linux门户
Linux帮助

Linux(CentOS 6.4)Solr4.8.1中文分词配置(IK分词)

发布时间:2015-04-04 11:02:35来源:linux网站作者:zwx19921215

1、环境准备

CentOS6.4、Tomcat6.0、Jdk1.7、Solr4.8.1、IK Analyzer 2012FF_hf1


2、配置步骤

(1)下载IK Analyzer分词包,解压缩

(2)将IKAnalyzer2012FF_u1.jar拷贝到solr服务的目录solr/WEB-INF/lib下

cp /usr/download/IK Analyzer 2012FF_hf1/IKAnalyzer2012FF_u1.jar

/usr/local/tomcat6/webapps/solr/WEB-INF/lib/

(3)将IKAnalyzer.cfg.xml、stopword.dic拷贝到的conf下面solr/example/solr/collection1/conf目录下(和schemal.xml同一目录)

(4)修改schema.xml,加入如下配置:

<fieldType

name="text_ik" class="solr.TextField">

<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>

</fieldType>

如上表示加入"text_ik"类型的分词器(即:IKAnalyzer)

最后配置field通过name使用text_ik分词

<field name="text_ik"      type="text_ik"  indexed="true"  stored="true"  multiValued="false" />


3、中文分词测试
Linux(CentOS 6.4)Solr4.8.1中文分词配置(IK分词)

注:以上图片上传到红联Linux系统教程频道中。


4、OK搞定!