Linux下Solr3.6的IKAnalyze中文分词安装部署

Solr是一个高性能独立的企业级搜索应用服务器,基于Lucene的全文搜索服务器。本文介绍solr中分词的安装过程

 

http://download.csdn.net/detail/mysticality/4329741 是完整的安装包下载

 

  1. 先安装Tomcat 由于这次是在Mac下安装体验的,所以步骤比较简单
    下载Tomcat 解压即可!
    测试安装是否成功:
    http://localhost:8080/
    能看见Tomcat的欢迎界面,说明Tomcat安装成功,mac下这个没有问题。
  2. 安装solr
  • 下载apache-solr-3.6.0.tgz,并解压
  • 复制apache-solr-3.6.0(下载的安装包)/dist/apache-solr-3.6.0.warwebapps目录下
  • 修改Tomcat配置文件<tomcat home>/conf/server.xml,增加URIEncoding="UTF-8"选项

Xml代码

  1. <Connector port="8080" protocol="HTTP/1.1"
  2. connectionTimeout="20000"
  3. redirectPort="8443" URIEncoding="UTF-8"/>
  • 创建配置文件<tomcat home>/conf/Catalina/localhost/apache-solr-3.6.0.xml

  • Xml
    代码
  1. <Context path="/apache-solr-3.6.0" >
  2. <Environment name="solr/home" type="java.lang.String" value="/Volumes/Date/apache-tomcat-7.0.27/webapps/apache-solr-3.6.0/home" override="true" />
  3. </Context>


solr/home
的值设置为存放索引的根路径;
apache-solr-3.6.0(下载的安装包)/example/solr 下的文件复制到“/Volumes/Date/apache-tomcat-7.0.27/webapps/apache-solr-3.6.0/home目录下

 

启动Tomcat,在浏览器中输入http://localhost:8080/apache-solr-3.6.0/admin看到如下页面,则说明安装成功

 

 

 

  1. 建索引

转到apache-solr-3.6.0(下载的安装包)\example\exampledoc\目录下执行下面代码

 

*.xml参照目录里的vidcard.xml

Shell代码 收藏代码

java -Durl=http://localhost:8080/apache-solr-3.6.0/update -Dcommit=yes -jar post.jar *.xml

索引在/Volumes/Date/apache-tomcat-7.0.27/webapps/apache-solr-3.6.0/home/data文件夹里

 

  1. 测试搜索
    admin界面输入TIP,点击search按钮就可以看到输出结果页面

 

 


总结:
配置的目的是指定目录和关键文件的位置

1. solr/home指定 solr配置文件的文件夹
2. solr/home
目录下要有conf/目录,启动时会加载solrconfig.xml文件,否则启动会失败

 

 

配置中文分词 IKAnalyzer3.2.8

 

IKAnalyzerjar包导入刚生成的项目中/Volumes/Date/apache-tomcat-7.0.27/webapps/apache-solr-3.6.0/home/liblib目录下,并修改其下/Volumes/Date/apache-tomcat-7.0.27/webapps/apache-solr-3.6.0/home/conf/schema.xml

 

加入下面代码:

 

 

<fieldType name="text_cn" class="solr.TextField">

<analyzer type="index">

<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"

useSmart="false" />

</analyzer>

<analyzer type="query">

<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"

useSmart="false" />

</analyzer>

</fieldType>

 

<field name="text_cn" type="text_cn" indexed="true" stored="true" required="true" />

 

 

 


10.http://localhost:8080/solr/admin/analysis.jsp
下测试分词效果

Field 的下拉菜单选择type,然后在应用输入text_cn。分词的结果,如下图:

 

发表评论