Solr是一个高性能独立的企业级搜索应用服务器,基于Lucene的全文搜索服务器。本文介绍solr中分词的安装过程
http://download.csdn.net/detail/mysticality/4329741 是完整的安装包下载
- 先安装Tomcat 由于这次是在Mac下安装体验的,所以步骤比较简单
下载Tomcat 解压即可!
测试安装是否成功:
http://localhost:8080/
能看见Tomcat的欢迎界面,说明Tomcat安装成功,mac下这个没有问题。 - 安装solr
- 下载apache-solr-3.6.0.tgz,并解压
- 复制apache-solr-3.6.0(下载的安装包)/dist/apache-solr-3.6.0.war到 webapps目录下
- 修改Tomcat配置文件<tomcat home>/conf/server.xml,增加URIEncoding="UTF-8"选项
Xml代码
- <Connector port="8080" protocol="HTTP/1.1"
- connectionTimeout="20000"
- redirectPort="8443" URIEncoding="UTF-8"/>
- 创建配置文件<tomcat home>/conf/Catalina/localhost/apache-solr-3.6.0.xml
Xml代码
- <Context path="/apache-solr-3.6.0" >
- <Environment name="solr/home" type="java.lang.String" value="/Volumes/Date/apache-tomcat-7.0.27/webapps/apache-solr-3.6.0/home" override="true" />
- </Context>
solr/home的值设置为存放索引的根路径;
将apache-solr-3.6.0(下载的安装包)/example/solr 下的文件复制到“/Volumes/Date/apache-tomcat-7.0.27/webapps/apache-solr-3.6.0/home”目录下
启动Tomcat,在浏览器中输入http://localhost:8080/apache-solr-3.6.0/admin看到如下页面,则说明安装成功
- 建索引
转到apache-solr-3.6.0(下载的安装包)\example\exampledoc\目录下执行下面代码
*.xml参照目录里的vidcard.xml
Shell代码
java -Durl=http://localhost:8080/apache-solr-3.6.0/update -Dcommit=yes -jar post.jar *.xml
索引在/Volumes/Date/apache-tomcat-7.0.27/webapps/apache-solr-3.6.0/home/data文件夹里
- 测试搜索
在admin界面输入TIP,点击search按钮就可以看到输出结果页面
总结:
配置的目的是指定目录和关键文件的位置
1. solr/home指定 solr配置文件的文件夹
2. solr/home目录下要有conf/目录,启动时会加载solrconfig.xml文件,否则启动会失败
配置中文分词 IKAnalyzer3.2.8
将IKAnalyzer的jar包导入刚生成的项目中“/Volumes/Date/apache-tomcat-7.0.27/webapps/apache-solr-3.6.0/home/lib”lib目录下,并修改其下“/Volumes/Date/apache-tomcat-7.0.27/webapps/apache-solr-3.6.0/home/conf/schema.xml”
加入下面代码:
<fieldType name="text_cn" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
useSmart="false" />
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
useSmart="false" />
</analyzer>
</fieldType>
<field name="text_cn" type="text_cn" indexed="true" stored="true" required="true" />
10.http://localhost:8080/solr/admin/analysis.jsp下测试分词效果
在 Field 的下拉菜单选择type,然后在应用输入text_cn。分词的结果,如下图: