solr的一些查询语法

Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。
Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。
1. . 首先假设我的数据里fields有:name, tel, address 预设的搜寻是name这个字段, 如果要搜寻的数据刚好就是 name 这个字段,就不需要指定搜寻字段名称.

2. 查询规则:
如欲查询特定字段(非预设字段),请在查询词前加上该字段名称加 “:” (不包含”号) 符号,
例如: address:北京市海淀区上地软件园 tel:88xxxxx1
1)  q代表query input
2) version代表solr版本(建议不要变动此变量)
3) start代表显示结果从哪一笔结果资料开始,预设为0代表第一笔, rows是说要显示几笔数据,预设为10笔
(因为有时查询结果可能有几百笔,但不需要显示所有结果,所以预设是从第一笔开始到第十笔)
所以若要显示第10到30笔就改为:http://localhost:8080/solr/select/?indent=on&version=2.2&q=address:北京 市海淀区上地软件园+tel:88xxxxx1
&version=2.2&start=10&rows=20&indent=on
(indent代表输出的xml要不要缩行.预设为开启 on)

 

3. 另外,要限定输出结果的内容可用“fl=” 加上你要的字段名称,如以下这个范例:

http://localhost:8080/solr/select/?indent=on&version=2.2&q=text:北京+OR+text:亿度&start=0&rows=10&fl=name,address,tel

在fl=之后加上了name,adress,tel
所以结果会如下:
<result name=”response” numFound=”1340″ start=”0″>
<doc>
<str name=”name”>北京亿度</str>
<str name=”address”>北京市海淀区上地软件园</str>  <str name=”tel”>88xxxxxx1</str>
</doc>
<doc>
<str name=”name”>北京亿度</str>  <str name=”address”/>
<str name=”tel”>88xxxxxx1</str>  </doc>
</result>

4.查询 name 或 address:直接输入查询词, 如: 亿度    送出的内容即为:
name:亿度 AND address:海淀

5.若要搜寻联集结果,请在词与词间空格或加上大写 “OR” (不包含”号).
例如: text:海淀 OR text:亿度    text:海淀 OR 亿度     或    海淀 亿度    或
name:亿度 OR tel:88xxxxxx1    或
name:亿度 tel:88xxxxxx1

6.若要搜寻交集结果,请在词与词间加上大写 “AND” 或 “+” (不包含”号).
例如: text:海淀 AND 亿度     或
+text:海淀 +text:亿度

name:亿度 AND tel:88xxxxxx1

name: ( +亿度 +海淀)

7. 排除查询
在要排除的词前加上 “-” (不包含”号) 号    例如: 海淀 -亿度
搜寻结果不会有包含亿度的词的结果在内

 

8. Group 搜寻
使用 “()”来包含一个group如希望搜寻在店名字段内同时有 “台北”(不包含”号) 及 “火车站”(不包含”号)

 

9.增加权重: 如要搜寻 “北京 加油站”(不包含”号) 但因为回传太多笔资料内有 “中华”(不包含”号) 或 “加油站”(不包含”号) 的结果,所以想要把有包含 “加油站”(不包含”号)的数据往前排,可使用 “^”(不包含”号)符号在后面加上愈增加的权重数,像是 “2″,则可以这样做:北京 加油站^2
会同时搜寻含有北京或加油站的结果,并把加油站这个词加权所以搜寻时会先判断加油站这一个词在
搜寻结果中的比重,甚至假设一笔数据内加油站出现过两次以上的就更加会有优先权.
查询时在查询词后加上 “^” (不包含”号) 再加上权重分数    例如: 亿度 AND “北京”^2    或
亿度^2 OR 北京

 

 

10.Wildcard 搜寻使用 “*” 符号; 如果输入 “中国*银” (不包含”号), 结果会有中国信托商业银行, 中国输出入银行图书阅览室, 中国商银证券    中国及银之间可夹任何长短字词.

发表评论