es集群搭建

一、啰嗦几句:

Es是目前主流的开源搜索引擎之一,ES基于Lucene实现,同时实现了一套自己的选举调度机制,使用上也更加智能化,配置简单,Restfull接口,这都是它比较突出的特点。之前一直使用Solr,对Solr的一些机制都比较熟悉,新公司主要使用es,所以也想学习一下es,同时和Solr做一些对比,首先从安装开始。

二、Es和Solr的安装配置比较:

1 注册选举模块 : Solr的选举和注册主要是通过Zookeeper实现,而ES则是自己内部实现,相比较之下少了Zookeeper的部署和维护,同时也使得ES更加轻量化。
2 依赖的环境:之前一直用的Solr4版本,Solr4主要是依赖于外置web容器启动,像tomcat、jetty等,同时有些配置,例如SolrHome往往需要在web.xml中配置。Solr5好像改进了依赖,使用内置的jetty实现启动,由于对于Solr5研究太少,这里就不瞎说了。但是Es没有这种重度的依赖,以一种单独的组件形式存在,配置和维护都十分方便。
3 开源分词器的配置:主流的开源中文分词器主要有:IK、庖丁和ms4j等。Solr对于开源中文分词器的配置应该说比较繁琐,需要对Schema里面需要的字段进行配置,这也引出了另一个问题,Es的索引字段不像Solr那样的有规范性,Es的索引是无规则的,而且各个doc_type中所有的字段糅杂在索引里面,这一点我倒是感觉Solr做的很规范,但是Es做的很灵活。

三、ES的部署

通常的部署方式会是源码编译或者去官方下载编译好的包,附上es在github上托管的镜像:

https://github.com/elastic/elasticsearch

我选择的是在官方下载bin包,毕竟是玩玩,要是生产环境最好自己编译了,另外最新的Lucene和es已经只支持java8了,看样子又有一批人要当小白鼠了。

  1. 下载编译好的安装包,这里我选择ElasticSearch1.7版本的,因为1.7还是Lucene4内核的,不论版本,能满足场景就好,不一定最新的就是最适合的。
  2. 下载好之后解压,解压之后是这个样子的:
    Paste_Image.png
  • bin目录主要是各种启动命令
  • config主要存放配置文件
  • data则是该节点的索引存放目录
  • lib是es依赖的一些依赖包
  • logs是日志存放目录
  • plugins是es强大的插件系统
  1. 安装好之后我需要对es的配置做下修改,让他能达到集群的效果,进入config目录下,找到elasticsearch.yml,Vim it:
    可以看到配置项很多,但是我们关注的几个下面说明下:
Paste_Image.png
  • cluster.name标明了整个集群的名字,只有节点在相同的集群在能互相发现。
  • node.name 是当前节点名称的标识,各个节点的名称不能重复
    由于是单机搭建两个节点的集群,所以比较的端口号不能重复:
Paste_Image.png
  • network.host 指定为本机Ip,这点很重要,否则可能导致外部无法访问
  • transport.tcp.port 为节点间通信端口,如果部署在不同机器上则默认即可
  • http.port 同样是为了避免冲突 换成了9201
  1. head插件的安装:
    head是一个队es集群进行监控的插件,安装很简单,在有网络的环境下,执行:
    elasticsearch/bin/plugin -install mobz/elasticsearch-head
    如果下载失败,那悲催了只能手动安装,流程如下:
  • https://github.com/mobz/elasticsearch-head下载zip 解压
  • 建立elasticsearch-1.0.0\plugins\head_site文件
  • 将解压后的elasticsearch-head-master文件夹下的文件copy到_site
  1. 启动并测试使用
    在两个es节点的bin目录中分别启动,如果想用后台启动的方式,请使用nohup命令启动。
    启动之后访问http://10.0.3.67:9200/显示如下:
Paste_Image.png

同样访问http://10.0.3.67:9201/可以访问另一节点:

Paste_Image.png

单从表面上看我们看不出二者有什么关系,仅仅集群名相同而已,接下来我们建个索引试试,由于Es支持Restful接口,我们可以用curl去访问es:
$ curl -XPUT 'http://localhost:9200/twitter/tweet/1' -d '{ "user" : "tomcat","message" : "Hello Elasticsearch"}'
创建成功后我们访问head:

http://10.0.3.67:9200/_plugin/head/

Paste_Image.png

可以看到,我们成功的创建了一个twitter的节点,当然shard默认是5,我这里设置成了7
每一个绿色的小框框代表了一个shard,外面有黑色框框的代表主shard,没有的便是replication,横向的node对应了集群中每一个节点。至此简单的es集群就部署好了。

来源: https://www.jianshu.com/p/5250200a4624