让Elasticsearch集群冷热分离、读写分离【转】

  • Post author:
  • Post category:其他


转自:https://blog.csdn.net/jiao_fuyou/article/details/50511255

根据Elasticsearch中文社区

《ES冷热分离(读写分离) hot, stale 场景》

一篇整理的。



一、冷热分离



二、读写分离

  • 即使这样处理后,hot集群即使只有一两数据,但是一般象log类数据,查询的一般都是最近一两天的数据,致使hot集群负载依然很大。es有没有办法实现像mysql主从的效果,然后查询只在从机上查询?有没有办法让副本分布在某些特定节点上,然后查询只查询这些节点?
  • 按《

    elasticsearch高级配置之分片分布规则设置

    》中(强制分布规则)来设置,迫使不允许副本被分配到与主分片相同的区域,比如:让副本数据分布到stale集群上。
  • 上面的规则有时并不能完全的控制复本一定在某个集群上,它只能尽量保证主分片和副本不在一个集群上,这个时候同样也可以起个定时任务,手动的将副本reroute到集群节点上

    POST /_cluster/reroute
    {
        "commands" : [ {
            "move" :
                {
                  "index" : "test", "shard" : 0, "from_node" : "node1", "to_node" : "node2" } }, { "allocate" : { "index" : "test", "shard" : 1, "node" : "node3" } } ] }
  • 详细情况参考:

  • https://www.elastic.co/guide/en/elasticsearch/reference/2.1/modules-cluster.html



    https://www.elastic.co/guide/en/elasticsearch/reference/2.1/cluster-reroute.html



三、查询选项



四、总结

    1. 已经不再indexing的索引,通过require.zone的方式迁移到stale集群上,完成冷热分离;
    2. 还在indexing的索引,通过reroute将replica shard强制allocate到stale集群上;
    3. search的时候,通过?preference=_replica或者?preference=_only_nodes:xxx的方式指定读取哪些。
    4. 但是需要注意一点的是:因为es的replica也是一个实际需要cpu和io的indexing过程,而且indexing本身也有要求要写够一定副本数来才算写入完成。所以,你即使只请求replica,也是有可能影响到写入的。

      所以,你只能开启一个副本——写入副本数要求是从二个副本开始才有。

转载于:https://www.cnblogs.com/seaspring/p/9262167.html