资讯专栏INFORMATION COLUMN

ElasticSearch索引跨集群迁移

不知名网友 / 2296人阅读
ElasticSearch索引跨集群迁移

点击上方“IT那活儿”公众号,关注后了解更多内容,不管IT什么活儿,干就完了!!!

单索引跨集群迁移:_reindex方式

_reindex方式可将索引数据直接从源ES集群导入到新ES集群。
1. 集群环境
源ES集群地址:xxx.x.xxx.65:9201
新ES集群地址:xxx.x.xxx.214:9201
2. 迁移目标
将索引shsnc-crm_tpt_tj_dtfjzl_data迁移至新ES集群,索引中包含10个文档。
3. 新ES集群添加白名单并重启
1)在新ES集群添加白名单允许源集群reindex
2)添加白名单后重启新ES集群
jps|grep -i elasticsearch|awk {print $1}|xargs kill –-停止新ES集群各节点
./elasticsearch -d --启动新ES集群各节点
4. 创建索引并设置mapping
1)从源ES集群中导出索引模板template_ shsnc-crm_tpt_tj _dtfjzl_data
curl -u xxx.x.xxx.65:9201/_template/template_ shsnc-crm_tpt_tj* >> template.txt
2)在新ES集群中导入索引模板template_ shsnc-crm_tpt_tj _dtfjzl_data
curl -H "Content-Type: application/json"
-XPUT http://xxx.x.XXX.214:9201/_template/template_shsnc-
crm_tpt_tj_dtfjzl_data -d{"order": 0, "index_patterns":
["shsnc-crm_tpt_tj_dtfjzl_data"], "settings": {"index":
{"number_of_shards": "1", "number_of_replicas": "0"}},
"mappings": {"_doc":{"dynamic": false, "properties":
{"appname": {"ignore_above": 10000, "type": "keyword"},
"createTime": {"format": "yyyy-MM-dd HH:mm:ss.SSS", "type": "date"}, "raw_message": {"analyzer": "ik_smart", "type":
"text"}, "startLine": {"ignore_above": 10000, "type":
"keyword"}, "op_time": {"format": "yyyy-MM-dd HH:mm:ss", "type": "date"}, "COUNT": {"ignore_above": 10000, "type":
"keyword"}, "cmdb_id": {"ignore_above": 10000, "type":
"keyword"}, "agentip": {"ignore_above": 10000, "type":
"keyword"}}}}, "aliases": {}}



5. 从源ES集群中reindex数据到新ES集群
注:为确保数据的完整性源ES集群需停止数据写入。
1)在新ES集群上运行如下命令
curl -H Content-Type: application/json
-XPOST "http://xxx.x.xxx.214:9201/_reindex?pretty" -d {
"source": {
"remote": {"host": "http://xxx.x.xxx.65:9201"},
"username": "xxxxxx", --username、password若有则指定,若无则去掉此项
"password": "xxxxxx",
"index": "shsnc-crm_tpt_tj_dtfjzl_data",
"type": "_doc"},
"dest": {"index": "shsnc-crm_tpt_tj_dtfjzl_data"}}
2)执行以上命令后,索引shsnc-crm_tpt_tj_dtfjzl_data的10个文档数据成功导入到新ES集群

全部索引跨集群迁移:_snapshot方式

_snapshot是Elasticsearch提供的用于对数据进行备份和恢复的接口,即从源ES集群创建数据快照,再将快照复制到目标集群进行恢复。
1. 集群环境
源ES集群地址:xxx.x.xxx.65:9201
新ES集群地址:xxx.x.xxx.20:9201
2. 迁移目标
将源ES集群全部索引迁移至新ES集群,主要是红色框中的4个索引。
3. 在源集群中创建repository和snapshot
1)快照文件存放repositor仓库中,一个repositor仓库可以存放多个快照文件,repository支持多种类型,此处以fs类型来创建repository仓库,即将快照文件存放在文件系统中。
如下,在源ES集群的Elasticsearch.yml配置文件中设置repository路径,提前创建“/home/elk/es-repo-test”目录,添加配置后需要重启源ES集群。
2)创建repository
curl -H Content-Type: application/json
-XPUT http://xxx.x.xxx.65:9201/_snapshot/my_backup -d {
"type": "fs",
"settings": {
"location": "/home/elk/es-repo-test",
"compress": true,
"max_snapshot_bytes_per_sec":"20mb",
"max_restore_bytes_per_sec":"20mb"}}

注:

  • max_snapshot_bytes_per_se:快照数据进入仓库时,限流每秒20mb;
  • max_restore_bytes_per_sec:从仓库恢复数据时,限流每秒20mb。
3)创建snapshot,快照名称需小写,否则报错(version:6.4.0)
Curl -H Content-Type: application/json -XPUT
http://xxx.x.xxx.65:9201/_snapshot/my_backup/es-snapshot-1?wait_for_completion=true
进入快照存放的目录,查看快照文件:
4. 在新集群中创建repository,并复制源集群中的snapshot文件
1)在新集群的elasticsearch.yml配置文件中设置repository路径,提前创建“/home/elk/es-repo-test”目录,添加配置后需要重启新ES集群
2)在新集群中创建repostory
curl -H Content-Type: application/json
-XPUT http://xxx.x.xxx.20:9201/_snapshot/my_backup -d {
"type": "fs",
"settings": {
"location": "/home/elk/es-repo-test",
"compress": true,
"max_snapshot_bytes_per_sec":"20mb",
"max_restore_bytes_per_sec":"20mb"}}
3)复制源集群中的snapshot文件到新集群
4. 在新集群中通过快照文件恢复索引
1)从源集群导入索引模板到目标集群
2)在新集群中恢复索引
curl -XPOST http://xxx.x.xxx.20:9201/_snapshot/my_backup/es-snapshot-1/_restore
3)新集群中查看索引恢复的状态
附:提升数据同步的技巧
1)默认情况下reindex使用1000进行批量操作,可在source中修改size以提升批量写入。
2)针对数据量比较大的索引,可以在迁移前将目标索引的副本数设置为0,刷新时间为-1(-1为不刷新),可加快数据同步速度,数据迁移完成后再改回。
3)reindex支持使用sliced scroll功能以提升数据写入的效率,sliced scroll以并行化来重建索引,每个scroll 请求可以分解成多个slice请求,各个slice对立并行运行,写入效率要快很多倍
Slices可手动设置(slices=3),也可自动设置(slices=auto)。设置为auto时,对于单索引,slices等于分片数;针对多索引,slices等于分片的最小值。Slices等于分片数时,查询性能最高效;slices大于分片数时,不仅不会提升效率,反而会增加额外的开销。


本文作者:方 威(上海新炬中北团队)

本文来源:“IT那活儿”公众号

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/129098.html

相关文章

  • 滴滴 Elasticsearch集群架构实践

    出品 | 滴滴技术作者 |魏子珺 Elasticsearch 是基于 Lucene 实现的分布式搜索引擎,提供了海量数据实时检索和分析能力。Elastic 公司开源的一系列产品组成的Elastic Stack,可以为日志服务、搜索引擎、系统监控等提供简单、易用的...

    zengdongbao 评论0 收藏0
  • Elasticsearch snapshot 备份的使用方法

    ...启新的实例,然后通过备份来恢复数据减少损失。虽然 Elasticsearch 有良好的容灾性,但由于以下原因,其依然需要备份机制。 数据灾备。在整个集群无法正常工作时,可以及时从备份中恢复数据。 归档数据。随着数据的积累,...

    Binguner 评论0 收藏0
  • Elasticsearch 参考指南(升级前重新索引

    升级前重新索引 Elasticsearch可以读取上一个主要版本中创建的索引,旧的索引必须重新索引或删除。Elasticsearch 6.x可以使用Elasticsearch 5.x中创建的索引,但不能使用Elasticsearch 2.x或之前创建的索引Elasticsearch 5.x可以使用Elasticsea...

    546669204 评论0 收藏0
  • 400+节点的 Elasticsearch 集群运维

    ...数据的存储和检索技术。 从0.11.X 版本开始我们就已经是Elasticsearch的忠实用户了。在经历了一些波折之后,最终我们认为做出了正确的技术选型。 Elasticsearch 用于支持我们的主要媒体监控应用,客户通过该应用可以检索和分析媒...

    aikin 评论0 收藏0
  • 让我们ElasticSearch作伴,一起潇洒复习~

    ...办袋鼠云、阿里云、有赞、滴滴的技术大牛倾囊相授~ “ElasticSearch运维技术实践”精彩上演! Now,温故而知新,一起来回顾吧~ 干货来啦,别带着它入睡,赶紧拿小本本记下来吧! 解 惑 篇 在此本萌特别精编了一辑本场沙龙现...

    tomato 评论0 收藏0

发表评论

0条评论

不知名网友

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<