es在已有历史数据的文档新增加字段操作

mikelv01

于 2025-05-19 13:39:20 发布

阅读量560

点赞数 8

文章标签： elasticsearch 搜索引擎

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mikelv01/article/details/148061707

版权

新增字段设置默认值

场景

在已经有大量数据的索引文档上，增加新字段

技术实现

一.更新索引映射

通过PUT请求显式定义新字段类型，确保后续写入的文档能被正确解析

PUT /文档名/_mapping
{
  "properties": {
    "字段名1": {
      "type": ""
    },
    "字段名2": {
      "type": ""
    }
  }
}

此操作仅定义字段类型，不会自动填充历史文档的默认值

二.设置默认值

1.写入时自动填充（新文档）

通过 Ingest Pipeline 在文档写入前自动添加默认值, 此操作仅对新写入数据生效

PUT _ingest/pipeline/set_defaults
{
  "processors": [
    {
      "set": { 
        "field": "like", 
        "value": 0 
      }
    },
    {
      "set": { 
        "field": "disagree", 
        "value": 0 
      }
    }
  ]
}

PUT /文档名/_settings
{
  "index.default_pipeline": "set_defaults"
}

动态判断

"script": {
  "source": """
    if (!ctx.containsKey('like')) { ctx.like = 0 }
    if (!ctx.containsKey('disagree')) { ctx.disagree = 0 }
  """
}

2.批量回填历史数据（旧文档）

使用 _update_by_query API 批量更新已有文档

POST /service_bot_msg_chat_log/_update_by_query
{
  "script": {
    "source": """
      if (ctx._source.like == null) { ctx._source.like = 0 }
      if (ctx._source.disagree == null) { ctx._source.disagree = 0 }
    """,
    "lang": "painless"
  },
  "query": {
    "bool": {
      "must_not": [
        { "exists": { "field": "like" } },
        { "exists": { "field": "disagree" } }
      ]
    }
  },
  "timeout": "10m",  // 防止超时
  "slices": 5        // 并行分片加速处理
}

性能优化
- 异步执行：添加 ?wait_for_completion=false 转为后台任务

操作建议

新数据优先：优先配置 Ingest Pipeline，确保增量数据自动初始化
历史数据分治：根据数据量选择 _update_by_query（百万级）或 Reindex（亿级）

博客等级

码龄5年

110
原创

180
点赞

424
收藏

99
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: kibana重建es索引

最新评论

记一次Intellij的误操作(update projects)
mikelv01: 老板送个小小的赞不过分吧
记一次Intellij的误操作(update projects)
weixin_51522415: 感谢大佬救我狗命
Spring JPA之Specification复杂查询
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
sql中in()方法查询参数过多处理小记
逃逸的卡路里: 博主的这篇文章对于SQL中in()方法查询参数过多的处理问题进行了详细的讲解，让我对这个主题有了全新的认识。博主的细节描写非常到位，显示出了博主深厚的专业功底。我期待着博主未来能够持续分享更多类似的好文，同时也希望能够得到博主的指导，共同进步。非常感谢博主的分享和支持，让我受益匪浅！
基于Centos7搭建Minio集群
lingduyelang: 分布式Minio使用的磁盘里必须是干净的，里面没有数据。这个是真的，一定要保证这一点。不然的话会报错，例如： Drive http://10.232.25.112:9000/data/minio/data1 returned an unexpected error: major: 253: minor: 0: drive is part of root drive, will not be used, please investigate - drive will be offline (*fmt.wrapError) 11: internal/logger/logonce.go:118:logger.(*logOnceType).logOnceIf() 10: internal/logger/logonce.go:149:logger.LogOnceIf() 9: cmd/logging.go:164:cmd.storageLogOnceIf() 8: cmd/storage-rest-server.go:1243:cmd.logFatalErrs() 7: cmd/storage-rest-server.go:1408:cmd.registerStorageRESTHandlers.func2() 6: cmd/storage-rest-server.go:1424:cmd.registerStorageRESTHandlers() 5: cmd/routers.go:35:cmd.registerDistErasureRouters() 4: cmd/routers.go:91:cmd.configureServerHandler() 3: cmd/server-main.go:869:cmd.serverMain.func9() 2: cmd/server-main.go:561:cmd.bootstrapTrace() 1: cmd/server-main.go:868:cmd.serverMain()

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。