Elasticsearch:使用算术运算的临时 Runtime field

本文介绍了如何在ElasticStack 7.11及以上版本中使用Painless的Math库创建Runtimefield,实现实时数据转换,提升查询效率。通过实例展示了如何转换字段单位并应用范围查询,以及Runtimefield与常规字段的交互使用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Runtime fields 在实际的数据查询中非常有用。它的设计最初的理念就是代替之前的 Scripted fields。在很多时候,我们一开始可能还没有想到需要哪些字段来对数据进行分析。有的时候,我们需要的字段可能是由其它的字段来生产的。我们可以使用 Math 库来动态地生成一些我们需要的临时字段。这些字段可以帮助我们对数据做更进一步的分析。

在今天的教程中,我将使用 Painless 的 Math 库来生产一个 Runtime field。在使用中,我们需要注意的一点是:Runtime field 是从 Elastic Stack 7.11 开始支持的。

准备数据

我们使用 Kibana 自动的索引:

 

这样我们就导入了一个叫做 kibana_sample_data_logs 的索引。

创建 Runtime field

 我们先在 Kibana 中做如下的搜索:

GET kibana_sample_data_logs/_search

我们可以看到一个叫做 machine 的字段。其中的 ram 子字段的值为 8589934592。它是以字节的形式来表示的。我们在查询时候,有时感觉使用字节不是很方便,那么我们想生成一个 Runtime field 来转换为 GB 格式的。这样更容易进行搜索。

我们首先使用如下的命令来搜索:

GET kibana_sample_data_logs/_search
{
  "runtime_mappings": {
    "ram_floor_gb": {
      "type": "long",
      "script": {
        "source": "emit(Math.floor(doc['machine.ram'].value /1024/1024/1024).longValue())"
      }
    }
  },
  "fields": [
    "ram_floor_gb",
    "machine.ram"
  ]
}

在上面,我们定义了一个叫做 ram_floor_gb 的 Runtime field。它的用法基本和 Scripted fields 非常相似。那么搜索的结果是:

从上面的显示中,我们可以看出来多了一个叫做 ram_floor_gb 的字段。它的值是 8,也就是 8GB。

有了上面的了解,我们可以使用这 Runtime fields 来做一些搜索:

GET kibana_sample_data_logs/_search
{
  "runtime_mappings": {
    "ram_floor_gb": {
      "type": "long",
      "script": {
        "source": "emit(Math.floor(doc['machine.ram'].value /1024/1024/1024).longValue())"
      }
    }
  },
  "fields": [
    "ram_floor_gb",
    "machine.ram"
  ],
  "_source": false,
  "query": {
    "range": {
      "ram_floor_gb": {
        "gte": 0,
        "lte": 40
      }
    }
  }
}

上面的搜索将返回 ram_floor_gb 大于 0 且小于 40 GB 的所有文档。

我们也可以做如下的搜索:

GET kibana_sample_data_logs/_search
{
  "runtime_mappings": {
    "ram_floor_gb": {
      "type": "long",
      "script": {
        "source": "emit(Math.floor(doc['machine.ram'].value /1024/1024/1024).longValue())"
      }
    }
  },
  "fields": [
    "ram_floor_gb",
    "timestamp"
  ],
  "_source": false,
  "query": {
    "bool": {
      "must": [
        {
          "range": {
            "timestamp": {
              "gt": "2022-01-01"
            }
          }
        },
        {
          "range": {
            "ram_floor_gb": {
              "gte": 4,
              "lte": 20
            }
          }
        }
      ]
    }
  }
}

在我们搜索的时候,我们看出来:runtime field 和正常的字段一样进行使用。当然如果我们觉得这个字段 ram_floor_gb 是非常必要的,我们可以在数据摄入时通过 pipeline 的方法进行添加,这样我们就可以不再使用 Runtime fields 了。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值