为了账号安全,请及时绑定邮箱和手机立即绑定

Elasticsearch中Script脚本执行除法遇到的问题

标签:
Java Python

最近有一个需求,需要修改ES文档中的金额,以前是以为单位,现在要换算成以万元为单位,但并不是所有数据都需要做处理,有一个Excel存储着不需要处理的数据。我第一时间想到的就是用Python写一个脚本处理ES文档,噼里啪啦一顿操作之后,基本就实现了该功能。但是处理的结果并不是预期的那样。下面我简单的举一个例子来复现一下我所遇到的问题。

首先,创建一个索引test,

# 创建test索引
PUT test

给索引设置mapping属性,

# 设置索引mapping属性
PUT test/_mapping
{
  "properties": {
    "id": {"type": "keyword"},
    "money": {"type": "double"}
  }
}

给索引添加几条测试文档数据,

# 批量插入数据
POST _bulk
{"index": {"_index": "test"}}
{"id":"1", "money": 23423123}
{"index": {"_index": "test"}}
{"id":"2","money": 1233656}
{"index": {"_index": "test"}}
{"id":"3", "money":899234}

既然要更新文档数据,肯定要用到ES的_update_by_queryAPI。我们现在将每个文档的money值除以10000,先自己考虑一下应该会得到一个什么样的结果。

# 更新操作,将每个文档的money除以10000
POST test/_update_by_query
{
  "script": {
    "source": "ctx._source.money=ctx._source.money/10000",
    "lang": "painless"
  },
  "query": {
    "match_all": {}
  }
}

有结果了吗?我们来看看ES给我们处理后的结果是啥样的,

# 查看文档
GET test/_search

# 结果
{
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 3,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "test",
        "_type" : "_doc",
        "_id" : "LtrDs3MBvTJiRW6OWDLQ",
        "_score" : 1.0,
        "_source" : {
          "money" : 2342,
          "id" : "1"
        }
      },
      {
        "_index" : "test",
        "_type" : "_doc",
        "_id" : "MNrDs3MBvTJiRW6OYTJx",
        "_score" : 1.0,
        "_source" : {
          "money" : 123,
          "id" : "2"
        }
      },
      {
        "_index" : "test",
        "_type" : "_doc",
        "_id" : "MtrDs3MBvTJiRW6OaTLM",
        "_score" : 1.0,
        "_source" : {
          "money" : 89,
          "id" : "3"
        }
      }
    ]
  }
}

很明显更新后的结果去掉了小数点后面的数,这并不是我想要的。这是怎么回事呢?经过查找很多的资料,最终在官方文档里找到这么一句话:

Use the division operator '/' to DIVIDE one numeric type value by another. Rules for NaN values and division by zero follow the JVM specification. Division with integer values drops the remainder of the resultant value.

最后一句话的意思很明了,“整数相除会丢弃结果值的余数部分”。既然整数会有这种情况,那么我将10000 换成10000.0再来试试,

# 更新操作,将每个文档的money除以10000.0
POST test/_update_by_query
{
  "script": {
    "source": "ctx._source.money=ctx._source.money/10000.0",
    "lang": "painless"
  },
  "query": {
    "match_all": {}
  }
}

这次的更新结果如下,

{
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 3,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "test",
        "_type" : "_doc",
        "_id" : "Ptq5s3MBvTJiRW6OoTEW",
        "_score" : 1.0,
        "_source" : {
          "money" : 2342.3123,
          "id" : "1"
        }
      },
      {
        "_index" : "test",
        "_type" : "_doc",
        "_id" : "QNq5s3MBvTJiRW6OpzFr",
        "_score" : 1.0,
        "_source" : {
          "money" : 123.3656,
          "id" : "2"
        }
      },
      {
        "_index" : "test",
        "_type" : "_doc",
        "_id" : "Qdq5s3MBvTJiRW6OrjEB",
        "_score" : 1.0,
        "_source" : {
          "money" : 89.9234,
          "id" : "3"
        }
      }
    ]
  }
}

这才是想要的结果。从整体的实现来看,虽然功能很简单,但是一些细节的地方处理不到位,很可能就耽误你很多的时间。用这时间来摸鱼,它不香吗。

注:Elasticsearch版本是7.8.0,以上操作都是通过kibana执行的。


获取最新文章,可关注博客地址:https://jenkinwang.github.io/

点击查看更多内容
2人点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
JAVA开发工程师
手记
粉丝
7
获赞与收藏
16

关注作者,订阅最新文章

阅读免费教程

感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消