在elasticsearch中簡單的使用script_fields

2023-01-31 15:01:19

1、背景

在我們使用es時,有些時候需要動態返回一些欄位,而這些欄位是通過動態計算得出的,那麼此時該如何操作呢? 比如:我們索引中有一個sex欄位,儲存的是1或0,而在頁面上需要展示,那麼這個時候就可以使用script_fields來解決。可能有些人說,我通過後臺進行格式化一下不就行了嗎,但是假設我們需要在kibana等視覺化工具上展示呢?

2、準備資料

2.1 mapping

PUT /index_script_fields
{
  "mappings": {
    "properties": {
      "name":{
        "type": "keyword"
      },
      "sex":{
        "type": "integer"
      },
      "hobbies":{
        "type":"keyword"
      },
      "address":{
        "properties": {
          "province":{
            "type":"keyword"
          },
          "city":{
            "type":"keyword"
          }
        }
      }
    }
  }
}

注意:

  1. hobbies其實是一個陣列型別
  2. address是一個Object型別,即是一個複雜型別

2.2 插入資料

PUT /index_script_fields/_bulk
{"index":{"_id":1}}
{"name":"張三","sex":1,"hobbies":["足球","籃球"],"address":{"province":"湖北","city":"city01"}}
{"index":{"_id":2}}
{"name":"張三","sex":2,"address":{"province":"北京","city":"city01"}}
{"index":{"_id":3}}
{"name":"張三","hobbies":["足球"],"address":{"province":"湖北","city":"city01"}}

注意:

  1. 需要注意一下id=3的資料是沒有sex屬性的,那麼在painless指令碼中如何保證不報錯。

3、案例

3.1 格式化性別 1-男 2-女 -1-未知 如果不存在sex欄位,則顯示-- 其餘的顯示 **

3.1.1 dsl

GET /index_script_fields/_search
{
  "query": {
    "match_all": {}
  },
  "_source": ["*"], 
  "script_fields": {
    "sex_format": {
      "script": {
        "lang": "painless",
        "source": """
          
          // 判斷 sex 欄位是否存在
          if(doc['sex'].size() == 0){
            return "--";
          }
        
          if(doc['sex'].value == 1){
            return "男";
          }else if(doc['sex'].value == 2){
            return "女";
          }else if(doc['sex'].value == -1){
            return "未知";
          }else{
            return "**";
          }
        """
      }
    }
  }
}

需要注意 sex 欄位不存在,該如何判斷,見上方的程式碼

3.1.2 java程式碼

@Test
@DisplayName("格式化性別 1-男 2-女 -1-未知 如果不存在sex欄位,則顯示-- 其餘的顯示 **")
public void test01() throws IOException {
    SearchRequest request = SearchRequest.of(searchRequest ->
            searchRequest.index(INDEX_NAME)
                    .query(query -> query.matchAll(matchAll -> matchAll))
                    // 不加這句,則 _source 不會返回,值返回 fields
                    .source(config -> config.filter(filter -> filter.includes("*")))
                    .scriptFields("sex_format", field ->
                            field.script(script ->
                                    script.inline(inline ->
                                            inline.lang(ScriptLanguage.Painless)
                                                    .source(" // 判斷 sex 欄位是否存在\n" +
                                                            "          if(doc['sex'].size() == 0){\n" +
                                                            "            return \"--\";\n" +
                                                            "          }\n" +
                                                            "        \n" +
                                                            "          if(doc['sex'].value == 1){\n" +
                                                            "            return \"男\";\n" +
                                                            "          }else if(doc['sex'].value == 2){\n" +
                                                            "            return \"女\";\n" +
                                                            "          }else if(doc['sex'].value == -1){\n" +
                                                            "            return \"未知\";\n" +
                                                            "          }else{\n" +
                                                            "            return \"**\";\n" +
                                                            "          }")
                                    )
                            )
                    )
                    .size(100)
    );

    System.out.println("request: " + request);
    SearchResponse<Object> response = client.search(request, Object.class);
    System.out.println("response: " + response);
}

3.1.3 執行結果

3.2 判斷使用者是否有某個愛好

3.2.1 dsl

GET /index_script_fields/_search
{
  "_source": ["*"], 
  "query": {"match_all": {}},
  "script_fields": {
    "has_hobby": {
      "script": {
        "lang": "painless",
        "source": """
          // 沒有hobbies欄位,直接返回 false
          if(doc['hobbies'].size() == 0){
            return false;
          }
          return doc['hobbies'].indexOf(params.hobby) > -1;
        """,
        "params": {
          "hobby":"籃球"
        }
      }
    }
  }
}

3.2.2 java程式碼

@Test
@DisplayName("判斷使用者是否有某個愛好")
public void test02() throws IOException {
    SearchRequest request = SearchRequest.of(searchRequest ->
            searchRequest.index(INDEX_NAME)
                    .query(query -> query.matchAll(matchAll -> matchAll))
                    // 不加這句,則 _source 不會返回,值返回 fields
                    .source(config -> config.filter(filter -> filter.includes("*")))
                    .scriptFields("has_hobby", field ->
                            field.script(script ->
                                    script.inline(inline ->
                                            inline.lang(ScriptLanguage.Painless)
                                                    .source(" // 沒有hobbies欄位,直接返回 false\n" +
                                                            "          if(doc['hobbies'].size() == 0){\n" +
                                                            "            return false;\n" +
                                                            "          }\n" +
                                                            "          return doc['hobbies'].indexOf(params.hobby) > -1;")
                                                    .params("hobby", JsonData.of("籃球"))
                                    )
                            )
                    )
                    .size(100)
    );

    System.out.println("request: " + request);
    SearchResponse<Object> response = client.search(request, Object.class);
    System.out.println("response: " + response);
}

3.2.3 執行結果

3.3 統計湖北的使用者有幾個

3.3.1 dsl

GET /index_script_fields/_search
{
  "query": {"match_all": {}}, 
  "aggs": {
    "agg_province": {
      "sum": {
        "script": {
          "lang": "painless",
          "source": """
            // 因為 address 是一個複雜型別,因此不可直接通過 doc 來存取
            if(params['_source']['address']['province'] == '湖北'){
              return 1;
            }
            return 0;
          """
        }
      }
    }
  }
}

因為 address 是一個複雜型別,因此不可直接通過 doc 來存取,只能通過 params[_source]來存取

3.3.2 java程式碼

@Test
@DisplayName("統計湖北省下的使用者有幾個")
public void test03() throws IOException {
    SearchRequest request = SearchRequest.of(searchRequest ->
            searchRequest.index(INDEX_NAME)
                    .query(query -> query.matchAll(matchAll -> matchAll))
                    // 不加這句,則 _source 不會返回,值返回 fields
                    .source(config -> config.filter(filter -> filter.includes("*")))
                    .aggregations("agg_province", agg->
                            agg.sum(sum ->
                                    sum.script(script ->
                                            script.inline(inline ->
                                                    inline.lang(ScriptLanguage.Painless)
                                                            // 因為 address 是一個複雜型別,因此不可直接通過 doc 來存取, 只可通過 params['_source']來存取
                                                            .source("// 因為 address 是一個複雜型別,因此不可直接通過 doc 來存取\n" +
                                                                    "            if(params['_source']['address']['province'] == '湖北'){\n" +
                                                                    "              return 1;\n" +
                                                                    "            }\n" +
                                                                    "            return 0;")
                                            )
                                    )
                            )
                    )
                    .size(100)
    );

    System.out.println("request: " + request);
    SearchResponse<Object> response = client.search(request, Object.class);
    System.out.println("response: " + response);
}

3.3.3 執行結果

![執行結果![](https://img-blog.csdnimg.cn/5910495ac0814db393125dae96934e38.png)

4、doc[..]和params[_source][..]有何不同

通過上面的案例,我們發現,我們有些時候是通過doc[..]來存取屬性的,有些時候是通過params['_source'][..]來存取,那麼這2種存取方式有何不同呢?

doc[..]:使用doc關鍵字,將導致該欄位的術語被載入到記憶體(快取),這將導致更快的執行,但更多的記憶體消耗。此外,doc[…]表示法只允許簡單的值欄位(您不能從中返回json物件),並且僅對非分析或基於單個術語的欄位有意義。然而,如果可能的話,使用doc仍然是存取檔案值的推薦方法。
params[_source][..]: 每次使用_source都必須載入和解析, 因此使用_source會相對而言要慢點。

雖然存取_source比存取doc values要慢,但是script_fields只對需要返回檔案執行指令碼,因此也不會太影響效能,除非返回的資料特別多。

5、完整程式碼

https://gitee.com/huan1993/spring-cloud-parent/blob/master/es/es8-api/src/main/java/com/huan/es8/script/ScriptFieldApi.java

6、參考檔案

1、https://www.elastic.co/guide/en/elasticsearch/reference/8.6/search-fields.html