部分词分词器与基于词的分词器 Elasticsearch
创始人
2024-12-24 02:00:58
0

部分词分词器与基于词的分词器 Elasticsearch 是一种文本分析工具,用于将输入文本分解成离散的词语或标记。下面是一个使用部分词分词器和基于词的分词器的示例代码:

  1. 部分词分词器(ngram tokenizer)示例:
PUT my_index
{
  "settings": {
    "analysis": {
      "analyzer": {
        "my_partial_word_analyzer": {
          "tokenizer": "my_ngram_tokenizer"
        }
      },
      "tokenizer": {
        "my_ngram_tokenizer": {
          "type": "ngram",
          "min_gram": 2,
          "max_gram": 5,
          "token_chars": [
            "letter",
            "digit"
          ]
        }
      }
    }
  }
}

GET my_index/_analyze
{
  "analyzer": "my_partial_word_analyzer",
  "text": "Elasticsearch"
}

上述代码将会使用 ngram 分词器将 "Elasticsearch" 分解成部分词,输出结果如下:

{
  "tokens": [
    {
      "token": "El",
      "start_offset": 0,
      "end_offset": 2,
      "type": "word",
      "position": 0
    },
    {
      "token": "las",
      "start_offset": 1,
      "end_offset": 4,
      "type": "word",
      "position": 1
    },
    {
      "token": "ast",
      "start_offset": 2,
      "end_offset": 5,
      "type": "word",
      "position": 2
    },
    {
      "token": "sti",
      "start_offset": 3,
      "end_offset": 6,
      "type": "word",
      "position": 3
    },
    {
      "token": "tic",
      "start_offset": 4,
      "end_offset": 7,
      "type": "word",
      "position": 4
    },
    {
      "token": "ticsearch",
      "start_offset": 5,
      "end_offset": 15,
      "type": "word",
      "position": 5
    }
  ]
}
  1. 基于词的分词器(standard tokenizer)示例:
PUT my_index
{
  "settings": {
    "analysis": {
      "analyzer": {
        "my_word_based_analyzer": {
          "tokenizer": "my_standard_tokenizer"
        }
      },
      "tokenizer": {
        "my_standard_tokenizer": {
          "type": "standard"
        }
      }
    }
  }
}

GET my_index/_analyze
{
  "analyzer": "my_word_based_analyzer",
  "text": "Elasticsearch"
}

上述代码将会使用基于词的分词器将 "Elasticsearch" 分解成独立的词语,输出结果如下:

{
  "tokens": [
    {
      "token": "Elasticsearch",
      "start_offset": 0,
      "end_offset": 13,
      "type": "",
      "position": 0
    }
  ]
}

这是一个简单的示例,你可以根据自己的需求进行配置和扩展。

相关内容

热门资讯

透视安卓版!德普之星辅助器ap... 透视安卓版!德普之星辅助器app(透视)透视(确实是真的有挂);1、每一步都需要思考,不同水平的挑战...
透视私人局!aapoker辅助... 透视私人局!aapoker辅助器是真的吗(透视)ai插件(原来是有挂)1、打开软件启动之后找到中间准...
透视线上!德普之星透视免费(透... 透视线上!德普之星透视免费(透视)辅助器app(真是是有挂);进入游戏-大厅左侧-新手福利-激活码辅...
透视透视!aapoker辅助怎... 透视透视!aapoker辅助怎么用(透视)透视脚本入口(本来真的是有挂)1、完成aapoker辅助怎...
透视讲解!德普之星app安卓版... 透视讲解!德普之星app安卓版破解版(透视)辅助软件(果然存在有挂)1、下载好德普之星app安卓版破...
透视智能ai!aapoker怎... 透视智能ai!aapoker怎么选牌(透视)插件下载(确实是有挂);1、每一步都需要思考,不同水平的...
透视脚本!如何下载德普之星辅助... 透视脚本!如何下载德普之星辅助软件(透视)透视软件免费入口官网(切实真的有挂);所有人都在同一条线上...
透视黑科技!aapoker辅助... 透视黑科技!aapoker辅助软件合法吗(透视)万能辅助器(切实有挂);1)aapoker辅助软件合...
透视透视!德扑圈透视挂(透视)... 透视透视!德扑圈透视挂(透视)透视辅助软件激活码(总是存在有挂)小薇(透视辅助)致您一封信;亲爱德扑...
透视工具!aapoker透视脚... 透视工具!aapoker透视脚本(透视)透视软件(都是真的是有挂)1、下载好aapoker透视脚本辅...