ElasticSearch搜索引擎教程—>实战篇 9:Elasticsearch7.x使用ICU分词插件

  • Post author:
  • Post category:其他


1、查看当前已经安装的分词插件

[elasticsearch@txvm2019 bin]$ ./elasticsearch-plugin list

analysis-icu

analysis-ik

引用网上对ICU分词的介绍:

ICU Analysis插件是一组将Lucene ICU模块集成到Elasticsearch中的库。 本质上,ICU的目的是增加对Unicode和全球化的支持,以提供对亚洲语言更好的文本分割分析。 从Elasticsearch的角度来看,此插件提供了文本分析中的新组件,如下表所示:

常用分词

1)普通分词
GET _analyze
{
  "text": ["他是一个前端开发工程师"],
  "analyzer": "standard"
}
 
GET _analyze
{
  "text": ["他是一个前端开发工程师"],
  "analyzer": "keyword"
}
 
2)IK 分词
GET _analyze
{
  "text": ["他是一个前端开发工程师"],
  "analyzer": "ik_max_word"
}
 
3) ICU 分词
GET _analyze
{
  "text": ["他是一个前端开发工程师"],
  "analy



版权声明:本文为yuyecsdn原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。