备案控制台

开发者社区大数据文章正文

ElasticSearch7入门（四）常用插件：Head插件与ik分词器

2022-06-22 459

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

检索分析服务 Elasticsearch 版，2核4GB开发者规格 1个月

简介： ElasticSearch7入门（四）常用插件：Head插件与ik分词器

背景

简单介绍两个常用插件：

ES可视化的Web插件：elasticsearch-head

中文分词友好的分词器：elasticsearch-analysis-ik

先跑起来再说。

elasticsearch-head

在Github上搜索下载安装elasticsearch-head，并解压；

安装依赖：npm install；

启动：npm run start，访问http://localhost:9100。

Problem:

若未配置ElasticSearch的跨域，此时访问http://localhost:9100报错：

已拦截跨源请求：同源策略禁止读取位于 http://localhost:9200/_all 的远程资源。（原因：CORS 头缺少 'Access-Control-Allow-Origin'）。

Solution:

开启ES跨域：编辑配置文件config/elasticsearch.yml，在最后添加

http.cors.enabled: true
http.cors.allow-origin: "*"

重新启动ES，再次访问http://localhost:9100，点击连接，结果如下图所示，可以看到当前有两个索引。

elasticsearch-head，作为ES的数据可视化客户端，主要的几个菜单包括：概览、索引、数据浏览、基本查询、符合查询等。在上一篇文章中，我们用到了数据浏览下的索引查看功能。

elasticsearch-analysis-ik

ES自带的分词器

ES内置的分词器有：standard, simple, whitespace, stop, language等，这种外国人搞的，对英文的支持自不必说，看个例子吧：

但是，当遇到中文时，懵逼了。。

第三方：ik分词器

下载

在Github上搜索中文分词器：elasticsearch-analysis-ik，这里用的版本与ES版本一致：7.5.2。

github.com/medcl/elast…

安装

解压至elasticsearch-7.5.2\plugins\ik目录，ik这个目录可以自定义名称，不用配置其他的文件，重启ES。

记得重启ES，如果没有重启，则会报错：

下图为重启后，控制台的输出，可以看到加载了ik分词器：

测试

中文

中英文

分词模式

ik 提供了两种分词模式：ik_smart, ik_max_word，前面例子用的都是ik_smart。

ik_smart：最小切分

ik_max_word：最细切分

显然，可看到两种方式的区别。

自定义分词

以“新冠病毒肺炎”为例，我想让分词器将新冠作为一个词，由于ik分词器本身的词库中未录入这个词，我们在前面也看到了，ik分词器会将新冠作为两个字来处理；那么，这里手动录入这个词条。

添加词条（elasticsearch-7.5.2\plugins\ik\config）：这里直接写在了main.dic中。

看下加入自定义词条后的分词效果：

新冠成功分为一个词，而不是前面新，冠两个字。

文章标签：

检索分析服务 Elasticsearch版

自然语言处理

数据可视化

索引

安全

关键词：

检索分析服务 Elasticsearch版入门

检索分析服务 Elasticsearch版ik

检索分析服务 Elasticsearch版分词

检索分析服务 Elasticsearch版插件

检索分析服务 Elasticsearch版head

相关实践学习

使用阿里云Elasticsearch体验信息检索加速

通过创建登录阿里云Elasticsearch集群，使用DataWorks将MySQL数据同步至Elasticsearch，体验多条件检索效果，简单展示数据同步和信息检索加速的过程和操作。

ElasticSearch 入门精讲

ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示，Elasticsearch是最受欢迎的企业搜索引擎，其次是Apache Solr（也是基于Lucene）。 ElasticSearch的实现原理主要分为以下几个步骤：用户将数据提交到Elastic Search 数据库中通过分词控制器去将对应的语句分词，将其权重和分词结果一并存入数据当用户搜索数据时候，再根据权重将结果排名、打分将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索，具有接近实时的搜索，并支持多租户。

HeartSuit

目录

相关文章

nanshaws

|

3月前

|

存储 Java API

Elasticsearch 7.8.0从入门到精通

这篇文章详细介绍了Elasticsearch 7.8.0的安装、核心概念（如正排索引和倒排索引）、RESTful风格、各种索引和文档操作、条件查询、聚合查询以及在Spring Boot中整合Elasticsearch的步骤和示例。

nanshaws

203 1 1

Elasticsearch 7.8.0从入门到精通

武子康

|

3月前

|

自然语言处理大数据应用服务中间件

大数据-172 Elasticsearch 索引操作与 IK 分词器自定义停用词 Nginx 服务

大数据-172 Elasticsearch 索引操作与 IK 分词器自定义停用词 Nginx 服务

武子康

91 5 5

java冯坚持

|

3月前

|

自然语言处理 Java 网络架构

elasticsearch学习三：elasticsearch-ik分词器的自定义配置分词内容

这篇文章是关于如何自定义Elasticsearch的ik分词器配置以满足特定的中文分词需求。

java冯坚持

196 0 0

elasticsearch学习三：elasticsearch-ik分词器的自定义配置分词内容

技术自由圈/原疯狂创客圈

|

2月前

|

存储 JSON Java

ELK 圣经：Elasticsearch、Logstash、Kibana 从入门到精通

ELK是一套强大的日志管理和分析工具，广泛应用于日志监控、故障排查、业务分析等场景。本文档将详细介绍ELK的各个组件及其配置方法，帮助读者从零开始掌握ELK的使用。

技术自由圈/原疯狂创客圈

755 2 2

刘大猫.

|

2月前

|

测试技术 API 开发工具

ElasticSearch的IK分词器

ElasticSearch的IK分词器

刘大猫.

81 7 7

java冯坚持

|

3月前

|

存储 JSON Java

elasticsearch学习一：了解 ES，版本之间的对应。安装elasticsearch，kibana，head插件、elasticsearch-ik分词器。

这篇文章是关于Elasticsearch的学习指南，包括了解Elasticsearch、版本对应、安装运行Elasticsearch和Kibana、安装head插件和elasticsearch-ik分词器的步骤。

java冯坚持

342 0 0

elasticsearch学习一：了解 ES，版本之间的对应。安装elasticsearch，kibana，head插件、elasticsearch-ik分词器。

土木林森

|

2月前

|

存储安全数据管理

如何在 Rocky Linux 8 上安装和配置 Elasticsearch

本文详细介绍了在 Rocky Linux 8 上安装和配置 Elasticsearch 的步骤，包括添加仓库、安装 Elasticsearch、配置文件修改、设置内存和文件描述符、启动和验证 Elasticsearch，以及常见问题的解决方法。通过这些步骤，你可以快速搭建起这个强大的分布式搜索和分析引擎。

土木林森

85 5 5

qhhf_地道酬勤

|

4月前

|

NoSQL 关系型数据库 Redis

mall在linux环境下的部署（基于Docker容器），Docker安装mysql、redis、nginx、rabbitmq、elasticsearch、logstash、kibana、mongo

mall在linux环境下的部署（基于Docker容器），docker安装mysql、redis、nginx、rabbitmq、elasticsearch、logstash、kibana、mongodb、minio详细教程，拉取镜像、运行容器

qhhf_地道酬勤

700 3 3

mall在linux环境下的部署（基于Docker容器），Docker安装mysql、redis、nginx、rabbitmq、elasticsearch、logstash、kibana、mongo

热爱技术的小郑

|

5月前

|

数据可视化 Docker 容器

一文教会你如何通过Docker安装elasticsearch和kibana 【详细过程+图解】

这篇文章提供了通过Docker安装Elasticsearch和Kibana的详细过程和图解，包括下载镜像、创建和启动容器、处理可能遇到的启动失败情况（如权限不足和配置文件错误）、测试Elasticsearch和Kibana的连接，以及解决空间不足的问题。文章还特别指出了配置文件中空格的重要性以及环境变量中字母大小写的问题。

热爱技术的小郑

1383 0 0

一文教会你如何通过Docker安装elasticsearch和kibana 【详细过程+图解】

游客wkzdk2qklv76k

|

5月前

|

JSON 自然语言处理数据库

Elasticsearch从入门到项目部署安装分词器索引库操作

这篇文章详细介绍了Elasticsearch的基本概念、倒排索引原理、安装部署、IK分词器的使用，以及如何在Elasticsearch中进行索引库的CRUD操作，旨在帮助读者从入门到项目部署全面掌握Elasticsearch的使用。

游客wkzdk2qklv76k

189 0 0

热门文章

最新文章

极致 ElasticSearch 调优，让你的ES 狂飙100倍！

阿里云技术公开课直播预告：基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot

从企业级 RAG 到 AI Assistant，阿里云Elasticsearch AI 搜索技术实践

一文看懂Elasticsearch的技术架构：高效、精准的搜索神器

从企业级 RAG 到 AI Assistant，阿里云Elasticsearch AI 搜索技术实践

揭秘 Elasticsearch 集群架构，解锁大数据处理神器

Elasticsearch Serverless高性价比智能时序分析关键技术解读

云端问道12期实操教学-构建基于Elasticsearch的企业级AI搜索应用

构建基于 Elasticsearch 的企业级 AI 搜索应用

ElasticSearch容器化从0到1实践（一）

docker desktop安装es并连接elasticsearch-head:5

【Elasticsearch】elasticsearch.yml配置文件解读，ES配置详解

datax-elasticsearch 同步踩坑记录

【Elasticsearch】Elasticsearch倒排索引详解

【Elasticsearch】Elasticsearch索引创建与管理详解

数据处理神器Elasticsearch_Pipeline：原理、配置与实战指南

【Python】已解决：elasticsearch.exceptions.RequestError: TransportError(400, ‘search_phase_execution_exc

使用Elasticsearch实现全文搜索的最佳实践

Elasticsearch 常用查询语句大全

使用Elasticsearch实现全文搜索的最佳实践

相关课程

更多

Kibana Lens 入门

Elasticsearch实战进阶营

ElasticSearch 最新快速入门教程

ElasticSearch 入门精讲

相关电子书

更多

阿里云Elasticsearch体系架构与特性解析

开源与云：Elasticsearch应用剖析

《Elasticsearch全观测解决方案》

相关实验场景

更多

基于Elasticsearch向量检索的以文搜图

利用Elasticsearch实现地理位置查询

使用检索分析服务Elasticsearch版实现基础检索

使用阿里云Elasticsearch体验信息检索加速

使用阿里云Elasticsearch快速搭建可观测系统

下一篇

巧用对象存储回源绕过SSRF限制