【Elasticsearch】-操作index

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 索引相当与数据库中的表,一个 Elasticsearch 索引只是一个或多个物理分片的逻辑组,其中每个分片实际上是一个独立索引。通过将索引中的文档分布在多个分片上,并将这些分片分布在多个节点上。

参考文档

https://www.elastic.co/guide/en/elasticsearch/reference/7.11/index-modules.html#_settings_in_other_index_modules

一个 Elasticsearch 索引只是一个或多个物理分片的逻辑组,其中每个分片实际上是一个独立索引。通过将索引中的文档分布在多个分片上,并将这些分片分布在多个节点上。

一、索引设置

1.1索引静态设置

索引创建时或索引关闭时才能修改的设置;

1.2索引动态设置

在索引运行时可使用更新索引 API 修改的设置;

以下是索引经常使用的设置参数及说明,具体参数及设置请查看官方文档索引模块。

分类

参数

说明

索引静态设置

number_of_shards

索引的主分片数,默认为1只能索引创建时设置,设置后不能修改。

number_of_routing_shards

用于拆分 (split)索引路由分片数

index.shard.check_on_startup

打开之前是否应检查分片是否损坏。当检测到损坏时,它将阻止分片被打开。默认值为false

codec

默认使用LZ4压缩存储数据,可使用best_compression更高的压缩比,但降低存储字段性能。

索引动态设置

number_of_replicas

每个主分片的副本(备份数),默认值为1

index.refresh_interval

多久执行一次刷新操作,这使得对索引的最近更改对搜索可见。

auto_expand_replicas

根据集群中数据节点的数量自动扩展副本的数量。设置为以破折号分隔的下限和上限(例如 0-5)或使用 all 作为上限(例如 0-all)。默认为 false(即禁用)。

二、创建索引

索引名称必须符合以下规则,RestApi都在kibana中执行。

  • 只能是小写字符
  • 不能包含字符:\/*?"<>|(空格)、,#
  • 7.0 之前索引可以包含冒号(:),但在 7.0 之后不推荐。
  • 不能以-_+开头
  • 不能是...
  • 长度不能超过 255 字节(注意是字节,所以多字节字符会更快达到 255 的限制)
  • 名字以 . 开头不推荐,除非由插件管理的隐藏索引和内部索引
# 创建名称为test-index-000001的索引,主分片数为1,副本分片为1PUT/test-index-000001{
"settings": {
"number_of_shards": 1,
"number_of_replicas": 1  }
}
# 响应示例# cknowledged 表明在集群中索引是否成功创建,# hards_acknowledged 表明在超时之前,是否为每个分片启动了必需的分片副本数量。{
"acknowledged": true,
"shards_acknowledged": true,
"index": "test"}


三、判断

判断索引是否存在HEAD/test-index-000001#响应200-OK


四、查询索引

#查询全部索引GET/_cat/indices#查询单个索引GET/test-index-000001



五、删除索引

#删除单个索引DELETEtest-index-000001#删除多个索引 多个索引名称以“,”分隔DELETEtest-index-000001,test-index-000002,test-index-000003


六、关闭、开启索引

#关闭索引POST/test-index-000001/_close{
"acknowledged" : true,
"shards_acknowledged" : true,
"indices" : {
"test-index-000001" : {
"closed" : true    }
  }
}
#开启索引POST/test-index-000001/_open{
"acknowledged" : true,
"shards_acknowledged" : true}


相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
7月前
|
JSON 自然语言处理 Java
Java原生操作Elasticsearch
Java原生操作Elasticsearch
144 0
|
关系型数据库 MySQL 索引
ElasticSearch高级操作3
ElasticSearch高级操作3
126 0
|
自然语言处理 Java 索引
ElasticSearch高级操作2
ElasticSearch高级操作2
146 0
|
JSON 自然语言处理 数据挖掘
ElasticSearch高级操作1
ElasticSearch高级操作1
127 0
|
7月前
|
安全 大数据 API
elasticsearch|大数据|elasticsearch的api部分实战操作以及用户和密码的管理
elasticsearch|大数据|elasticsearch的api部分实战操作以及用户和密码的管理
299 0
|
4月前
|
存储 API 数据库
检索服务elasticsearch索引(Index)
【8月更文挑战第23天】
70 6
|
6月前
|
存储
Elasticsearch exception [type=cluster_block_exception, reason=blocked by: [FORBIDDEN/12/index r【已解决】
Elasticsearch exception [type=cluster_block_exception, reason=blocked by: [FORBIDDEN/12/index r【已解决】
151 1
|
6月前
|
JSON DataWorks 关系型数据库
DataWorks操作报错合集之同步Elasticsearch数据报错:Cat response did not contain a JSON Array,是什么导致的
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
5月前
|
监控 搜索推荐 Go
万字详解!在 Go 语言中操作 ElasticSearch
本文档通过示例代码详细介绍了如何在Go应用中使用`olivere/elastic`库,涵盖了从连接到Elasticsearch、管理索引到执行复杂查询的整个流程。
120 0
|
7月前
|
Kubernetes 关系型数据库 MySQL
实时计算 Flink版产品使用合集之在Kubernetes(k8s)中同步MySQL变更到Elasticsearch该怎么操作
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStreamAPI、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。