创建和删除 | 学习笔记

简介: 快速学习创建和删除

开发者学堂课程【ElasticSearch 入门精讲创建和删除学习笔记,与课程紧密连接,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/631/detail/10030


创建和删除


内容介绍:

一、创建

二、删除


一、创建

调大系统的“最大打开文件数”,建议 32K 甚至是 64K。

ulimit-a (查看)

ulimit-n 32000 (设置)

修改配置文件调整 ES 的 VM 内存大小

1:修改

bin/elasticsearch.in.sh 中 ES_MIN_MEM 和 ES_MAX_MEM 的大小,建议设置一样大,避免频繁的分配内存,根据服务器内存大小,,一般分配60%左右(默认 256M)

2:如果使用 searchwrapper 插件启动 es 的话则修改[过时,在 es1.x 中有用]

bin/service/elasticsearch.conf (默认1024M,2.x以后不用考虑)

设置 mlockall 来锁定进程的物理内存地址

避免交换 (swapped) 来提高性能

修改文件 conf/elasticsearch.yml

bootstrap.mlockall:true

分片多的话,可以提升建立索引的能力,5-20个比较合适。

如果分片数过少或过多,都会导致检索比较慢。分片数过多会导致检索时打开比较多的文件,另外也会导致多台服务器之间通讯。而分片数过少会导至单个分片索引过大,所以检索速度慢。

建议单个分片最多存储 20G 左右的索引数据,所以,分片数量=数据总量/20G。

副本多的话,可以提升搜索的能力,但是如果设置很多副本的话也会对服务器造成额外的压力,因为需要同步数据。所以建议设置2-3个即可。

要定时对索引进行优化,不然 segment 越多,查询的性能就越差。

索引量不是很大的话情况下可以将 segment 设置为1。段数优化。要全面优化索引,将其设置为1。默认设置是只需检查是否需要执行合并,如果需要执行合并才执行合并操作。[经过测试越小速度越快]

curl-XPOST 'http://localhost:9200/crxy/ optimize?max num segments=1'

java 代码:

client.admin().indices().prepareOptimize("bigdata").setMaxNumSegments(1).get();


二、删除

删除文档:在 Lucene 中删除文档,数据不会马上在硬盘上除去,而是在 lucene 索引中产生一个 .del 的文件,而在检索过程中这部分数据也会参与检索,lucene 在检索过程会判断是否删除了,如果删除了再过滤掉。这样也会降低检索效率。所以可以执行清除删除文档。

curl-XPOST'http://localhost:9200/bigdata/ optimize?only_expunge deletes=true'

client.admin().indiceso().prepareOptimize("bigdata").setOnlyExpungeDeletes(true).get();

如果在项目开始的时候需要批量入库大量数据的话,建议将副本数设置为0。因为 es 在索引数据的时候,如果有副本存在,数据也会马上同步到副本中,这样会对 es 增加压力。待索引完成后将副本按需要改回来。这样可以提高索引效率。

相关实践学习
以电商场景为例搭建AI语义搜索应用
本实验旨在通过阿里云Elasticsearch结合阿里云搜索开发工作台AI模型服务,构建一个高效、精准的语义搜索系统,模拟电商场景,深入理解AI搜索技术原理并掌握其实现过程。
ElasticSearch 最新快速入门教程
本课程由千锋教育提供。全文搜索的需求非常大。而开源的解决办法Elasricsearch(Elastic)就是一个非常好的工具。目前是全文搜索引擎的首选。本系列教程由浅入深讲解了在CentOS7系统下如何搭建ElasticSearch,如何使用Kibana实现各种方式的搜索并详细分析了搜索的原理,最后讲解了在Java应用中如何集成ElasticSearch并实现搜索。  
相关文章
|
SQL 缓存 监控
MyCat - 高级 - MyCat-Web 性能监控 | 学习笔记
快速学习 MyCat - 高级 - MyCat-Web 性能监控
MyCat - 高级 - MyCat-Web 性能监控 | 学习笔记
|
算法 Unix Linux
C语言随机数的产生(rand、srand、time函数细节讲解)
C语言随机数的产生(rand、srand、time函数细节讲解)
342 0
|
7月前
|
存储 算法 架构师
腾讯问题:有40亿整数,如何 判断一个 int 是在其中,越快越好 ?
腾讯问题:有40亿整数,如何 判断一个 int 是在其中,越快越好 ?
腾讯问题:有40亿整数,如何 判断一个 int 是在其中,越快越好 ?
|
9月前
|
机器学习/深度学习 人工智能 大数据
销售易CRM:技术领航,开启智能客户关系管理新时代
销售易CRM作为国内CRM市场的领导者,融合人工智能、机器学习、大数据分析、云计算和移动技术,提供智能化客户关系管理体验。其AI功能助力精准预测与洞察,大数据平台支持实时决策,云架构确保高可用性与安全性,低代码平台快速响应业务变化,开放API构建生态系统。通过技术创新,销售易CRM帮助企业提升效率、降低成本,持续引领行业发展。
|
11月前
|
机器学习/深度学习 人工智能 文字识别
魔搭社区每周速递(12.29-1.4)
魔搭ModelScope本期社区进展:828个模型,72个数据集,61个创新应用,9篇内容
375 10
|
JavaScript
Element_select 选择器 选中框中显示不了选中的值
解决Vue中`el-select`选择器不显示选中值的问题:在`selectChanged`方法中添加`this.$forceUpdate()`,强制组件更新,使输入框显示选择的值。示例代码包括模板和方法。
1612 2
|
Kubernetes 测试技术 持续交付
探索微服务架构下的持续集成与部署最佳实践
本文将深入探讨在微服务架构下实施持续集成与部署的最佳实践,介绍如何利用现代化工具和流程来实现自动化测试、持续集成、灰度发布等关键环节,帮助开发团队提升交付效率和质量。
|
编解码 自动驾驶 计算机视觉
首篇基于Occupancy的单目3D模型 | 让单目3D也搭上最前沿列车
首篇基于Occupancy的单目3D模型 | 让单目3D也搭上最前沿列车
325 1
|
XML 程序员 数据安全/隐私保护
老程序员分享:PyMuPDF使用
老程序员分享:PyMuPDF使用
346 0
|
开发工具 数据安全/隐私保护 git
docker安装nexus3
docker安装nexus3以及搭建本地私服
1019 0