备案控制台

开发者社区问答正文

浅析ElasticSearch原理

女主宣言
最近女主在项目中使用到ElasticSearch来做索引。但是对ElasticSearch的一些原理还是比较模糊，所以就梳理了一下ElasticSearch的基本原理，分享给大家。
我们首先从ElasticSearch的启动过程开始，逐步了解其工作原理。

启动过程

搜索被执行成一个两阶段过程，我们称之为 Query Then Fetch；

Coordinating Node

在初始查询阶段时，查询会广播到索引中每一个分片拷贝（主分片或者副本分片）。每个分片在本地执行搜索并构建一个匹配文档的大小为 from + size 的优先队列。PS：在搜索的时候是会查询Filesystem Cache的，但是有部分数据还在Memory Buffer，所以搜索是近实时的。

Shard

每个分片返回各自优先队列中所有文档的 ID 和排序值给协调节点，它合并这些值到自己的优先队列中来产生一个全局排序后的结果列表。

Coordinating Node

接下来就是取回阶段，协调节点辨别出哪些文档需要被取回并向相关的分片提交多个 GET 请求。每个分片加载并丰富文档，如果有需要的话，接着返回文档给协调节点。一旦所有的文档都被取回了，协调节点返回结果给客户端。

补充：Query Then Fetch的搜索类型在文档相关性打分的时候参考的是本分片的数据，这样在文档数量较少的时候可能不够准确，DFS Query Then Fetch增加了一个预查询的处理，询问Term和Document frequency，这个评分更准确，但是性能会变差。

总结以上主要介绍了ES的工作原理，ES的魅力远不止如此，同时ES的开源特性也使得它社区活跃，版本迭代更新迅速，目前已经更新到6.x版本，如有兴趣可到ES官网了解最新的特性。

展开

收起

驻云科技 2018-02-22 16:01:46 4534 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

q134149

Re浅析ElasticSearch原理
www,rshpr,com
www,myfushun,com
www,hztv3,com

2018-03-25 23:08:46

赞同展开评论
驻云科技

上海驻云信息科技有限公司成立于2013年，是一家领先的企业云计算架构咨询、实施、管理及运维技术服务提供商，致力于为企业客户提供卓越的云计算整体解决方案。

2018-03-01 16:33:39

赞同展开评论

问答分类：

索引检索分析服务 Elasticsearch版

问答标签：

检索分析服务 Elasticsearch版原理

问答地址：

开发者社区 > 云计算 > 问答

相关问答

非ES集群间数据同步，阿里云Elasticsearch如何进行数据迁移？

945

1

0

在第三方Elasticsearch迁移至阿里云中，OSS快照、Logstash、ReIndex这三种

1170

1

0

在自建Elasticsearch迁移至阿里云中，OSS快照、Logstash、ReIndex这三种同

1200

1

0

在阿里云Elasticsearch实例间数据迁移中，OSS快照、Logstash、ReIndex这三

1114

1

0

什么用户适合通过OSS快照进行阿里云Elasticsearch集群间的数据迁移？

1158

1

0

什么用户适合通过ReIndex进行阿里云Elasticsearch集群间的数据迁移？

831

1

0

什么用户适合通过Logstash进行阿里云Elasticsearch集群间的数据迁移？

804

1

0

阿里云Elasticsearch如何进行集群间的数据迁移？

906

1

0

阿里云Elasticsearch什么时候对网络架构进行了调整？

700

1

0

与旧框架相比，阿里云Elasticsearch新网络架构，有什么不一样？

693

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

12月冬日咖啡礼｜大模型解决方案邀你来体验

相关文章

面向 Agent 的高并发分析：Doris vs. Snowflake vs. ClickHouse

分布式搜索引擎ElasticSearch

如何做好SQL质量监控

你的数据库不是性能差，是你的SQL在“烧钱”：用这条指令让AI化身资深DBA

还有其他疑问?