开发者学堂课程【ElasticSearch 入门精讲:ES 工作原理】学习笔记,与课程紧密连接,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/631/detail/9936
ES 工作原理
内容介绍:
一、ES 简介概述
二、ES 简介和 Solr 对比
三、ES 简介和 MySQL 对比
四、REST 简介
一、ES简介
1.ES 定义
首先,我们对 ES 进行一些概述,ES 是 ElasticSeqarch 设计的缩写。那么到底他是什么 ElasticSeqarch 设计呢?
ElasticSeqarch 是一款基于 Lucene 的开源的分布式查询和分析引擎。
是一款基于 ApacheLucene 构建的开源搜索引擎,它采用 Java 编写并使用 Lucene 构建索引、提供搜索功能,ElasticSearch 的目标是让全文搜索变得简单,开发者口以通过它简单明了的 RestFulAPI 轻松地实现搜索功能,而不必去面对 Lucene 的复杂性。ES 能够轻松的进行大规模的横向扩展,以支撑 PB 级的结构化和非结构化海量数据的处理。
一言以蔽之∶
ElasticSearch 是一款基于 Lucene 的实时分布式搜索和分析引擎。
ElasticSearch 设计主要用于云计算中,能够达到实时搜素、稳定、可靠、快速,安装使用也非常方便。
官网∶www.elastic.c9
ElasticSearch 是一个生态站,里面包含各种技术。Kibana 是进行数据的可视化操作。
ElasticSearch 是进行索引信息的存储。Logstash 是进行信息采集。
2.ES 工作原理
工作原理是:首先搭建一个索引库,然后多个爬虫从互联网上抓取数据。然后这个团队做了一个网站,这个网站在网上录入检索的关键字。
然后将从索引库中检索到的信息反馈给客户端。最后将此呈现出来。
详细步骤如下:
1、录入待检索的关键字
2、点击按钮百度一下
3、向百度后台的集群发送邀请
4、百度索引库集群针对用户传过来的检索关键字进行搜索,将搜索后的结果分页反馈给客户端。
5、浏览器收到了远程ES服务器反馈的结果,将其显示在页面上
前提1:ES 集群事先已经搭建完毕
前提2:使用网络爬虫的技术,从网络上抓取海量数据,存入到百度的索引库集群中。
互联网中有海量的网页资源。