ES分布式搜索引擎入门
本课程学习Elasticsearch核心技能:掌握倒排索引原理,理解IK分词器及其词典扩展,熟练使用Java Client实现文档增删改查、批量导入及Term查询、全文检索、布尔查询等操作,并实现排序、分页与高亮功能。
状态检索:如何快速判断一个用户是否存在?
本文探讨高效判断对象“是否存在”的问题,对比有序数组、二叉树、哈希表的查询性能,引出位图与布隆过滤器。位图利用bit级存储,大幅节省空间;布隆过滤器通过多哈希函数进一步压缩数组长度,实现O(1)查询,适用于允许低错误率的大规模去重场景,如注册校验、爬虫判重等。
ES分布式搜索引擎入门
本课程学习Elasticsearch核心知识,包括倒排索引原理、IK中文分词器使用与扩展、索引的增删改查、Java Client实现文档操作及全文检索、布尔查询、排序分页与高亮显示,并结合实际电商场景完成搜索功能开发与数据聚合分析。
第二章 基础算法
本文系统介绍了加密算法与排序算法的核心知识。涵盖对称加密(如AES、SM4)、非对称加密(如RSA、SM2)、哈希摘要(如SHA-2、SM3)、电子签名及密码存储方案;深入解析冒泡、选择、插入、快排、归并、堆排序等算法的原理、复杂度与优化策略,并对比其稳定性与适用场景;同时涉及字符串反转、正则匹配应用及二分查找、回溯算法等典型算法实践,内容全面,理论结合实际,适用于技术学习与面试准备。
推荐引擎:没有搜索词,「头条」怎么找到你感兴趣的文章?
本文深入解析资讯类App推荐引擎的检索技术,揭秘“下拉刷新”背后如何实现个性化内容推荐。重点讲解基于内容召回与协同过滤(用户/物品)两大核心算法,剖析其原理、优缺点及实际应用,并介绍多路召回与分层排序的混合推荐机制,展现推荐系统如何高效实现精准内容分发。
索引拆分:大规模检索系统如何使用分布式技术加速检索?
在大规模检索系统中,分布式技术通过拆分倒排索引提升性能。基于文档的水平拆分将数据随机分片,各服务器并行处理,缩短单次查询时间,并支持灵活扩容;而基于关键词的垂直拆分虽减少请求复制,但易引发负载不均与维护难题。前者因扩展性强、运维简单成为主流方案。