游客2syd4euah5df4_个人页

游客2syd4euah5df4
个人头像照片
52
0
0

个人介绍

暂无个人介绍

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息

2025年12月

  • 12.18 12:11:58
    发表了文章 2025-12-18 12:11:58

    空间检索(下):「查找最近的加油站」和「查找附近的人」有何不同?

    本文探讨了在动态查询范围内高效检索“最近的K个目标”的技术方案。针对GeoHash固定范围查询的局限,提出利用四叉树与非满四叉树实现空间动态划分,通过父子节点层级关系快速扩大检索范围,避免重复查找。同时,结合前缀树优化GeoHash字符串编码的索引效率,提升查询性能。进一步扩展至高维场景,介绍k-d树等结构的应用与挑战,为地理位置服务、推荐系统等提供底层支持。(238字)
  • 12.18 12:11:15
    发表了文章 2025-12-18 12:11:15

    空间检索(上):如何用 Geohash 实现「查找附近的人」功能?

    本文介绍了如何高效实现“查找附近的人”功能,提出基于Geohash的区域编码与索引方案。通过将二维地理位置转换为一维编码,结合非精准与精准检索策略,可在大规模系统中快速查询附近用户,兼顾效率与准确性,适用于社交、出行等多种场景。
  • 12.18 12:07:37
    发表了文章 2025-12-18 12:07:37

    非精准 Top K 检索:如何给检索结果的排序过程装上加速器?

    本文介绍了非精准Top K检索的优化思路与三种实现方法:基于静态质量得分排序截断、胜者表利用词频得分、分层索引两层检索。核心思想是将计算前移至离线阶段,降低在线打分开销,快速缩小检索范围,提升整体效率。
  • 12.18 12:06:04
    发表了文章 2025-12-18 12:06:04

    精准 Top K 检索:搜索结果是怎么进行打分排序的?

    搜索引擎排序核心在于相关性打分。本文介绍TF-IDF、BM25及机器学习三种打分方法,解析如何高效实现Top K检索,提升搜索质量与性能。
  • 12.18 12:05:20
    发表了文章 2025-12-18 12:05:20

    索引拆分:大规模检索系统如何使用分布式技术加速检索?

    在大规模检索系统中,分布式技术通过拆分倒排索引提升性能。基于文档的水平拆分将数据随机分片,各服务器并行处理,缩短单次查询时间,并支持灵活扩容;而基于关键词的垂直拆分虽减少请求复制,但易引发负载不均与维护难题。前者因扩展性强、运维简单成为主流方案。
  • 12.18 11:58:24
    发表了文章 2025-12-18 11:58:24

    索引更新:刚发布的文章就能被搜到,这是怎么做到的?

    本文介绍了工业界倒排索引的高效更新机制。针对小规模内存索引,采用Double Buffer实现无锁读写切换;对于大规模数据,则使用“全量+增量”索引方案,结合删除列表处理删改操作,并通过完全重建、再合并或滚动合并策略优化性能,核心思想是读写分离,兼顾实时性与检索效率。(238字)
  • 12.18 11:57:27
    发表了文章 2025-12-18 11:57:27

    索引构建:搜索引擎如何为万亿级别网站生成索引

    针对超大规模数据场景,如搜索引擎需处理万亿级网页,倒排索引远超内存容量。工业界采用分治思想:先将文档分批,在内存中为每批构建小型倒排索引,再写入磁盘生成有序临时文件;最后通过多路归并技术合并临时文件,生成全局有序的最终倒排文件。此过程类似MapReduce框架,支持分布式并行处理,显著提升效率。检索时,优先将词典加载至内存(如用哈希表或FST压缩存储),结合B+树等结构实现高效查询; posting list则按需分段加载或建立分层索引,辅以LRU缓存热点数据,减少磁盘IO,提升性能。核心思想是“分而治之”与“内存优先”,兼顾效率与存储。
  • 12.18 11:56:28
    发表了文章 2025-12-18 11:56:28

    NoSQL 检索:为什么日志系统主要用 LSM 树而非 B+ 树?

    针对日志、监控等高频写入场景,LSM树通过内存树(C0)与磁盘树(C1)结合,利用批量顺序写替代随机写,显著提升写入性能。配合WAL保障数据恢复,滚动合并优化读写效率,更适合写多读少、查新数据的应用需求。
  • 12.18 11:55:25
    发表了文章 2025-12-18 11:55:25

    数据库检索:如何使用 B+ 树对海量磁盘数据建立索引?

    本讲探讨磁盘环境下大规模数据检索的挑战与解决方案。由于内存有限,数据常存储于磁盘,而磁盘随机访问远慢于内存,因此需减少磁盘IO。B+树通过将索引与数据分离、节点大小对齐磁盘块、分层存储等设计,实现高效磁盘检索。其内部节点仅存索引,叶子节点存数据,并通过链表连接,支持快速查找与范围查询。即使数据在磁盘,也能通过少量IO完成检索,广泛应用于数据库如MySQL。
  • 12.18 11:52:48
    发表了文章 2025-12-18 11:52:48

    倒排索引:如何从海量数据中查询同时带有「极」和「客」的唐诗?

    本文通过唐诗检索的场景,对比正排索引与倒排索引的差异。正排索引以文档ID为键,适合根据标题查内容;而倒排索引以关键词为键,记录包含该词的文档列表,显著提升按内容检索的效率。文中详细讲解了倒排索引的构建过程、查询方法(如多关键字交集查询)及链表归并优化,并探讨其在搜索引擎、推荐系统等场景的应用,帮助读者掌握高效检索的核心技术。
  • 12.18 11:51:39
    发表了文章 2025-12-18 11:51:39

    状态检索:如何快速判断一个用户是否存在?

    本文探讨了高效判断对象是否存在的技术方案,对比有序数组、二叉树和哈希表后,重点介绍位图与布隆过滤器。位图利用bit级存储,大幅节省空间;布隆过滤器通过多哈希函数映射,以极小错误率换取更高空间效率,适用于注册去重、爬虫判重等场景,是时间与空间权衡的典范。
  • 12.18 11:50:45
    发表了文章 2025-12-18 11:50:45

    哈希检索:如何根据用户 ID 快速查询用户信息?

    哈希表通过哈希函数将键转化为数组下标,实现O(1)级高效查询。面对哈希冲突,开放寻址法和链表法是两大解决方案:前者通过线性、二次探查或双散列寻找空位,后者则在数组中存储链表或红黑树以容纳多个元素。JDK1.8的HashMap即结合了数组、链表与红黑树,兼顾查询与动态操作性能。但哈希表需预留空间控制装载因子,并牺牲了数据有序性,不适合范围查询。其核心在于均衡分布数据,提升检索效率。
  • 12.17 11:34:33
    发表了文章 2025-12-17 11:34:33

    非线性结构检索:数据频繁变化的情况下,如何高效检索?

    通过树状结构与跳表,将无序数据组织为可高效检索的非线性结构。二叉检索树利用有序分层实现二分查找,跳表则通过多层指针加速链表访问,二者均在动态数据场景下兼顾查询与更新效率,优于传统数组。
  • 12.17 11:33:25
    发表了文章 2025-12-17 11:33:25

    线性结构检索:从数组和链表的原理初窥检索本质

    本课探讨数组与链表的检索原理。数组连续存储,支持随机访问,适合二分查找,效率为O(log n);链表非连续存储,检索需遍历,效率为O(n),但插入删除更高效。通过理解二者存储特性对检索的影响,掌握“合理组织数据以缩小查询范围”的核心思想,并学会改造链表等结构优化性能,为深入学习高级检索技术打下基础。(238字)
  • 12.17 11:31:11
    发表了文章 2025-12-17 11:31:11

    认识AI

    人工智能(AI)历经三阶段发展,核心突破在于Transformer神经网络。其注意力机制让模型理解上下文,支撑大语言模型(如GPT、DeepSeek)实现文本生成、翻译等智能任务。通过持续预测下一个词,LLM能生成连贯长文本,推动AI飞速进步。
  • 发表了文章 2025-12-19

    前端(Cursor)-登录

  • 发表了文章 2025-12-19

    前端(Cursor)-员工管理

  • 发表了文章 2025-12-19

    项目上线

  • 发表了文章 2025-12-19

    服务端(Cursor)-接口开发(登录认证)

  • 发表了文章 2025-12-19

    服务端(Cursor)-接口开发(文件上传)

  • 发表了文章 2025-12-19

    服务端(Cursor)-接口开发(部门管理)

  • 发表了文章 2025-12-19

    前端(Cursor)-部门管理

  • 发表了文章 2025-12-19

    前端(Cursor)-页面布局

  • 发表了文章 2025-12-19

    MybatisPlus讲义

  • 发表了文章 2025-12-19

    Jenkins前置配置

  • 发表了文章 2025-12-19

    Jenkins配置编译项目

  • 发表了文章 2025-12-19

    服务端(DevBox)-项目创建

  • 发表了文章 2025-12-19

    虚拟机环境说明

  • 发表了文章 2025-12-18

    Jenkins环境搭建

  • 发表了文章 2025-12-18

    09-Docker安装Mysql

  • 发表了文章 2025-12-18

    05-容器命令

  • 发表了文章 2025-12-18

    06-Docker镜像

  • 发表了文章 2025-12-18

    01-Docker概述

  • 发表了文章 2025-12-18

    07-nexus搭建docker私仓

  • 发表了文章 2025-12-18

    11-Dockerfile

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息