存储

首页 标签 存储
# 存储 #
关注
192959内容
|
4天前
|
05-Gitlab容器环境搭建
本文介绍如何通过Docker搭建Gitlab CE(社区版)环境。包含拉取镜像、创建持久化目录、运行容器并映射配置、数据和日志卷,以及访问Gitlab并初始化项目的方法。详细说明了SSH与HTTP访问配置、初始密码获取,并提供本地代码上传的两种方式,帮助快速部署并使用私有代码仓库。
|
4天前
|
1-常用过滤器介绍
本文介绍了Spring Security核心过滤器链中的常用过滤器及其作用,涵盖安全上下文管理、CSRF防护、认证登录、会话控制、异常处理等关键功能,帮助理解Security底层执行流程与AOP机制的实现。
跳表法加速倒排索引
跳表、哈希表与位图法可加速倒排索引。跳表通过多层链表实现快速跳转,将归并查找时间降至O(log n);哈希表适用于小集合查大集合,查询可达O(1);位图则利用位运算高效求交集,适合短posting list场景,显著提升检索效率。
哈希冲突
哈希冲突可通过优化哈希函数或采用冲突解决策略应对。开放寻址法通过线性、二次探查或双散列寻找空位,但易导致聚集,影响效率;链表法则在冲突位置构建链表,避免抢占,更适应动态数据,是常用方案之一。
|
4天前
|
07 | NoSQL 检索:为什么日志系统主要用 LSM 树而非 B+ 树?
B+树适用于读多写少场景,但在日志、监控等高频写入的大数据场景中性能受限。LSM树通过将数据分内存(C0树)和磁盘(C1树)两部分存储,利用批量写入替代随机写入,大幅提升写入效率。结合WAL预写日志保障崩溃恢复,滚动合并实现有序归并,特别适合写密集型应用。NoSQL数据库广泛采用此技术。
|
4天前
|
特别加餐 | 高性能检索系统中的设计漫谈
本文深入解析高性能系统中的四大核心设计思想:索引与数据分离、减少磁盘IO、读写分离与分层处理。通过典型案例对比与扩展分析,揭示其本质与通用经验,帮助开发者在实际场景中优化检索效率、提升系统性能,打造高效稳定的架构。
|
4天前
|
13 | 空间检索(上):如何用 Geohash 实现「查找附近的人」功能?
本文介绍了如何高效实现“查找附近的人”功能,针对大规模系统提出基于区域划分与Geohash编码的解决方案。通过将二维空间划分为带编号的区域,并利用一维编码(如Geohash)建立索引,可大幅提升检索效率。支持非精准与精准查询:前者直接查所在区域,后者扩展至邻接8区域以避免遗漏,结合二分查找、跳表或Redis等技术实现快速定位。尤其适用于社交、餐饮、出行等LBS场景。
|
4天前
|
08 | 索引构建:搜索引擎如何为万亿级别网站生成索引?
针对超大规模数据,可通过分治与多路归并生成内存外倒排索引。先将文档分批在内存建索引,再写入有序临时文件,最后归并为全局索引。检索时结合内存哈希、B+树及分层加载技术,提升效率。
|
4天前
|
17 | 存储系统:从检索技术角度剖析 LevelDB 的架构设计思想
LevelDB是Google开源的高性能键值存储系统,基于LSM树优化,采用跳表、读写分离、SSTable分层与Compaction等技术,结合BloomFilter、缓存机制与二分查找,显著提升数据读写与检索效率,广泛应用于工业级系统中。(239字)
|
4天前
|
16 | 最近邻检索(下):如何用乘积量化实现「拍照识花」功能?
本文深入解析了AI时代图片检索的核心技术,涵盖聚类算法与局部敏感哈希的差异、乘积量化压缩向量原理及倒排索引优化。通过K-Means聚类与乘积量化结合,实现高效近似最近邻搜索,在节省存储的同时提升检索速度,广泛应用于以图搜图、商品识别与推荐系统等领域。
免费试用