AI时代最大的宝藏,也藏得最深:80%的企业知识沉睡在非结构化数据中

简介: 2026年AI进入应用爆发期,但非结构化数据成为瓶颈。Hologres推出AI原生新架构HSAP 2.0,融合语义搜索、多维分析与Serverless弹性,打造统一数据平面,让企业海量数据高效赋能AI,破解“数据熵”难题,支撑智能客服、销售助手等复杂场景,实现从“为人服务”到“为AI服务”的跨越。

2026年,AI进入“应用爆发年”,但一个残酷现实浮出水面:模型越来越聪明,输入却越来越混乱

正如全球知名风险投资机构 a16z 在《Big Ideas 2026》中指出:

“非结构化、多模态数据既是企业最大的瓶颈,也是最大的未开发宝藏。每家公司都在被 PDF、截图、视频、日志、邮件和半结构化数据泥潭淹没。”——a16z 称之为“非结构化宇宙”

这并非危言耸听。国际数据公司(IDC)IDC DataSphere 报告中预测到:非结构化数据的增长速度更快,2023-2028年复合年增长率达到49.3%。

模型的输入越混乱,AI 就越容易“犯错”:RAG 系统产生幻觉,Agent 在关键流程中悄悄出错,最终仍需人类反复校验。a16z 将此归因为“数据熵”——即在非结构化数据中,信息的新鲜度、结构化程度与真实性的持续衰减。

正因如此,清理、结构化并持续治理多模态数据,成为企业必需的能力。从合同分析、理赔处理,到销售支持、工程搜索,再到每一个依赖可靠上下文的 AI Agent 工作流——需求无处不在。

而要支撑这些场景,现有架构往往无法很好的兼顾:向量数据库擅长语义搜索,但无法做基于标量的业务分析,例如统计 GMV 等;传统的 OLAP 数据仓库能跑报表,却读不懂一张图片。两者靠 ETL 管道同步,不仅引入延迟,还带来数据不一致、运维复杂、成本翻倍等问题。

一种全新的数据平台正在诞生:它既能像向量数据库一样理解语义、检索图片和文档,又能像数仓一样运行复杂分析——这就是 Hologres 为 AI 时代打造的一体化引擎

从分析型数仓到 HSAP 1.0:Hologres的第一次进化

要理解 Hologres 如何走向 AI 原生,必须回溯它的起点。

企业普遍面临一个经典架构矛盾:高并发、低延迟的在线服务查询(Serving)。传统技术栈中,这两类负载对系统的要求截然相反——Serving 需要毫秒级响应和高吞吐点查,Analytics 则依赖大规模扫描和复杂聚合。因此,企业不得不维护两套系统——MySQL 处理毫秒级用户查询,Greenplum 或 ClickHouse 执行分钟级报表分析,中间靠 Kafka + Flink 做数据同步。这套“双写架构”复杂、昂贵,且一致性难以保障。

Hologres 在 2020 年提出的 HSAP 1.0(Hybrid Serving/Analytics Processing)正是为了破解这一困境。它首次在工业界实现了“一份数据、统一存储”,同时高效承载 Serving 与 Analytics 两类负载。这一架构创新被总结为 “统一分析与服务处理”(unified analytics and serving processing),并作为系统性成果发表于数据库顶级会议 VLDB 2020,标志着实时数仓与在线服务融合从工程实践走向学术认可。它成功支撑了淘宝双11每秒数亿条写入、毫秒级响应的极端场景,成为实时数仓领域的标杆。Hologres在阿里双十一流量高峰下处理每秒高达5.96亿条记录的经验,以及淘宝推荐系统实现毫秒级响应的能力,都为这种高吞吐、低延迟的混合存储架构提供了坚实的实战背书。

但 HSAP 1.0 的“Serving”本质仍是结构化查询——比如“查用户ID=123的订单”。而 AI 时代的需求已升级为语义级理解——比如“找和这张穿搭图风格相似的商品”或“从10万份PDF中找出与‘数据合规’相关的条款”。

当 RAG、多模态 Agent、企业知识库成为主流,单纯的点查+分析已不够用——AI 需要的是“搜索”(Search)。正是这一需求,推动 Hologres 向 AI 原生迈出关键一步。

让AI直接“读懂”企业数据:Hologres的AI原生新架构 HSAP 2.0

Hologres 的新架构并非简单叠加向量数据库功能,而是一次面向 AI 负载的深度重构。它将“语义搜索”与“多维分析”原生融合于单一引擎,让企业用一套系统同时支撑 AI 检索与业务分析,彻底告别“拼凑式”架构。

在Agent原生时代,企业AI应用正面临真实而迫切的业务挑战:

  • 智能客服需要在秒级内从数万份产品PDF、历史工单和知识库中,精准定位与用户问题最相关的答案,避免“一本正经地胡说八道”;
  • AI销售助手既要理解客户邮件中“预算有限但希望高端感”的模糊语义,又要结合结构化数据(如客户等级、历史成交价、库存)生成个性化提案;
  • 内部知识Bot需融合会议录音转写的文本、Jira任务、Confluence文档,在一次问答中回答“上次关于支付失败的讨论结论是什么?是否已上线修复?”;
  • 保险理赔Agent要同时解析用户上传的事故照片(向量检索)、OCR识别的保单文本(全文检索)和后台理赔规则库(结构化分析),实现端到端自动化。

这些场景的共性是:一次AI交互,往往同时包含语义搜索、关键词匹配、实时分析与高并发请求。传统的组合架构,在数据一致性、查询延迟、运维成本和系统稳定性上面临挑战。

为此,Hologres 构建了新一代 AI 原生数据引擎——HSAP 2.0 (Hybrid Search/Analytics Processing)即分析和搜索的混合处理架构,其核心是为上述混合负载量身打造的四大技术支柱,它们共同构成了一个为AI负载而生的一体化技术内核,旨在解决成本、精度、弹性和稳定性等核心挑战。

内存+磁盘混合存储:百亿级向量检索的性价比方案

第一大支柱是内存+磁盘混合存储,它为百亿级规模的向量检索提供了极致性价比的解决方案。全内存向量数据库虽然能提供极快的响应速度,但在面对海量数据时,存储成本会呈指数级增长,使其难以被广泛应用。Hologres 发布全新的向量检索引擎HGraph,实现了创新的分层存储架构。该架构将高频访问的向量数据和索引缓存在高速内存中,而将冷数据持久化到成本更低的磁盘上。这种设计在保持亚秒级响应的同时,大幅降低了总体拥有成本,使得企业能够负担得起训练和使用大规模AI模型所需的数据基础,真正实现“训得起也用得起大模型大脑” 。

深度融合全文检索:补齐语义搜索的最后一块拼图

第二大支柱是深度融合全文检索,这是补齐语义搜索最后一块拼图的关键。纯向量检索易漏掉“iPhone 15 Pro”等精确词;纯关键词无法理解“高端商务手机”等语义。HSAP 2.0 发布支持 BM25 的全文检索能力,支持单次查询融合向量与关键词,大幅提升RAG召回准确率——这是“保持上下文可靠”的关键技术。

例如,在金融、法律等专业领域,用户可能需要同时查询一个特定条款编号(关键词)及其相关概念(语义)。Hologres 能够在一次查询中完美满足此类需求,避免了在外部组件间进行两次查询并合并结果的复杂流程,从而保证了性能和准确性。这一能力也使Hologres的技术路线与主流向量数据库保持一致,证明了其设计的先进性与前瞻性。

Serverless 极致弹性:从容应对 Agent 的“潮汐流量”

第三大支柱是极致弹性与Serverless,它专门应对AI Agent产生的“潮汐式”突发流量。AI Agent的调用具有极强的不确定性和突发性,传统预留固定计算资源的模式要么造成大量闲置资源浪费,要么在高并发下导致系统宕机。Hologres 通过Serverless Down to Zero架构,实现了计算资源的按需秒级拉起和使用后自动缩容至零,真正做到了“为使用付费”。Hologres Serverless Computing服务已于2024年7月正式上线并纳入SLA(服务等级协议)保障,承诺不低于99.9%的服务可用性,极大地提升了企业在生产环境中采用Serverless模式的信心。这一特性对于承载企业核心业务的Agent至关重要,它不仅能带来显著的成本效益,更能确保系统的高可用性。Hologres的存储计算分离架构(基于Pangu分布式文件系统)是实现这种极致弹性的技术前提,它允许计算节点灵活伸缩而不影响共享存储层的数据持久性和一致性。

负载强隔离:保障AI查询的确定性

第四大支柱是负载隔离与确定性保障,旨在消除OLAP分析对向量检索的“噪音”。向量检索任务对查询延迟的抖动(Jitter)极为敏感,而传统的OLAP重负载查询会占用大量CPU和内存资源,两者在同一系统中共存时极易相互干扰,导致AI应用的响应不稳定。Hologres 通过资源组强隔离机制,将“敏感的向量检索”与“重负载的分析查询”在物理或逻辑层面彻底解耦。Hologres V2.0引入的虚拟仓库(Virtual Warehouse)实例为此提供了具体的工程实现路径,每个虚拟仓库都提供独立、可弹性伸缩的计算资源池,确保不同类型的工作负载互不干扰。这种隔离机制确保了即使在后台进行复杂的业务分析报表查询时,前端的AI应用依然能获得稳定如初的响应,从而保证了Agent的响应确定性,这是生产环境中部署任何AI应用的基本要求。

分析搜索混合处理,AI时代的统一数据平面

HSAP 2.0的提出,标志着数据平台从“为人服务”转向“为AI服务”。它不是拼凑工具,而是基于对“数据熵”“Agent负载”“多模态融合”等本质问题的洞察,重新定义了数据基础设施。

在 a16z 所预言的“智能体原生”(Agent-native)时代,企业需要的不是更多碎片化组件,而是一个可靠、低成本、高并发、强一致的统一数据平面。Hologres 所倡导的 HSAP 2.0 正致力于成为这一基础设施——让80%沉睡在非结构化数据中的企业知识,真正被AI激活。


想深入交流HSAP 2.0的技术细节或落地场景?

欢迎加入 Hologres 技术交流群,与产品、架构、解决方案专家直接对话!

(扫码入群 👇)

立即免费试用 Hologres HSAP 2.0

无需预付费用,按实际查询量付费,新用户还可享免费额度!

(新用户描述扫码领取 👇)

参考引用

相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
相关文章
|
存储 SQL 人工智能
Hologres 4.0全新发布:AI时代的一站式多模态分析平台
2025年云栖大会,Hologres发布全新4.0版本升级,以“AI时代的一站式多模态分析平台”为核心理念,全面展示了Hologres在结构化、半结构化与非结构化数据分析能力上的重大突破,特别是在OLAP分析、点查、向量检索、全文检索、湖仓协同及AI Function集成等方面的领先优势,刷新ClickBench、JSONBench、VectorDBBench等多项榜单,登顶第一。
|
3天前
|
机器学习/深度学习 人工智能
【AI大模型面试宝典四】- 基础架构篇
【AI大模型知识干货系列】深度解析Transformer位置编码:从绝对到相对,拆解Sinusoidal、RoPE、ALiBi等核心机制,对比优劣,直击面试高频问题。每篇聚焦一个知识点,助你系统掌握大模型关键技术,紧跟AI浪潮!欢迎关注、点赞、批评指正~
44 0
|
3月前
|
JSON API 数据格式
小红书API接口文档:笔记详情数据开发手册
小红书笔记详情API可获取指定笔记的标题、正文、互动数据及多媒体资源,支持字段筛选与评论加载。通过note_id和access_token发起GET/POST请求,配合签名验证,广泛用于内容分析与营销优化。
|
3天前
|
人工智能 文字识别 自然语言处理
数智化改造ERP的真实实操记录:从传统到智能的落地过程
本文分享了基于JBoltAI框架对传统ERP系统进行低侵入式数智化改造的实战经验。针对数据录入繁琐、流程协同不畅、决策缺乏支撑等痛点,通过集成AI能力,实现采购合同解析、库存智能预警、财务自动报销、生产智能助手等场景自动化。依托JBoltAI的文档处理、RAG知识库、Agent智能体与Function调用等特性,在不重构原有SpringBoot架构的前提下,完成AI赋能,显著提升效率与决策水平,为传统ERP转型提供可复用的技术路径。
38 0
|
6天前
|
存储 SQL 运维
Hologres Dynamic Table:高效增量刷新,构建实时统一数仓的核心利器
在实时数据架构中,Hologres Dynamic Table 基于有状态增量计算模型,有效解决“海量历史+少量新增”场景下的数据刷新难题。相比传统全量刷新,其通过持久化中间状态,实现复杂查询下的高效增量更新,显著降低延迟与资源消耗,提升实时数仓性能与运维效率。
|
3月前
|
人工智能 缓存 运维
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
本文介绍联调造数场景下的AI应用演进:从单Agent模式到多Agent协同的架构升级。针对复杂指令执行不准、响应慢等问题,通过意图识别、工具引擎、推理执行等多Agent分工协作,结合工程化手段提升准确性与效率,并分享了关键设计思路与实践心得。
629 20
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
|
2月前
|
Linux 编译器 开发工具
AlmaLinux 9.7 正式版发布 - RHEL 二进制兼容免费发行版
AlmaLinux 9.7 正式版发布 - RHEL 二进制兼容免费发行版
160 0
AlmaLinux 9.7 正式版发布 - RHEL 二进制兼容免费发行版
|
1月前
|
BI
Quick BI使用案例04:一图多看:实现同一图表时间粒度(年/月/日)自由切换
本文详解如何通过查询控件联动和维度组功能,实现图表内年、月、日时间粒度的动态切换,提升分析效率与仪表板可用性。
|
10月前
|
SQL 弹性计算 运维
Hologres计算组实例&分时弹性入门实践
本文由骆撷冬(Hologres PD)撰写,围绕Hologres计算组实例与分时弹性的入门实践展开。内容分为三部分:第一部分介绍Hologres计算组实例的原理与架构,解决负载隔离、资源浪费、大任务和运维难题;第二部分演示计算组实例的入门实践,包括管理、授权、连接及监控等操作;第三部分讲解分时弹性的使用,涵盖配置方法、成本优化及监控告警。通过具体案例与操作步骤,帮助用户更好地理解和应用Hologres的弹性计算能力。