当面对多种不同格式的文档时,如何让AI系统更好地处理复杂文档?
作为一名企业IT技术采购负责人,在实践中探索了通过阿里云百炼大模型平台赋能,实现RAG企业知识库应用搭建的技术路径,在这里和大家分享一:利用百炼大模型平台的数据处理、知识库索引、原生应用创建和H5发布渠道,企业知识库用户可以登录阿里云访问授权应用,并基于用户角色权限对知识库数据、应用功能进行编辑和发布管理;该路径优势:1.百炼平台提供了优秀的智能文档Docmind预处理能力,当你尝试调用智能文档的API,会意识到经过预处理后,整个文档内的文本、图表、表格、公式等实体的各种属性包括二维坐标、文字信息、字体、颜色、符号标注等都被可靠提取出来,这些结构化处理形成的上下文信息,极大增强了RAG的检索生成能力表现;2.平台的用户学习门槛低,用户不需要具备编程开发技能,只需要通过配置和提示词工程,就能轻松实现平台原生应用的搭建与使用 3.平台应用有稳定可靠的阿里云平台基础技术支撑;该路径的不足:1.百炼平台的智能体原生应用目前不支持选择通义的视觉语言模型(qwen-VL),用户无法基于图片进行多模态交互;2.部分企业对知识库数据管理有强制本地存储和预处理的合规需求,不适用该方案
二: 调用百炼大模型平台的原生应用API和基础大模型API,在企业本地搭建RAG企业知识库的访问门户。这一路径中,用户通过企业自建的访问门户页面调用原生工作流应用API(workflow)或特定大模型API(qwen-VL),完善了路径一中无法基于图片进行多模态应用交互的场景,并基于该访问门户,对百炼大模型平台的应用需求和用户访问权限进行规范的集中管理;但该方案还是无法解决部分企业的数据合规需求
三:本地存储管理企业知识库数据,调用阿里云的智能文档API完成预处理,基于GTE本地模型实现向量化和重排,最终调用百炼平台的基础大模型API实现RAG检索应用生成。该路径极大满足了企业的数据管理合规需求,对知识库数据处理尽可能在本地完成;虽然创建知识库的过程中智能文档API调用会产生一个私有对象存储快照,但其在阿里云的存储生命周期只有12小时。同时,该路径也需要企业自身具备集成开发技术能力,才能高效实现RAG知识库数据的管理和应用表现的提升。
在2025年,企业需要根据应用场景,灵活选择RAG企业知识库搭建的技术路径进行生产实践;同时期待阿里云百炼大模型平台的基础模型和原生应用能齐头并进,与企业需求紧密结合,共同成长
赞22
踩0