深层待解决问题
知识关联缺失
当前检索基于单点语义相似度,无法构建跨文档知识图谱(如“公司A收购事件”与“行业竞争格局变化”的隐含关联)。
推理-检索割裂
生成模型无法主动指导检索过程,形成“检索→生成”单向流水线,而非动态交互式推理。
例如:模型应能反问“您需要对比哪两个季度的数据?”以优化检索目标。
多模态理解不足
现有RAG主要处理文本,对文档中的图表、公式、流程图等信息利用率极低。例如研报中的股价趋势图无法被检索系统理解。
可信度量化困境
缺乏统一标准评估答案可靠性,用户难以判断“何时可信任RAG的输出”,导致存在潜在风险,例如金融场景中错误答案可能导致直接经济损失。
长上下文建模缺陷
当检索返回大量片段(如20篇文档)时,模型对超长提示词的尾部信息忽略率显著上升。
解决路径与前沿探索
检索增强
● 混合检索:融合语义搜索(Embedding)与关键词搜索(BM25)提升召回率
● 查询扩展:用LLM将用户问题改写为专业查询(如“钱放余额宝安全吗?”→“货币基金信用风险评估”)
● 递归检索:实现多跳推理(先查“美联储加息”,再查“科技股估值模型”)
生成控制
● 强制引用:要求模型标注答案来源位置(如:源自2023年报第5页)
● 置信度阈值:对低置信答案触发人工审核流程
● 结构化解构:将复杂问题拆解为子问题分步检索生成
优化分块
● 语义分块:按句子/段落边界切分而非固定长度
● 结构感知:保留表格、标题层级(利用Markdown/XML标签)
● 动态重叠:相邻块部分重叠避免上下文断裂