基于通义千问32B及RAG技术的CACA指南诊疗规范平台落地实践

简介: 本方案整合CACA智能导航系统与基于RAG的大模型医疗问答系统,旨在提供高效、精准的肿瘤诊治支持。通过指南AI导航、知识图谱查询等功能,优化医生诊疗流程,提升患者服务质量,实现医疗资源的有效利用。

概述

本技术落地方案旨在整合CACA智能导航系统和基于RAG与大模型技术的医疗问答系统,以提供一个全面、智能化的肿瘤诊治支持工具。该方案将结合两大系统的优势,实现肿瘤诊治知识的系统化管理和智能化应用,提高医生的诊疗效率和质量,同时为患者提供个性化、精准的医疗服务。

CACA智能导航系统

系统目标

CACA智能导航系统由中国抗癌协会指导,中国抗癌协会个案管理专业委员会主办。该系统基于《中国肿瘤整合诊治指南(CACA)》,结合大数据及人工智能技术,为医生提供指南AI导航、指南思维导图、指南模拟考试等多种功能,旨在提高医疗服务的质量和效率,为患者提供更好的健康管理体验。

系统功能与服务

  1. 指南AI导航:利用人工智能技术,辅助医生快速找到相关的诊治指南,支持临床决策。
  2. 指南思维导图:以图形化方式展示指南内容,帮助医生和患者更好地理解治疗流程。

基于RAG与大模型技术的医疗问答系统

系统介绍

系统设计了一个基于RAG与大模型技术的医疗问答系统,利用CACA指南数据与Neo4j构建知识图谱,通过精确的知识检索和问答生成,提升系统在医疗咨询中的性能。

系统功能与服务

  1. 知识图谱构建:利用Neo4j构建医疗领域的知识图谱,为大模型提供精确的外部信息。
  2. 实体识别(NER):通过规则匹配的方式构建实体识别数据集,优化实体名字,提升模型性能。
  3. 意图识别:设计Prompt,结合上下文学习与思维链技术,采用大语言模型对用户的提问进行意图识别。
  4. 知识图谱查询:为每一个意图设置查询语句,实现精确的知识检索。

技术落地方案

整合策略

  1. 数据整合:将CACA智能导航系统的指南数据与基于RAG的医疗问答系统的知识图谱数据进行整合,实现数据互通。
  2. 功能互补:CACA智能导航系统的指南AI导航与基于RAG的医疗问答系统的知识图谱查询功能相互补充,提供更全面的决策支持。
  3. 用户界面统一:统一用户界面,提供注册、登录、大模型选择、多窗口对话等功能,提升用户体验。
    image.png

构建知识图谱

  1. MAC平台安装:brew install neo4j。
  2. 数据初始化及导入:按照平台需求进行数据整理及导入工作

技术文档:医疗智能问答机器人 Web UI (webui.py)

概述

本文档提供了医疗智能问答机器人Web UI的详细技术说明。该系统是一个基于Streamlit框架构建的Web应用,用于与用户进行医疗相关的问答交互。系统后端集成了自然语言处理(NLP)模型,包括实体识别和意图识别,以及一个基于Neo4j的知识图谱,用于提供准确的医疗咨询服务。

功能模块

1. 模型加载 (loadModel)

  • 功能:加载命名实体识别(NER)模型和意图识别模型。
  • 输入cache_model,用于指定加载的模型。
  • 输出:返回BERT分词器、BERT模型、索引到标签的映射、规则、TF-IDF对齐结果和设备(CPU或GPU)。

2. 意图识别 (intentRecognition)

  • 功能:识别用户查询的意图,并将其分类到预定义的查询类别中。
  • 输入:用户查询select和选择的语言模型choose
  • 输出:识别的意图结果。

3. 属性提示 (attributePrompt)

  • 功能:根据实体和属性,从知识图谱中检索信息,并生成提示。
  • 输入:实体entity、属性attribute和Neo4j客户端client
  • 输出:生成的提示字符串。

4. 联系提示 (contactPrompt)

  • 功能:根据实体和关系,从知识图谱中检索信息,并生成提示。
  • 输入:实体entity、联系contact、目标类型target和Neo4j客户端client
  • 输出:生成的提示字符串。

5. 生成提示 (generatePrompt)

  • 功能:根据用户查询和识别的实体,生成用于意图识别的提示。
  • 输入:意图识别结果response、用户查询select、Neo4j客户端client等。
  • 输出:生成的提示、意图识别结果和实体识别结果。

6. 问答流 (problemStream)

  • 功能:处理问答流,生成回答。
  • 输入:提示prompt
  • 输出:生成的回答。

技术栈

  • JAVAScript:用于构建应用小程序界面。
  • JAVA:用于构建管理端界面。
  • Python:用于模型加载和推理。
  • MAXKB:用于生成回答。

使用说明

  1. 启动小程序后,用户可以在界面中输入患者疾病的详细信息。
  2. 系统将自动识别用户的意图,并从知识图谱中检索相关信息。
  3. 系统将生成回答,并在界面中显示给用户。
  4. 管理员可以通过侧边栏选项显示实体识别结果、意图识别结果和知识库信息。

预期成果

  1. 系统开发与部署:成功开发并部署整合后的CACA智能导航系统,实现指南知识的数字化和可视化。
  2. 诊疗效率提升:系统能够为医生提供智能化的决策支持,提高诊疗效率和质量。
  3. 医疗资源优化:通过系统实现医疗资源的优化配置,降低医疗成本。
  4. 医疗服务提升:加强医疗机构间的协作,提升医疗服务的整体水平。
    image.png
相关文章
|
2月前
|
负载均衡 测试技术 调度
大模型分布式推理:张量并行与流水线并行技术
本文深入探讨大语言模型分布式推理的核心技术——张量并行与流水线并行。通过分析单GPU内存限制下的模型部署挑战,详细解析张量并行的矩阵分片策略、流水线并行的阶段划分机制,以及二者的混合并行架构。文章包含完整的分布式推理框架实现、通信优化策略和性能调优指南,为千亿参数大模型的分布式部署提供全面解决方案。
586 4
|
2月前
|
人工智能 自然语言处理 数据库
RAG:打破大模型的知识壁垒
RAG:打破大模型的知识壁垒
322 113
|
2月前
|
人工智能 机器人 人机交互
当AI学会“看、听、懂”:多模态技术的现在与未来
当AI学会“看、听、懂”:多模态技术的现在与未来
306 117
|
2月前
|
机器学习/深度学习 缓存 自然语言处理
【万字长文】大模型训练推理和性能优化算法总结和实践
我们是阿里云公共云 AI 汽车行业大模型技术团队,致力于通过专业的全栈 AI 技术推动 AI 的落地应用。
1660 38
【万字长文】大模型训练推理和性能优化算法总结和实践
|
2月前
|
人工智能 安全 开发工具
C3仓库AI代码门禁通用实践:基于Qwen3-Coder+RAG的代码评审
本文介绍基于Qwen3-Coder、RAG与Iflow在C3级代码仓库落地LLM代码评审的实践,实现AI辅助人工评审。通过CI流水线自动触发,结合私域知识库与生产代码同仓管理,已成功拦截数十次高危缺陷,显著提升评审效率与质量,具备向各类代码门禁平台复用推广的价值。(239字)
525 24
|
2月前
|
文字识别 测试技术 开发者
Qwen3-VL新成员 2B、32B来啦!更适合开发者体质
Qwen3-VL家族重磅推出2B与32B双版本,轻量高效与超强推理兼备,一模型通吃多模态与纯文本任务!
2720 12
|
2月前
|
机器学习/深度学习 存储 并行计算
大模型推理加速技术:FlashAttention原理与实现
本文深入解析大语言模型推理加速的核心技术——FlashAttention。通过分析传统注意力机制的计算瓶颈,详细阐述FlashAttention的IO感知算法设计、前向反向传播实现,以及其在GPU内存层次结构中的优化策略。文章包含完整的CUDA实现示例、性能基准测试和实际部署指南,为开发者提供高效注意力计算的全套解决方案。
388 10
|
2月前
|
人工智能 文字识别 自然语言处理
从“看见”到“预见”:合合信息“多模态文本智能技术”如何引爆AI下一场革命。
近期,在第八届中国模式识别与计算机视觉学术会议(PRCV 2025)上,合合信息作为承办方举办了“多模态文本智能大模型前沿技术与应用”论坛,汇聚了学术界的顶尖智慧,更抛出了一颗重磅“炸弹”——“多模态文本智能技术”概念。
172 1
|
2月前
|
存储 人工智能 算法
大模型4-bit量化技术详解
本文系统阐述大语言模型的4-bit量化技术,深入解析GPTQ、AWQ等主流量化方法的原理与实现。通过详细的数学推导、代码实现和实验对比,展示4-bit量化如何将模型内存占用降低75%以上同时保持模型性能。文章涵盖量化感知训练、后训练量化、混合精度量化等关键技术,为开发者提供完整的模型压缩解决方案。
576 7
|
2月前
|
监控 算法 测试技术
大模型推理服务优化:动态批处理与连续批处理技术
本文系统阐述大语言模型推理服务中的关键技术——动态批处理与连续批处理。通过分析传统静态批处理的局限性,深入解析动态批处理的请求调度算法、内存管理策略,以及连续批处理的中断恢复机制。文章包含完整的服务架构设计、核心算法实现和性能基准测试,为构建高性能大模型推理服务提供全面解决方案。
365 3