MedRAG是南洋理工大学研究团队提出的医学诊断模型,通过结合知识图谱推理增强大语言模型(LLM)的诊断能力。模型构建了四层细粒度诊断知识图谱,可精准分类不同病症表现,通过主动补问机制填补患者信息空白。MedRAG在真实临床数据集上诊断准确率提升了11.32%,具备良好的泛化能力,可应用于不同LLM基模型。MedRAG支持多模态输入,能实时解析症状并生成精准诊断建议。
MedRAG的主要功能
-
MedRAG旨在通过集成知识图谱 (KG) 引发的推理来增强检索增强生成(RAG) 模型,尤其适用于医疗领域。该模型可帮助医疗专业人员根据患者表现生成诊断和治疗建议,从而提高诊断准确性并降低误诊风险,尤其适用于表现相似的疾病。
MedRAG 的主要功能包括:
- 知识图谱增强推理:集成诊断知识图谱,提升RAG模型的推理能力。
- 准确的诊断支持:即使对于复杂或类似的疾病,也能提供具体的诊断见解和个性化的治疗建议。
- 后续问题生成:主动生成相关的后续问题,以澄清模糊的患者信息并增强决策能力。
- 在真实世界和公共数据集上进行评估:与现有的 RAG 模型相比,在公共 DDXPlus 数据集和私人慢性疼痛诊断数据集 (CPDD) 上表现出卓越的性能
MedRAG 的核心设计:知识图谱引发的推理
MedRAG 方法解决了以下关键挑战:
- 知识图谱构建:采用分层聚合的方式构建疾病知识图谱,捕捉疾病、类别及其表现之间的复杂关系。
- 基于 RAG 的推理:将 EHR 检索与诊断知识图推理相结合,以提高诊断准确性。
- 个性化诊断建议:整合多层次信息,为医生提供个性化的治疗和随访问题。
MedRAG的技术原理
- 四层细粒度诊断知识图谱构建:解决了现有医学知识库粒度不够细、缺乏特定疾病症状对比信息的问题。研究人员通过疾病聚类、层次聚合、语义嵌入、医学专家知识和大语言模型增强等技术,构建了包含疾病类别、亚类别、具体疾病名称以及疾病特征的四层知识图谱。
- 诊断差异知识图谱搜索:用于匹配患者的症状与知识图谱中的诊断特征。核心流程包括临床特征分解,将患者描述拆解为独立症状表征;临床症状匹配,计算患者症状与知识图谱特征的相似度,定位最相似的症状节点;向上遍历,在知识图谱中找到最相关的疾病类别;诊断关键特征提取,识别对疾病鉴别最重要的表征。
- 知识图谱引导的LLM推理:传统RAG仅依赖检索到的病例进行诊断生成,MedRAG通过知识图谱增强LLM的推理能力。首先基于FAISS构建高效索引,精准定位临床相似性病例;随后匹配关键诊断特征,提取患者最具鉴别力的表征信息;接着通过LLM融合检索到的病例信息、诊断差异知识图和患者信息进行联合推理,生成精准诊断建议。
MedRAG的项目地址
- Github仓库:https://github.com/SNOWTEAM2023/MedRAG
- arXiv技术论文:https://arxiv.org/pdf/2502.04413