阿里巴巴正式发布其医疗大模型QuarkMed,它在一项模拟中国执业医师资格考试的测试中,取得了70%的惊人准确率,性能超越一众顶尖模型。
其成功的秘诀并非单一技术突破,而是一套严谨的组合拳:世界级的数据工程 (1T tokens的权威分级数据) 与独创的“四段式”训练心法,系统性地将通用AI锻造成领域专家。
更重要的是,该项目为行业揭示了两条关于AI可靠性的黄金法则:
- • 法则一:在高风险领域,RAG(检索增强生成)不是辅助,而是对抗幻觉、保证事实准确性的生命线。
- • 法则二:强化学习(RL)是能力边界清晰的“手术刀”,而非包治百病的“万能药”,其威力取决于目标的“可验证性”。
QuarkMed的强大,始于一个堪称“米其林星级”的“数据厨房”。
- • 海量与精细并重:这个厨房拥有约1T tokens的庞大医疗材料库。但真正的艺术在于精细化处理。团队通过医学专家构建的知识框架,对海量数据进行梳理,实现了对事实类知识点超过90%的覆盖,确保AI的“学识”既广博又系统。
- • 质量高于一切:为保证数据的“纯度”,QuarkMed设立了两道“滤网”。第一道是独创的A-E五级权威性分级,确保核心训练数据源于顶级指南和文献。第二道是技术“降噪” ,针对扫描版书籍等图片格式资料,训练了先进的视觉模型进行内容提取,将数据质量提升超30%。
- • 从“背诵”到“理解” :最精妙的一步,是教会AI像医生一样思考。团队通过一个“翻译”模型,将结构化的知识图谱(即“A导致B”这类逻辑关系)转化为AI能“读懂”的自然语言。这次“开窍”效果显著:在知识理解测试中,模型准确率从39%直接飙升至60.57%,实现了从“死记硬背”到“融会贯通”的质变。