百川智能宣布开源全球最强医疗大模型Baichuan-M3，能力超GPT-5.2-AI资讯-资讯-创佳网

1月13日消息，百川智能宣布开源新一代医疗大模型 Baichuan-M3，该模型具有强推理、低幻觉和端到端的严肃问诊能力，能像医生一样主动追问、逐层逼近，把关键病史和风险信号问出来，进而在完整的信息上进行深度医学推理。

据悉，Baichuan-M3在全球最权威的医疗 AI 评测 HealthBench 中以 65.1 分的综合成绩位列全球第一；在专门考验复杂决策能力的 HealthBench Hard 上，也以44.4分的成绩夺冠，首次在医疗领域实现了对 GPT-5.2 的全面超越。在OpenAI引以为傲的低幻觉领域，M3也实现了超越，幻觉率3.5全球最低。

同时，百川智能的医疗应用“百小应”已同步接入 M3，面向医生与患者开放相关能力。医生可借助它推演问诊与诊疗思路，患者及家属也可通过该应用更系统地理解诊断、治疗、检查与预后背后的医学逻辑。

Baichuan-M3开源：

Hugging Face 地址：https://huggingface.co/baichuan-inc/Baichuan-M3-235B

GitHub 地址：https://github.com/baichuan-inc/Baichuan-M3-235B

2025年8月，百川开源医疗增强大模型 M2 在 HealthBench 上力压 gpt-oss-120B、DeepSeek-R1 等同期所有开源模型，并在 HealthBench Hard 上取得 34.7 分的成绩，仅次于GPT-5，成为全球唯二突破 32 分的模型。

在M2 发布后的五个月里，百川团队对强化学习系统进行了全面升级，将原本以患者模拟器和静态 Rubric 为主的半动态反馈，升级为随模型能力不断演进的全动态 Verifier System。随着监督信号持续变细、变难，模型得以不断突破能力上限，使 M3 在复杂医学问题上的表现实现跃迁，不仅在 HealthBench 总分上超越 OpenAI 最新模型 GPT-5.2，也在 HealthBench Hard 上登顶，成为当前全球医疗沟通和推理能力最强的医疗大模型。

幻觉是这一代大模型技术范式的通病，更是AI进入严肃医疗的拦路虎。在大多数场景幻觉只是体验问题，而在严肃医疗场景可导致安全事件。

百川M3将医疗幻觉抑制前移至模型训练阶段，在强化学习过程中将医学事实一致性作为核心训练目标之一，将“知之为知之，不知为不知”直接作用于模型自身能力的形成过程。这一新的训练方法将医学事实可靠性内化为M3自身的基础能力，使其在不借助任何外部系统的情况下，依然能够基于自身医学知识进行稳定、可信的作答。通过将事实一致性约束融入训练流程，M3重构了幻觉抑制的训练范式，在不依赖工具或检索增强的纯模型设置下，医疗幻觉率3.5，超越GPT-5.2，达到全球最低水平。

除了强推理和低幻觉，端到端的问诊能力是本次M3最重要的一项突破。

百川团队提出了“严肃问诊范式”与“SCAN原则”，通过Safety Stratification（安全分层）、Clarity Matters（信息澄清）、Association & Inquiry（关联追问）与Normative Protocol（规范化输出），将临床问诊中高度依赖经验的思维过程，第一次系统性地“白盒化”。

围绕SCAN原则，团队借鉴医学教育里长期使用的 OSCE 方法，联合 150 多位一线医生，搭建了 SCAN-bench 评测体系，该体系以真实临床经验作为“标准答案”，将诊疗过程拆解为病史采集、辅助检查、精准诊断三大阶段，通过动态、多轮的方式进行考核，完整模拟医生从接诊到确诊的全过程。相比于HealthBench，SCAN-bench是更加全流程端到端的动态评测新范式。

同时，百川团队还使用原生模型训练方法取代角色扮演prompt，针对GRPO无法稳定进行长对话训练的问题，设计了新的 SPAR 算法，使模型能够在有限对话轮次中，把临床真正需要的关键问题问全、问准，把风险兜住，让输出经得起复核。百川团队在实验过程中发现，问诊准确度每增加2%，诊疗结果准确度就会增加1%。

评测结果显示，M3 在SCAN的四个维度均显著高于人类医生基线水平，并大幅领先于国内外顶尖模型，成功构建了从精准的临床问询、深度医学推理到安全可靠决策的闭环。

百川智能表示，从去年1 月初 OpenAI 发布医疗产品 ChatGPT Health，到今天 Anthropic 推出 Claude for Healthcare，AI 医疗正在全球范围内提档加速，竞争也正式进入深水区。在这场竞速中，作为国内唯一专注医疗的大模型企业，百川持续突破低幻觉率、端到端问诊和复杂临床推理等核心能力，已从“跟随者”跃迁为行业“引领者”与新范式的“定义者”，正以硬核实力扛起中国 AI 医疗发展的旗帜。（果青）

Waymo测试在无人驾驶出租车中集成谷歌Gemini AI助手，1200多行指令规范其行为

12月25日消息，据研究员JaneManchunWong发现，自动驾驶公司Waymo似乎正测试在其无人驾驶出租车中接入谷歌的Gemini人工智能聊天机器人，旨在集成一款能全程陪伴乘客并解答各类问题的人工智能助手。JaneManchunWong在...

ChatGPT又崩了 OpenAI：由上游提供商引起现已恢复

12月27日消息，今天凌晨，OpenAI宣布，旗下ChatGPT、Sora和API服务都产生了重大错误，大部分已经宕机数小时。OpenAI方面表示，造成此现象的原因是“上游提供商引发的问题”，并正积极着手解决。与此同时，OpenAI的独...

必应翻开新篇章，微软邀测AI摘要功能：要颠覆搜索体验

7月25日消息，微软必应官方博客昨日（7月24日）更新博文，表示已邀请部分必应（Bing）用户，在搜索结果中测试AI摘要功能。微软表示该功能结合搜索结果页面、生成式AI、大型语言模型（LLMs），通过生成式搜索动态响应...

扎克伯格官宣Meta Compute：布局“国家级”能源项目，打造全球顶级AI算力版图

1月13日消息，Meta公司首席执行官马克・扎克伯格（MarkZuckerberg）今天（1月13日）通过其Threads账号，正式宣布启动MetaCompute计划，旨在构建吉瓦（GW）级AI基础设施以加速实现“超级智能”。扎克伯格透露，Meta公...

AI智能体赋能教育，一起教育科技二季度营收2541万元

9月4日消息，一起教育科技公布2025年第二季度财报。截至6月30日，二季度实现营收2541万元，环比增长17.3%。毛利率57.5%，已恢复至历史健康水平。财报显示，在持续的成本控制和运营效率提升的作用下，根据美国公允会...

百川智能宣布开源全球最强医疗大模型Baichuan-M3，能力超GPT-5.2

如何选购kawai电钢琴？？2023年kawai选购攻略大全来了！

苹果招募生成式AI人才提供数十个大模型岗位

昆仑万维旗下Opera生成式AI服务海外用户数突破100万

创始人王慧文退出美团成AI公司光年之外唯一股东

百川智能宣布开源全球最强医疗大模型Baichuan-M3，能力超GPT-5.2

如何选购kawai电钢琴？？2023年kawai选购攻略大全来了！

苹果招募生成式AI人才 提供数十个大模型岗位

昆仑万维旗下Opera生成式AI服务海外用户数突破100万

创始人王慧文退出 美团成AI公司光年之外唯一股东

苹果招募生成式AI人才提供数十个大模型岗位

创始人王慧文退出美团成AI公司光年之外唯一股东