蚂蚁集团开源万亿混合推理模型Ring-2.5-1T 长文本推理效率提升3倍

l153358032026-02-13 15:48:02TechWeb.com.cn

2月13日消息,蚂蚁集团开源发布全球首个基于混合线性架构的万亿参数思考模型 Ring-2.5-1T,在长文本生成、数学推理与智能体任务执行上达到开源领先水平,为智能体(Agent)时代的复杂任务处理提供高性能基础支撑。 

在生成效率上,Ring-2.5-1T在32K以上长文本生成场景中,对比上代模型访存规模降低10倍以上,生成吞吐提升3倍以上。在深度思考能力方面,该模型在国际数学奥林匹克竞赛(IMO 2025)和中国数学奥林匹克(CMO 2025)自测均达到金牌水平(IMO 35分、CMO 105分)。同时,可轻松适配Claude Code等智能体框架与OpenClaw个人AI助理,支持多步规划与工具调用。

在多项权威基准测试中,Ring-2.5-1T 与 DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking、GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking 等主流开源与闭源模型进行了系统对比,在数学推理、代码生成、逻辑推理和智能体任务执行等高难场景中达到开源领先水平。尤其在深度思考(Heavy Thinking)模式下,Ring-2.5-1T在IMOAnswerBench、HMMT-25等数学竞赛推理基准和LiveCodeBench-v6代码生成基准中超越所有对比模型,展现了强大的复杂推理与跨任务泛化能力。

Ring-2.5-1T基于Ling 2.5架构,通过优化注意力机制,显著提升长文本推理的效率与稳定性。模型激活参数规模从前代的 51B 提升至 63B,但在混合线性注意力架构的支持下,推理效率相比上一代大幅提升。与仅具备 32B 激活参数的KIMI K2架构相比,在1T总参数量下,Ling 2.5架构在长序列推理任务中的吞吐表现依然优势显著,且随着生成长度增加,效率优势持续扩大。

随着AI大模型应用从短对话向长文档处理、跨文件代码理解、复杂任务规划等场景扩展,Ring-2.5-1T有效缓解了长输出场景下计算开销高、推理速度慢的问题。该模型的开源也体现了蚂蚁百灵团队在大规模训练基础设施、算法优化和工程落地方面的综合能力,为行业提供了高性能、高效率的智能体时代基础模型新选择。

目前,Ring-2.5-1T 的模型权重与推理代码已在Hugging Face、ModelScope等主流开源平台发布。官方平台Chat体验页和API服务将在近期上线。

孙正义自称为AI的忠实信徒,其将大幅超越人类智力

9月15日消息,软银首席执行官孙正义周四表示,人工智能能够帮助解决世界上一些最大的问题,并有可能超越人类的智慧。孙正义于周四Arm在纳斯达克上市前接受采访时说:“我认为这是人类第一次遇到比人类本身更聪明的东...

智能客服投诉同比增长超50%:转人工太难!答非所问成投诉焦点

6月10日消息,据媒体报道,全国智能客服的投诉已连续三年成为服务类投诉榜首,2024年投诉量更是同比增长超过50%。“转人工难、答非所问、缺乏温度”成为智能客服投诉焦点。本来三言两语可以解决的问题,却被反复兜圈...

DeepSeek爆火 在全球140个市场的应用商店下载量榜单排名第一

2月2日消息,据外媒报道,中国AI公司深度求索(DeepSeek)发布的DeepSeekAI智能助手爆火,关注度持续保持高位,在全球140个市场的应用商店下载榜上排名第一。根据Appfigures的数据,DeepSeek于1月26日在苹果公司的Ap...

315晚会曝光骚扰电话产业链:AI外呼机器人成帮凶

快科技3月15日消息,今晚的央视315晚会上,曝光了第七个行业乱象:骚扰电话产业链,AI外呼机器人成骚扰电话帮凶。据报道,一年多来,互联网上出现了很多所谓“外呼”业务的广告,这些外呼公司的核心业务,就是帮助商...

消息称字节跳动AI视频生成产品“即梦”考虑接入DeepSeek

2月26日消息,据“晚点LatePost”昨日报道,继飞书之后,字节跳动AI视频生成产品“即梦”正在考虑使用DeepSeek。DeepSeek的爆火也带来了需求溢出和联动玩法。报道称,比如先用DeepSeek生成更精细的视频脚本、再在即...

上一篇:联想杨元庆谈AI泡沫论:整体无泡沫,算力结构将迎来“二八倒置”
下一篇:2026春节出境“AI三件套”:药品现金变少 AI健康助手登场