蚂蚁集团开源全模态大模型Ming-flash-omni 2.0 性能对标Gemini 2.5 Pro
2月11日消息,蚂蚁集团开源发布全模态大模型Ming-flash-omni 2.0。在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出。
据介绍,Ming-flash-omni 2.0是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。用户只需用自然语言下指令,即可对音色、语速、语调、音量、情绪与方言等进行精细控制。模型在推理阶段实现了 3.1Hz 的极低推理帧率,实现了分钟级长音频的实时高保真生成,在推理效率与成本控制上保持业界领先。
业内普遍认为,多模态大模型最终会走向更统一的架构,让不同模态与任务实现更深层协同。但现实是,“全模态”模型往往很难同时做到通用与专精:在特定单项能力上,开源模型往往不及专用模型。蚂蚁集团在全模态方向已持续投入多年,Ming-Omni系列正是在这一背景下持续演进:早期版本构建统一多模态能力底座,中期版本验证规模增长带来的能力提升,而最新2.0版本通过更大规模数据与系统性训练优化,将全模态理解与生成能力推至开源领先水平,并在部分领域超越顶级专用模型。
此次将Ming-flash-omni 2.0开源,意味着其核心能力以“可复用底座”的形式对外释放,为端到端多模态应用开发提供统一能力入口。
Ming-flash-omni 2.0基于 Ling-2.0 架构(MoE,100B-A6B)训练,围绕“看得更准、听得更细、生成更稳”三大目标全面优化。视觉方面,融合亿级细粒度数据与难例训练策略,显著提升对近缘动植物、工艺细节和稀有文物等复杂对象的识别能力;音频方面,实现语音、音效、音乐同轨生成,支持自然语言精细控制音色、语速、情绪等参数,并具备零样本音色克隆与定制能力;图像方面,增强复杂编辑的稳定性,支持光影调整、场景替换、人物姿态优化及一键修图等功能,在动态场景中仍保持画面连贯与细节真实。
百灵模型负责人周俊表示,全模态技术的关键在于通过统一架构实现多模态能力的深度融合与高效调用。开源后,开发者可基于同一套框架复用视觉、语音与生成能力,显著降低多模型串联的复杂度与成本。未来,团队将持续优化视频时序理解、复杂图像编辑与长音频生成实时性,完善工具链与评测体系,推动全模态技术在实际业务中规模化落地。
目前,Ming-flash-omni 2.0的模型权重、推理代码已在 Hugging Face等开源社区发布。用户也可通过蚂蚁百灵官方平台Ling Studio在线体验与调用。(周小白)
对标Genie 3 蚂蚁灵波开源世界模型LingBot-World1月29日消息,蚂蚁集团旗下灵波科技今日宣布全面开源世界模型LingBot-World。此前,灵波科技已先后开源空间感知模型LingBot-Depth以及具身大模型LingBot-VLA。业内人士指出,随着“灵波”系列连续发布三款具身领域大...
OpenAI首次在瑞士设立办公室,招募翟晓华等3名谷歌工程师推进研发多模态AI模型12月6日消息,OpenAI于12月3日发布公告,将在苏黎世(Zurich)建设新的办公室,这也是该公司首次在瑞士设立据点,目标是进一步拓展欧洲市场。OpenAI正在全球扩张,计划在多个城市设立新的办事处,包括纽约、西雅图、...
NVIDIA酝酿AI商业模式重大转变:要吃下整个蛋糕!11月14日消息,据报道,AI芯片巨头NVIDIA正酝酿商业模式的重大转变,计划从单纯的AI芯片或组件供应商,转向直接供应完整的AI服务器系统,意图在AI服务器供应链中占据“整个蛋糕”。传统上,NVIDIA的AI服务器供应链由...
OpenAI、软银和甲骨文将在美国建设5座AI数据中心 投资超过4000亿美元9月24日消息,据外媒报道,今年1月底,软银、OpenAI双双在官网宣布联手甲骨文等公司发起名为星际之门(Stargate)的项目,计划在未来4年投资5000亿美元,在美国打造新的AI基础设施。在投资庞大的星际之门项目宣布之...
被Meta挖走多名AI工程师后 苹果挖走了Meta的首席法务官12月5日消息,据外媒报道,从今年6月份开始,扎克伯格担任CEO的Meta在招揽AI人才方面动作频频,从OpenAI、苹果等公司挖走了多名顶尖AI人才,苹果是受影响较为严重的厂商,至少被挖走了6人,其中就包括了基础模型团队...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...