谜底揭晓:全网猜了一周的“DeepSeek V4”,竟是小米自研王牌
3月19日消息, 18日深夜,人工智能领域迎来了一场突如其来的“官宣”。
小米在一夜之间发布了三款自研大模型——MiMo-V2-Pro、MiMo-V2-Omni和MiMo-V2-TTS,不仅以强劲的性能参数震撼业界,也揭开了过去一周席卷全球开发者社区的一个“神秘谜团”。
目前,用户已经可以在网页端直接体验这些小米的最新大模型,还可以一键部署免费养龙虾。
匿名亮相
一周前,在全球最大的API聚合平台OpenRouter上,突然出现了两个代号为Hunter Alpha和Healer Alpha的匿名模型。上线伊始,它们便以惊人的调用量持续霸榜,短短几天内消耗量突破1万亿tokens,引发全球开发者社群的广泛关注与讨论。
由于其强悍的代码生成能力和复杂的任务处理表现,加之当时恰逢DeepSeek V4发布的传闻期,不少业内人士纷纷猜测,这很可能是DeepSeek的“马甲”型号。OpenClaw创始人Peter Steinberger甚至专门在社交平台X上发文,打听这两个匿名模型的身份信息。
然而,真相在3月18日深夜水落石出。小米正式揭晓,Hunter Alpha正是旗舰基座模型MiMo-V2-Pro的早期测试版本,而Healer Alpha则对应全模态模型MiMo-V2-Omni。这场持续一周的“匿名猜谜”,最终以小米的华丽登场画上句号。
网页端可体验,还能一键养龙虾
根据官方介绍,小米此次发布的三款模型,分别瞄准了智能体时代的三大核心能力:高强度的任务执行、全模态的理解交互,以及有温度的声音合成。
MiMo-V2-Pro作为旗舰基座模型,专为现实世界中高强度的Agent工作场景打造。其总参数量突破1万亿,激活参数达420亿,并支持高达100万tokens的超长上下文窗口。
在全球权威的大模型综合智能排行榜Artificial Analysis上,MiMo-V2-Pro位列全球第八、国内第二,在编程Agent、通用Agent和工具使用能力方面,与Claude Sonnet 4.6、GPT-5.2、Gemini 3.0 Pro等国际顶尖模型处于同一梯队。在OpenClaw标准评测榜单PinchBench上,它也拿下了全球第三的好成绩。
MiMo-V2-Omni则是面向复杂多模态交互的全能型选手。它融合了文本、视觉、语音的全模态感知能力,在音频理解上甚至超越了Gemini 3 Pro,支持超过10小时的连续长音频深度理解;图像理解能力也超过Claude Opus 4.6,逼近Gemini 3 Pro。在实际应用场景中,它可以像人一样操控浏览器——自主打开小红书研究手机配置、跨店比价,甚至转接客服砍价。
MiMo-V2-TTS则让智能体的声音真正“有温度”。基于自研的Audio Tokenizer和多码本语音-文本联合建模架构,经过上亿小时语音数据的训练,它支持东北话、四川话、粤语等多种方言,甚至能实现同一句话内的情感转折和高质量的歌声合成。
小米提供了Web端访问和API访问两种模式供用户使用最新的MiMo-V2系列大模型。
在网页端,用户除了可以直接和大模型对话互动外,还可以一键部署、体验免费养龙虾Xiaomi MiMo Claw。
API调用定价策略上,小米展现出极高的诚意:MiMo-V2-Pro的API定价仅为Claude Opus 4.6的五分之一,输入每百万tokens最低仅需1美元。
为何必须自研大模型?
在小米MiMo大模型的背后,站着一位被业内称为“天才少女”的关键人物——罗福莉。作为原DeepSeek核心成员,她在AI学术与工程领域早已声名鹊起。2024年,她正式加入小米,出任MiMo大模型负责人。
罗福莉的加盟,被外界视为小米AI研发从“应用集成”向“核心自研”跨越的重要标志。
2024年10月,小米AI团队与北京大学联合发布聚焦MoE与强化学习的论文,罗福莉作为核心作者亮相;2026年3月,她再次与北大合作,研发出统一的资源管理系统ARL-Tangram,在真实世界的智能体强化学习任务中,可将训练步骤持续时间缩短至多1.5倍,并节省高达71.2%的外部算力成本。这一突破,直接提升了小米大模型的训练效率和成本竞争力。她的团队,被认为正在为小米构建面向AGI时代的底层技术基石。
小米为何要在此时推出独立的自研大模型?答案或许藏在它的生态布局里。
小米拥有全球最大的消费级IoT平台,覆盖手机、汽车、智能家居等海量设备。小米集团合伙人、总裁、手机部总裁、小米品牌总经理卢伟冰此前曾透露,小米计划将玄戒自研芯片、HyperOS操作系统与AI助手进行“三合一”深度整合。只有掌握底层大模型的核心能力,才能在系统层面实现真正的原生智能体验,让AI流畅地调用设备权限、调度多任务,而不是简单地外挂一个“聊天机器人”。
小米的场景覆盖从语音唤醒到车载导航,从家居控制到办公文档,需要的是真正理解物理世界的全模态能力。当AI能力要嵌入小爱同学、MIUI系统乃至汽车座舱时,自研模型能从根本上控制推理成本,实现商业上的可持续。
这场深夜发布,或许正是小米迈向“AI+硬件”深度融合时代的重要转折点。(果青)
英伟达数十万芯片+亚马逊50亿美元豪赌沙特5月14日消息,美国政府正酝酿宣布一项面向沙特、阿联酋等中东国家的重要协议,将为该地区提供更广泛获取先进人工智能芯片的渠道。该协议预计将显著提升这些国家从美国科技企业——包括英伟达、AMD、Groq等采购AI芯片...
2024AI营销白皮书:73%的出海企业尝试采用AI进行营销提效5月30日消息,由易点天下X中国信通院西部分院人工智能创新应用联合实验室编撰的《2024AI营销白皮书:以AI+数据,寻求AGI时代下的出海营销增量新范式》(以下简称白皮书)显示,中国出海企业通过自动化和数字化工具,...
OpenAI CEO 奥尔特曼:GPT-6 将更快到来,会更懂用户8月20日消息,上周,OpenAI首席执行官萨姆・奥尔特曼(SamAltman)在旧金山向媒体透露了公司未来产品的发展方向,尽管GPT-5刚刚推出,但奥尔特曼已明确表示GPT-6已经在路上了,而且发布时间会比GPT-4和GPT-5之间的间...
大模型入秋到2024年的最后一个月,大模型依然是最热闹的赛道,没有之一。12月,智谱AI与阶跃星辰相继完成新一轮融资,OpenAI以直播的形式举办了一场长达12天的马拉松式新品发布会。但对从业者肖琳(化名)来说,年底的任何融资...
OpenAI宣布下周一直播演示ChatGPT和GPT-4更新 但不会有搜索引擎5月11日消息,据外媒报道,在人工智能领域走在行业前列的OpenAI,已在官网宣布,他们将在太平洋时间5月13日上午10点,也就是北京时间5月14日凌晨1点,进行网络直播,演示部分ChatGPT和GPT-4的更新。由于此前一天,曾...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...