“地球上最聪明AI”Grok 3发布,头部大模型之争愈演愈烈
北京时间2月18日中午,埃隆·马斯克的人工智能初创公司xAI发布了Grok 3大模型,马斯克称之为“地球上最聪明的人工智能”。Grok 3的发布,势必将现在已经炙热的模型之战推向新的高潮。
Grok3的现场演示
在当天的直播中,马斯克与该公司的三位工程师一起进行了现场演示,包括使用Grok3帮助火星飞船计算航天发射窗口,以及把俄罗斯方块和消消乐两款游戏“融合成一款”等。
尤其是工程师仅用“开发结合俄罗斯方块和宝石迷阵玩法的2D游戏”这一自然语言指令,Grok3完成核心代码生成与调试的演示令人印象深刻。
在演示的过程中,马斯克要求使用Grok 3使用pygame组件设计一款游戏,把俄罗斯方块和宝石迷阵缝合到一起。
同时还提示代码可能会很长,需要保存到一个文件当中,运行成功后,生成的游戏即保留了俄罗斯方块的经典玩法,而且还加入了“同色消除”的新规则。
在发布会上,马斯克放话,今后Space X的发射任务,包括2026年火星探索任务,都将会借助Grok 3进行AI辅助。
随后,在场的工程师要求Grok 3现场生成一段太空发射3D动画的代码,而在Grok-3生成代码后,马斯克团队运行这段代码,之后画面上显示出了飞船在地球和火星间往返的动画的演示,突出了Grok-3的编程能力,这对AI模型理解复杂物理知识的要求非常高。
马斯克对此表示,我们非常高兴能够推出 Grok-3,我们认为,在很短的时间内,它的功能比Grok-2强大一个数量级。这要归功于一支不可思议的团队的辛勤工作,我很荣幸能与这样一支优秀的团队合作。此外,他还预测,三年内,计算机将在各方面打破人类水平,实现诺贝尔奖级别突破。
推理能力超竞争对手
发布会演示显示,在数学推理、科学逻辑推理等多方面的性能表现上,Grok3和Grok-3 mini都超过或媲美Gemini、DeepSeek和ChatGPT等对手,此外xAI还推出了功能更为强大的Grok3 Thinking推理模式。
具体表现在Grok3 在 AIME'24(美国数学竞赛)、GPQA(研究生水平科学知识问答能力的基准测试)等测试中均取得了比 Gemini-2 pro、DeepSeek-v3、Claude 3.5 Sonnet 和 GPT-4o 更好的效果。
尤其在推理方面 ,Grok 3 Reasoning 和 Grok 3 mini Reasoning 在 AIME'24、GPQA 等测试中取得了压倒性的优势,最高分达到 96 分,超过了 o3 mini(high)、o1 和 DeepSeek-R1 等前沿模型。甚至在最新的 AIME 2025 评测中 ,Grok3 推理系列模型更是达到了 90 及以上的分数,稍微领先 o3 mini(high) 的 87 分。
此外,在 Chatbot Arena 评估中,Grok-3 的得分更是达到了 1400 分,同样超过了 Gemini 系列和 chatgpt-4o 和 DeepSeek-R1。
值得一提的是,GPT-4o和Gemini相比,Grok 3在处理复杂问题时不仅能给出正确答案,还能详细解释解题思路,帮助用户理解背后的逻辑。
除了数学、编程、推理能力超强外,Grok3的多模态能力也是提升明显,另外,Grok 3引入了DeepSearch,它能够扫描互联网和X平台(原Twitter),为用户提供信息摘要,帮助用户查找最新的科技信息。
在发布会现场,xAI团队预测2025年NCAA“疯狂三月”篮球赛的全部胜负结果,最终Grok 3给出了它认为的2025年NCAA冠军,具体预测正确与否,答案即将在3月揭晓。
xAI团队在直播中展示称,在训练Grok的过程中,团队搭建了大型算力集群,并克服了散热、电力等问题带来的挑战,用了122天让首批10万张GPU投入使用并正常运行,后续还计划将集群规模继续扩大一倍。
最后,马斯克表示,未来,最快一周后Grok 将获得“语音模式”。几周后,Grok 3模型将与 DeepSearch功能一起出现在xAI企业的API中。而当下一个版本完全发布时,我们将开源Grok的上一个版本。
颇具挑战意味的是,就在Grok 3发布前数小时,OpenAI首席执行官兼联合创始人SamAltman表示,对于高要求的测试者来说,试用GPT-4.5带来的AGI的感受体验,远比我预期的要深刻得多,看来GPT-4.5已经进入测试阶段,离正式发布也不远了。
可以预见,随着Grok-3的发布,头部AI大模型的竞争将愈演愈烈。(御风)
软件行业仍将人才供不应求 AI提升效率非替代人近期,人工智能技术蓬勃发展,其中生成式人工智能ChatGPT引发关注。这类新技术带来的创新,是否会对软件开发行业形成冲击?GitHubCEO托马斯·多姆克日前在TechCrunch活动上表示,人工智能和软件开发现在已经密不可分...
微软下一代Surface笔记本电脑将是首款真正意义上的「AI PC」根据WindowsCentral的报道,微软正准备通过新的人工智能功能升级其Surface产品线。未具名消息来源告诉该媒体,即将推出的SurfacePro10和SurfaceLaptop6将配备下一代神经处理单元(NPU),以及基于Intel和Arm的选项。...
OpenAI CEO被炒鱿鱼 微软仅提前1分钟获得消息新浪科技讯北京时间11月18日早间消息,据报道,人工智能初创公司OpenAICEOSamAltman的离职让业界颇感意外,就连背后的“金主”微软公司也不例外。当地时间周五,OpenAI董事会出乎意料地宣布,Altman将辞去公司CEO一...
IBM推出5亿美元的企业级AI风险投资基金11月21日消息,IBM宣布推出一项5亿美元的风险基金,对专注于加速企业级生成式AI技术和研究的初创公司进行投资,包括处于早期发展阶段和高速增长在内的一系列的初创公司。据介绍,IBM企业级AI风险投资基金采用差异化...
人形机器人进入量产阶段,价格已降至10万元以内8月23日消息,2024世界机器人大会于8月21日正式拉开帷幕。今年大会上,人形机器人是绝对的主角,展出的整机达到27款,创历届之最。据央视财经报道,博览会现场已成为各家研发企业展示和比拼的竞技场。人形机器人部分...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...