DeepSeek阴影下的大厂
最后一个反击DeepSeek的主要玩家终于姗姗来迟。
2月18日晚间,马斯克的 xAI带着Grok3亮相直播。发布会上,马斯克强调,为了训练Grok3,用了 超过20万张 H100,总训练小时数达到两亿小时。而收获的成果是,在分数上,Grok3 超过了目前公开测试的所有模型,包括DeepSeek R1.。
马总的成果让不少推上观众开始觉得,大力出奇迹仍然是有效的。但很快,就有人发现,Grok3虽然刷分成绩优秀,实际表现却并不如想象中惊艳。比如它仍然无法识别9.11和9.90谁更大,给出的许多答案和建议也存在明显错误。
即便马斯克后续发文挽尊,表示Grok3每天都会改进,现在还只是个测试版,但昨晚的展示又进一步证明了DeepSeek带来的阴影——大力出奇迹并不是AI的唯一解,大模型的竞争关键正在从算力转向优质训练数据。
和试图反驳DeepSeek的美国同行不同,国内的大厂们纷纷拥抱了DeepSeek。
字节旗下的火山引擎官宣接入DeepSeek;百度不仅从闭源转向开源,还把核心的搜索业务也接入DeepSeek。
阿里巴巴在云服务、1688、天猫精灵、国际业务等多个板块都部署DeepSeek;让市场反应最大的,还是微信接入DeepSeek,在搜索栏新增了AI搜索的服务。消息一出,腾讯股价一度上涨至512港元,创下了2021年10月以来的最佳表现。
当下的情况在某种程度上印证的李彦宏的那句名言:在所有大厂都看好的情况下,创业公司成功的概率几乎为零。当行业发生重大转向时,去年还风头正劲的AI六小龙有些泯然众人,但大厂依然可以凭借自身业务去做落地场景开发,同时凭借自身的赚钱能力继续投入,留在牌桌上。
旧世界的分崩离析
2月10日,在法国巴黎大皇宫,AI学者、斯坦福大学教授李飞飞在“人工智能行动峰会上”发表演讲,并表示,“毫无疑问,历史学家今后一定会把这段时间称作‘真正的第一个AI时代'”。
新技术浪潮来临的特点之一,大概是正因为探索的是一片无人区,所以你永远不知道哪里是正确的方向。当所有人都以为通往AGI的道路只有“大力出奇迹”这华山一条路时,DeepSeek告诉你,往哪个方向都是路。
DeepSeek对过去路线的改变主要有三点:成本、开源和路径。
自AI浪潮诞生以来,所有的关键技术突破都在美国,因此硅谷的风向可以当作行业的风向。OpenAI认为算力能够解决一切,所以竞争的关键是足够的卡。
你能看到的是,即便是现在,马斯克仍然试图用20万张 H100、2亿训练小时去证明过去的路线。但事实是,虽然 Grok3 在大模型竞技场榜单上的得分排名第一,但是领先的分数并不多。
DeepSeek的例子证明了,算力虽然也重要,更重要的是数据质量,成本也存在大幅优化的空间。
国内大模型行业的风向也因此改变。
大厂对于AI这波机会的“FOMO”情绪是显而易见的。阿里、腾讯等大厂都投资了半数甚至半数以上的“AI六小龙”。不仅自己投,大厂也在自己造。
阿里分别推出了开源大模型Qwen系列和闭源大模型通义千问2.5;腾讯则推出了混元大模型;最早投入AI、也是最早跟上OpenAI节奏的百度则推出了文心一言。
相对于以上三家,字节的反应更慢,但是投入也更猛烈。根据《财经》报道,字节对大模型的投入“不设限”。豆包团队不仅规模达数千人,甚至不少人员都是字节加了50%甚至1倍的薪资,从其他大厂里挖来的。
根据浙商证券的分析,2024年字节跳动的资本开支约为800亿元,接近百度、阿里、腾讯三家的总和(约1000亿元)。
一个字节后来居上的例子是,在DeepSeek-R1横空出世之前,字节旗下的豆包日活已经来到了国内第一。
但是仅仅一个月,甚至没有任何成本,DeepSeek就超越它来到了行业第一。成为史上最快突破3000万日活的App。
只是一转眼,DeepSeek活成了豆包梦想的样子
根据《晚点LatePost》报道,在日前字节的全员会上,CEO梁汝波反思说去年 9 月 OpenAI 发布长链思考模型、成为行业热点后,字节意识到技术重大变化,但 “没有觉得要马上复现出来 ...... 现在回头看,如果一开始重大问题就争先,我们有机会更早实现。”
此前一直坚持闭源路线的百度也宣布免费和开源。
大厂的特权:一边加入一边追赶
几乎是没有任何犹豫的,互联网大厂们都选择了加入DeepSeek。
据了解,在年前和过年期间,多家大厂都开了线上电话会,要求完成DeepSeek的适配和接入工作。一方面,DeepSeek开源的比较彻底,下载、部署、使用非常方便;另一方面,作为目前讨论度最高的大模型,DeepSeek意味着巨大的流量,并且其创始人梁文锋致力于实现AGI,并没有想拿日活做文章的意思。
可以说,谁能吃到DeepSeek这波机会,至少取得了AI to c的先机。这也是这轮大厂to c业务调整的契机。
意料之外而又情理之中的是,动的最快的是腾讯。从产品来看,腾讯把DeepSeek接入了自家最核心的微信,灰度测试了AI搜索功能。并且腾讯地图、QQ音乐、腾讯文档都已经接入DeepSeek。
从组织层面来看,根据《智能涌现》报道,继今年1月腾讯元宝(全能AI产品)从TEG(技术工程事业群)转入CSIG之后,包括QQ浏览器、搜狗输入法、ima等更多产品和应用,将正式转入CSIG(云与智慧产业事业群)。
虽然第一个把DeepSeek接入核心产品的行为,并不符合腾讯“敢为人后”的风格,但理由也不难猜测。
此前行业普遍认为大模型的推理能力一定会出现,不过这个过程可能会很长。DeepSeek的出现一下把节点提前了,应用场景逐渐清晰起来。
以搜索为例。过去腾讯坐拥流量入口,但是在搜索这块始终折戟。行业的共识是,AI一旦出现,最先颠覆的一定是搜索,因为AI本身的能力能够让你在最短的时间内得到最想要的答案。腾讯旗下的游戏等业务也是AI落地的核心场景。
既然目前DeepSeek没有做to c的想法,也没有外部融资的计划,借助它的流量和能力,去培育自己的产品,何乐而不为呢?
其他几家大厂也都选择把DeepSeek接入自家业务,只不过步子迈的没有那么大。比如阿里旗下to B的钉钉率先接入了DeepSeek,在to c层面,阿里把夸克当作核心,同时和苹果的合作有望让阿里承接更多用户和流量。
大厂们也没放弃基础模型的研究。
从《晚点LatePost》的报道来看,字节重提务实的浪漫主义。针对AI,梁汝波提出了三个重点目标:意识追求智能上线,不忽略关键技术节点。二是探索新的交互。但是加强规模效应。同时成立探索通用人工智能(AGI)前沿研究的Seed Edge项目,项目员工的考核周期和目标也比其他员工放的更宽。
腾讯在微信搜一搜接入DeepSeek不久,就在腾讯元宝上线了自研的混元T1深度思考模型,围绕AI搜索场景打造自主的模型能力。
DeepSeek的惊喜本就不是颠覆式的创新,反而加重了行业“FOMO”情绪。有子弹的大厂一定不会放弃拿到AGI船票的机会。
写在最后
据了解,前任当红AI炸子鸡月之暗面也主动调整了策略。界面新闻报道,月之暗面近期决定大幅收缩产品投放预算,包括暂停多个安卓渠道的投放,以及第三方广告平台的合作,把主要精力放在模型能力的提升上。
而此前的AI六小龙里,阶跃星辰和MiniMax已经接入DeepSeek-R1模型,零一万物明确表示不做基础大模型,转向应用层开发。百川智能推出了以Baichuan-M1为底座打造的“AI儿科医生”,智谱AI则选择加码Agent智能体。
我们常常说大厂没有创业的土壤,但事实是创业公司在拿到风投的钱以后,也需要考虑到股东回报的问题,从而不得不把中心放到商业化上。
至于DeepSeek?它不缺钱。(路费)
Brilliant Labs发布全球首款集成多模态AI眼镜Frame2月9日消息,AI眼镜开发商BrilliantLabs宣布推出Frame,这是全球首款集成多模态AI助手的眼镜。Frame不仅重新定义了视觉方式,还重新定义了用户与物理世界的交互方式,而它的外观设计与真实眼镜无差别。此次Brilliant...
大模型,科大讯飞不能输的一战8月21晚间,科大讯飞发布了2024年半年度报告。尽管公司上半年实现营收93.25亿元,同比增长18.91%,但净利润却亏损至4.01亿元,同比下降644.59%;扣非后净利润继续亏损4.83亿元,同比下降58.86%,上年同期则亏损3.04...
清明节前AI复活亲人成热门生意:几十元到上百元不等随着清明节的脚步日益临近,思念亲人的情感愈发浓烈,而近日,一项名为“AI复活”的服务在市面上引起了热烈讨论。这一创新业务,通过利用人工智能技术,让逝去的亲人仿佛再次回到我们身边,成为了市场的热门话题。据...
阿尔特曼重申不出售OpenAI:不过是马斯克又一次干扰我们的手段罢了2月12日消息,据路透社报道,尽管埃隆・马斯克的律师表示,收购要约已发送给OpenAI的外部法律顾问,但OpenAI董事会尚未正式收到马斯克牵头的财团提交的竞购方案。阿尔特曼当地时间周二接受采访时表示,OpenAI并不出...
知情人士称OpenAI人工智能搜索产品有望于下周一推出5月10日消息,路透社援引两位知情人士的话称,OpenAI计划于下周一(5月13日)正式公布其人工智能搜索产品,不过报道中强调具体公告日期可能发生变化。OpenAI拒绝对路透社的报道置评。外媒TheInformation在今年2月的...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...