DeepSeek的爆红,指出了当下 AI 最大困境

liushuixinqing2025-01-29 14:45:48极客公园

近期,「横空出世」的 DeepSeek 是中国春节前的意外之喜,也震荡了大洋彼岸美国的应用商店、科技公司、甚至股市。

DeepSeek 在中美两区双登顶 App Store 免费榜第一;让英伟达一夜股价狂跌近 17%,市值蒸发 5890 亿美元,直接创下华尔街有史以来单日个股暴跌价值纪录,其他人工智能衍生服务的公司股价也纷纷大跌。

Meta 员工内部爆料称,DeepSeek 让公司进入恐慌模式,连夜成立四个专门研究小组;美国总统直言:DeepSeek 是对美国 AI 行业的当头棒喝。

Sam Altman 也被卷到了|图源:X

震惊、恐慌、难堪、好奇、赞许、骄傲……由 DeepSeek 引发的复杂情绪在中美两国的科技界里蔓延着。

但 DeepSeek 只是「横空出世」吗?除了深度求索公司强大的技术力之外,它的出现是否有迹可循?意外背后是否有着一种必然?

01

AI 行业的规模化困境

微软 Windows 部门前总裁,曾带领开发出 Windows 7、Windows 8 的科技老兵 Steven Sinofsky 近日在 X 上发表长文《DeepSeek 是不可避免的,原因如下)》,从技术史的角度,看到了 AI 行业如今的窘境,和 DeepSeek 问世的必然。

图源:X

在 Sinofsky 看来,DeepSeek 的出现是技术发展的必然。

当下 AI 的发展轨迹是堆叠在资本之上,因此大型的 AI 公司要么自身是科技巨头,比如 Google、Meta,OpenAI 与微软、xAI 背靠马斯克,要么凭借业内资源完成大额融资的初创公司,像是 Perplexity 和 Anthropic。

这些公司因为坐拥更好的资源,所以在 AI 的技术探索上,一直在用扩张的思路发展,买数据、买芯片、买算力、买人……这种用资本换扩张的路径,让美国的 AI 行业现在看起来像一场大型军备竞赛。

但 Sinofsky 回望计算机发展史,他发现了一个规律:创新会带来新的产品,纵向扩展(scale up)紧随其后,即持续推动产品演进成更高、更快、更强的版本,但这种模式会被横向扩展(scale out)所颠覆,「更快更强」会被「小巧但多」所取代。

以计算设备的发展为例,纵向扩展下,电脑从占据一整个房间的 ENIAC,演进到晶体管计算器,到可以放在办公桌上的集成电路计算机、再到沿用至今的微型处理器。但性能更强的桌面电脑,普及率和数量都不如横向扩展后的智能手机。

现代计算机演变史|图源:VOIDSTAR

带入到 AI,Sinofsky 认为过去五年的 AI 公司的发展思路就是纵向扩展:更大的模型、更多的参数、更强的计算能力。这是他们的先发优势,但也让他们陷入了大公司的惯性里,一直在做性能提升,而没有质的飞跃。

这也被 Sinofsky 称之为「规模化的困境」,在当下的 AI 行业里,尽管有许多技术进展,但代价是巨大的资本投入。训练集群的基础设施硬件,定期扫描互联网去训练数据,再到用户端调用服务,大模型的发展速度和资金的燃烧速度不相上下。

然而回望计算机发展史,技术发展的成本会逐渐下降而不是上升,AI 行业目前显然在背道而驰。

主要 AI 模型的培训成本|图源:新浪科技

02

DeepSeek 正在重塑 AI?

在技术史上,有许多「大卫与歌利亚」般的故事。当向上发展的规模化到达一定高度后,就必然会诞生做横向扩展的产品,它们重塑行业,也让巨头感到恐惧。

Sinofsky 以互联网举例,美国通讯巨头 AT&T 曾认为,构建互联网不能依靠一些「玩具型」的技术,而应该扩展电话网络,增加通讯设备,让信号更稳更强。原因很简单,他们坐拥通讯网络的基础设施。

然而真正互联网的构建,是依托于当时的小公司思科发明的路由器,蒂姆·伯纳斯-李发明的 HTTP、HTML 等协议和编码,网景开发的浏览器……这些个人和小公司当时都没有大量的资金和基础设施,但靠有限的资源构建起了互联网。

套用到 AI 行业,就是 DeepSeek。

它价少、性能强、好调用,它不依靠硬件堆砌,实现了和超大规模 AI 不相上下的推理效果,证明了大模型的发展,不是只有巨量的资本投入这一条路径。

DeepSeek 在这个意义上,摆脱了规模化的困境,创造了新的可能。也正是因为低成本,才能让它敢于开源,让更多人、更多初创公司能参与到 AI 的开发里。

就像 DeepSeek 创始人梁文锋在采访里所说「未来世界可能是一个术业有专攻的分工世界……我们认为现阶段是技术创新爆炸性增长的时期,长期来看,我们希望创造一个生态系统,让行业直接利用我们的技术和产出。拥有一个强大的技术生态系统更重要。」

人人用得起的 API|图源:DeepSeekMarc Anderson 所称,DeepSeek R1 的发布,宛如当年太空竞赛里,苏联率先把第一颗人造卫星送上太空,这是人工智能的「斯普特尼克时刻」,也是最令人惊叹、最让人印象深刻的突破之一。

然而在 DeepSeek 团队眼里,AI 不应该是军备竞赛,它不应该限于某家公司、某个平台、某个功能,而是如同互联网一般,拥有无限潜力的技术生态。

AI 的发展也符合了科技史的某种叙事,只是此前的科技故事一直由硅谷驱动,而这一次,颠覆性的创新的主角来自中国,且新章节才开始书写。

Bard 出局、Gemini 独立+收费,谷歌在 AI 大战中找到了感觉

作者|黎诗韵、LiYuan编辑|靖宇引领了人工智能先河、却因为谨慎错过了这一波大模型先机的谷歌——正在变得大胆和开放,在产品和生态上迎头赶上。北京时间2月8日21点,谷歌宣布了旗下最强大多模态模型Gemini(包括最大...

马斯克的AI聊天机器人Grok出现“幻觉”,误认为自己是OpenAI的产品

12月12日消息,近日,埃隆・马斯克旗下AI公司xAI推出了全新的人工智能聊天机器人Grok,并面向美国地区的Premium+X用户开放。据官方介绍,Grok采用了名为Grok-1的模型,与目前OpenAI旗下ChatGPT所使用的GPT-4模型完全...

欧盟宣布成立人工智能办公室,对AI进行监管

5月30日消息,当地时间5月29日,欧盟宣布成立人工智能办公室,对人工智能进行监管,支持可信人工智能的发展和使用,同时防范人工智能风险。该办公室由包括技术专家、律师和经济学家在内的140名成员组成,设有首席科...

消息称拼多多已杀入大模型领域,年薪百万招兵买马

11月22日消息,据Tech星球,拼多多已经成立了一个数十人的AI大模型团队,团队位于上海。据介绍,拼多多大模型团队将探索AI大模型在客服、对话等场景下的应用,且会拓展至其旗下跨境电商平台TEMU智能客服、搜索、推荐...

外媒评苹果新品发布会:AI对iPhone销量的即时提升有限

9月10日消息,美国时间周一,苹果在2024秋季新品发布会上推出了最新款iPhone、Watch和AirPods等硬件产品。iPhone16系列毫无疑问再次成为焦点。苹果押注,人工智能支持的iPhone将有助于提振销量,保持在中国市场的竞...

TAG:DeepSeek AI
上一篇:中国AI模型震惊硅谷 DeepSeek为何一夜火出圈?
下一篇:奇安信:DeepSeek遭美国IP网攻暴力破解