百度文心4.5与X1登场后,大模型第一梯队的竞争再升级?
比预想中更快一步,3月16日,百度正式发布文心大模型4.5(以下简称文心4.5)及文心大模型X1(以下简称文心X1),在文心一言官网即可免费使用。
文心4.5不仅在基础能力上有大幅度提升,且具备原生多模态等能力,其多项基准测试成绩优于GPT4.5、DeepSeek-V3等,并且平均分达到79.6分,高于GPT4.5的79.14。文心X1不仅在性能上对标DeepSeek-R1,且具备更强的理解、规划、反思、进化能力,并支持多模态,是首个自主运动工具的深度思考模型。
和DeepSeek横空出世一样,文心4.5和文心X1不仅点燃了国内用户的热情,更让外网沸腾。在推特上,不少人纷纷在求百度测试账号,他们为两大模型优异的性能和超低的价格感到不可思议,不少人觉得百度的股价被低估了。甚至有人在百度推特账号下@萨姆·奥尔特曼,他们表示游戏结束了。
在看到文心新模型的表现后,在推特上拥有70万粉丝的美国投资人Bill Gurley感慨道,美国人工智能公司应将100%的时间用于开发和创新,而不是在华盛顿特区游说寻求保护以躲避竞争。这种情况很糟糕,明显暴露出缺乏自信。
两大模型的优异能力,是对过去3月外界对于“百度大模型掉队了”最有效的回应,也再一次证明了百度对AI战略贯彻到底的决心。毕竟,大模型竞技是一场持久战,拼的是耐力、技术、资本。从Transformer到OpenAI-o1和DeepSeek-R1,技术的更新时刻在发生,没有人可以保证永远领先,但关键的是敢拼的勇气。
所有玩家从来没有放弃和停止在大模型领域的努力,百度也是如此。开年以来,百度在大模型领域动作频频——文心一言完全免费、文心4.5将于6月30日正式开源;百度核心业务搜索接入DeepSeek;很快百度还会发布4.5系列模型,以及更前沿的下一代模型5.0版本。
动作频频的背后,透露出百度依然想留在牌桌上的决心,它也确实做到了。但百度并不能掉以轻心。因为,大模型的终局远未到来,包括百度在内,所有的玩家都必须全力以赴。这也是百度坚持不懈的根源。
百度加速变革:一场必要的战略纠偏
半个月之前,OpenAI举办了一场线上发布会,正式发布了其最新一代基础模型GPT-4.5。3月16日,百度并没有任何发布动作,而是直接上线了文心4.5与文心X1。
这场上线发生得悄无声息。有百度内部人士称,无论是文心4.5全面免费,还是PC和移动两端直接上线,百度管理层都是在半天之内做出的决策。
这似乎是现在的百度与过去的百度,以及行业的一场赛跑。
这一次的百度越来越快了。据百度方面透露,此次文心4.5和X1大模型发布之后,百度后续还会推出文心4.5系列模型,以及在下半年推出更先进的下一代模型5.0版本。
其实,此次模型迭代进程明显加快,并非偶然。这一现象背后,其实是百度对过往策略选择的反思与积极纠偏。
过去半年间,DeepSeek等新兴公司凭借开源、低成本的模式,给OpenAI、百度这类传统大模型巨头带来了不小的压力。如今,全球AI企业中,无论是OpenAI,还是百度,都逐渐意识到,大模型领域未来走向依旧充满变数,尚无定论。
激烈竞争的大模型领域,保持竞争力的关键在于果敢地 “求变”。于是,就在今年2月,比OpenAI更快一步,百度决定及时转变策略。
随后,百度创始人李彦宏就快速且坚决地推动了一系列动作:文心一言免费、核心业务搜索接入DeepSeek、文心大模型4.5系列将在6月30日正式开源等。
这次纠偏是文心一言对当下市场竞争的直接回应。从悄然上线文心4.5与X1,以及后续透露的一系列迭代计划,无一不彰显出百度谋求变革的坚定决心。
不过,百度突然加快脚步,让外界有人质疑它可能会迷失方向。但目前来看,百度的“变快”建立在对自身技术实力与市场趋势的研判上,每一次模型的迭代都伴随着技术架构的深度优化,以及性能的飞跃提升。
从百度自有业务来看,百度旗下多款用大模型重构后的AI应用,包括百度App、百度地图、百度网盘、百度文库等体验感都在持续提升。在此次文心4.5与文心X1上线后,这些应用也在迎来全方位升级。
让大模型产品,植入“原生技术内核”
作为百度重回牌桌的阶段性产品,原生多模态大模型文心4.5以及深度思考模型文心X1,究竟在哪些方面实现了蜕变与升级?
据了解,文心4.5是百度自主研发的新一代原生多模态大模型,通过多个模态联合建模实现协同优化,多模态理解能力优秀;具备更精进的语言能力,理解、生成、逻辑、记忆能力全面提升,去幻觉、逻辑推理、代码能力显著提升。
而文心大模型X1具备更强的理解、规划、反思、进化能力,并支持多模态,是首个自主运用工具的深度思考模型,兼备准确、创意和文采。
基于文心大模型4.5和文心大模型X1,Tech星球分别实测了一些应用场景。
我们上传了一段“体重管理年”的新闻视频,要求文心4.5概括新闻内容,可以看到其给出了准确的回答,证明了其跨模态的能力。目前,文心4.5支持上传的视频文件,兼容常见的格式,单个视频文件大小不超过20M。
在图片理解上,通过这个问题也能够看出在图形推理、图表分析的“高智商”以外,文心4.5还具备了理解梗图、漫画、歌曲、电影等多模态内容的“高情商”。
此外,文心4.5的能力也在图片生成、RAG(Retrieval Augmented Generation检索生成增强)测试、逻辑测试、文本创作等方面得到了很好地体现。
在文心X1的测试中能够看到,作为一个能力更全面的深度思考模型,其在逻辑问题中展现了周密的思考过程,且在答案的输出上更为明确、直接。
在文本创作类的问题中,也能够看出文心X1擅长写“锐评”,避免“端水”,回答尖锐有态度。
Tech星球获悉,文心X1在技术层面颇具创新,主要运用递进式强化学习训练方法,以思维链和行动链为依托开展端到端训练,还构建起统一的奖励系统,融入多元奖励机制。
凭借这些技术,文心X1能够在诸多场景中大显身手,包括中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算等。
此外,多工具调用是文心X1的特色之一。目前,X1已支持高级搜索、文档问答、图片理解、AI绘图、代码解释器、网页链接读取、TreeMind树图、百度学术检索、商业信息查询、加盟信息查询、词云生成等多款工具。
技术+场景,大模型的生态战
今年2月11日,李彦宏参加“世界政府峰会”WGS 访谈时曾表示,从技术的基础要素来看,核心主题依然是技术进步得非常快。成本每年降低约90%,并且性能越来越好。当技术发展如此之快,你必须持续投入,以确保处于技术创新的最前沿。
换句话说,大模型的竞争首先是技术实力的竞争,最直观的体现是价格。文心4.5输入价格为0.004元/千tokens,输出0.016元/千tokens,约为GPT4.5价格的1%;文心X1定价为输入0.002元/千tokens,输出0.008元/千tokens,是DeepSeek R1的一半。
效率得以大幅度提升,背后是百度通过全栈自研能力构建了“芯片层、框架层、模型层和应用层”的竞争壁垒。从昆仑芯三代万卡集群的算力支撑,到飞桨深度学习平台的开发者生态,再到文心大模型体系的多层次迭代以及AI重构的百度搜索、近亿用户的百度文库,每一层都有反馈,通过不断获得反馈,实现了端到端优化,大幅度提升效率。这也是百度近十年累计研发费用超过1800亿元的正向反馈。
成本的降低让百度有了实现AI普惠的底气,也为接下来文心4.5的开源打下了坚实的基础。通过开放模型权重、训练框架等核心能力,吸引开发者共建,百度会拥有更加繁荣的开发生态,构建更深的护城河。因为开源不仅是技术输出,更是生态卡位。
文心一言将于4月1日取消59.9元/月的付费墙,免费开放表面看是“割肉”,实则是双赢。这种“零门槛”的模式,让更多人可以享受技术进步带来的乐趣。同时,百度在4.3亿用户基数的基础上得以形成更大的数据飞轮效应,驱动模型持续优化。
开源和免费的战略转向是百度应对行业变局的标志性动作,它让每一个人都可以参与到创新中来。就像李彦宏所言,“创新不能被计划,你不知道创新何时到来,你所能做的就是营造一个有利于创新的环境。”
更重要的是,技术的终局从来不是参数的比拼,而是在于解决现实生活中的问题。百度已经将这种理念落地实践。被AI深度重构的百度搜索有超过20%的页面含有AI生成的内容,近亿用户使用的百度文库可以智能生成PPT、文档,已经成为“一站式AI内容创作平台”,其AI功能月活达9000万。
更进一步看,大模型比拼的不仅仅是技术实力,更是一场以技术生态为核心、以场景落地为驱动的生态战争。这也是百度和其他创业公司的根本区别,百度旗下拥有亿级用户的搜索、地图、文库等应用都是AI的落地试验场。
不仅如此,百度智能云千帆大模型平台预置了包括百度文心大模型在内的、国内外上百个主流基础大模型和行业大模型,还为大模型的持续预训练、精调、评估、压缩和部署等环节提供最完善易用的工具链,它已经帮助客户精调了3.3万个模型、开发了77万个企业应用。
站在大模型爆发的前夜,百度的转向证明:AI的未来属于激活生态的玩家,而非单一技术的掌控者。当开源成为行业标配,真正的竞争将聚焦于“如何让每个人在创新中获益”——这或许才是李彦宏“创新不能被计划”断言的终极答案。(任雪芸)
科大讯飞:与华为、韩端机器人在人工智能领域始终保持良好的合作与交流5月13日消息,近日有投资者在互动平台向科大讯飞询问:“公司与华为鸿蒙在AI应用领域的合作还有哪些规划?”对此,科大讯飞回答表示:您好,公司与华为、韩端机器人在人工智能领域始终保持良好的合作与交流。2024年3...
要做中国的OpenAI?字节跳动2024年研发开支接近BAT之和12月27日消息,浙商证券最新报告指出,字节跳动2024年在AI领域的资本开支达800亿元,接近百度、阿里和腾讯三家的总和(约1000亿元),显示其AI研发投入已显著领先同行。2025年字节跳动资本开支有望达到1600亿元,旨...
OpenAI突然推送高级语音模式,又抢了谷歌风头9月25日早,Google发布两款新模型Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。在谷歌的系列模型中,GeminiPro属于中号模型,付费用户可以使用。而GeminiFlash则由GeminiPro蒸馏而来,在今年5月的GoogleI/O上第一次亮...
Meta有意收购韩国AI芯片初创企业FuriosaAI 以提升自研能力2月12日消息,据外媒报道,当地时间周一的消息显示,在生成式人工智能方面走在行业前列的OpenAI在自研芯片,他们的首款芯片将在未来几个月完成设计,完成之后交由台积电采用3nm制程工艺流片,如果进展顺利,台积电在...
豆神教育发布“超拟人”AI导师,语言文学教育赛道迎来革新当AI与教育融合,会碰撞出怎样的火花?2024年10月30日,豆神教育在北京举行豆神辞源大模型“名师超拟人,AI新时代”产品发布会,推出自主研发的端模一体教育产品——豆神AI,将客户端与大语言模型深度结合,展开了未...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...