全球首发!百度蒸汽机2.0视频生成模型上线多人有声版

kongxingshijie2025-08-21 19:27:26TechWeb.com.cn

8月21日消息,百度蒸汽机(MuseSteamer)音视频一体化模型完成重大升级,Turbo版、Lite版、Pro版,及有声版全面开放,在行业内首次实现多人有声音视频一体化生成。

即日起,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台享受高性能视频生成服务。

据介绍,百度蒸汽机是全球首个中文音视频一体化生成的I2V模型,不仅支持环境音效,更支持多角色语音的一体化生成。百度蒸汽机2.0有声版模型让AIGC视频创作彻底告别了配音,创作者对完美视听语言的一切想象,只需要一张图和提示词。

这背后依托于百度蒸汽机视频模型的五大核心技术突破:行业首次实现多人有声音视频一体化生成,语音与唇形、表情、动作的毫秒级精准对齐,复杂场景下依然稳定;首创多模态潜在空间规划技术(Latent Multi-Modal Planner),自主协调多角色身份、情感与互动逻辑,保障电影级叙事连贯性;中文场景深度适配,以超98%的还原度精准呈现中文语音细节与情感表达;端到端电影级画质生成,通过精准主体动态刻画,打造真实细腻的人物表现力;大师级运镜控制,内置数十种专业镜头语言,精准响应文本指令,实现视觉细节与创意意图的完美对齐。

价格方面,针对不同需求用户,百度蒸汽机平台提供了梯度会员服务,价格低至行业同类产品的70%,生成5s视频仅需1.4元。

除此之外,新用户注册即可免费获得部分想象力值,平台还将在每周四创新推出"狂欢星期四"抽奖活动,用户最高可获18888点想象力值,实现"视频生成自由"。同时,基于持续丰富的特效能力,平台月月有生动有趣的特效赛事发布,参加即有机会赢得数万元大奖。(果青)

TechWeb微晚报:余承东晒华为Pura 80拍摄视频,苹果AI表现令人失望

要闻一览:苹果macOS27将不支持英特尔芯片机型消息称国产特斯拉5月份出口2.3万辆美团解释为何布局巴西TikTok宣布在英国扩大投资分析师郭明錤评WWDC2025:苹果AI表现令人失望台积电5月营收107亿美元同比继续大增但环...

Photoshop制造商Adobe已收购印度AI视频创作平台Rephrase.ai

11月24日消息,据外媒报道,Photoshop制造商Adobe已收购印度人工智能(AI)视频创作平台Rephrase.ai。虽然这笔交易的成本尚未披露,但此举有望加强Adobe的CreativeCloud产品套件。与许多软件供应商一样,Adobe最近几...

古尔曼:苹果在AI领域至少落后谷歌两到三年

8月15日消息,昨天谷歌提前召开新品发布会,抢在苹果iPhone16系列发布前展示了Pixel9系列搭载的全新AI功能,引发业内广泛关注。彭博社记者马克・古尔曼称,苹果在AI技术方面至少落后谷歌两三年。谷歌在本次发布会上...

苹果市值两个交易日蒸发超过1万亿元 近5个交易日蒸发近1.4万亿

3月6日消息,据外媒报道,在人工智能浪潮的推动下,英伟达股价在近一段时间大涨,市值已超过了2万亿美元,成为仅次于微软和苹果的美股市值第三大公司,要远高于英特尔、AMD等芯片厂商。但与英伟达股价大涨不同,此前...

同程旅行“程心AI”升级 新域名DeepTrip.com支持9种语言助力入境游

3月24日消息,同程旅行发布“程心AI”升级版,从分析推理、产品功能、UI界面、多语种覆盖等方面实现多维度升级。与此同时,同程旅行还推出服务国内及国际游客的全新域名——“DeepTrip.com”,为9种语言的游客提供中...

上一篇:快手二季度经调整净利润56亿元 日均活跃用户4.09亿创新高
下一篇:谷歌透露Gemini每次回答消耗能量:相当于微波炉运行1秒钟