全球首发!百度蒸汽机2.0视频生成模型上线多人有声版
8月21日消息,百度蒸汽机(MuseSteamer)音视频一体化模型完成重大升级,Turbo版、Lite版、Pro版,及有声版全面开放,在行业内首次实现多人有声音视频一体化生成。
即日起,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台享受高性能视频生成服务。
据介绍,百度蒸汽机是全球首个中文音视频一体化生成的I2V模型,不仅支持环境音效,更支持多角色语音的一体化生成。百度蒸汽机2.0有声版模型让AIGC视频创作彻底告别了配音,创作者对完美视听语言的一切想象,只需要一张图和提示词。
这背后依托于百度蒸汽机视频模型的五大核心技术突破:行业首次实现多人有声音视频一体化生成,语音与唇形、表情、动作的毫秒级精准对齐,复杂场景下依然稳定;首创多模态潜在空间规划技术(Latent Multi-Modal Planner),自主协调多角色身份、情感与互动逻辑,保障电影级叙事连贯性;中文场景深度适配,以超98%的还原度精准呈现中文语音细节与情感表达;端到端电影级画质生成,通过精准主体动态刻画,打造真实细腻的人物表现力;大师级运镜控制,内置数十种专业镜头语言,精准响应文本指令,实现视觉细节与创意意图的完美对齐。
价格方面,针对不同需求用户,百度蒸汽机平台提供了梯度会员服务,价格低至行业同类产品的70%,生成5s视频仅需1.4元。
除此之外,新用户注册即可免费获得部分想象力值,平台还将在每周四创新推出"狂欢星期四"抽奖活动,用户最高可获18888点想象力值,实现"视频生成自由"。同时,基于持续丰富的特效能力,平台月月有生动有趣的特效赛事发布,参加即有机会赢得数万元大奖。(果青)
TechWeb微晚报:余承东晒华为Pura 80拍摄视频,苹果AI表现令人失望要闻一览:苹果macOS27将不支持英特尔芯片机型消息称国产特斯拉5月份出口2.3万辆美团解释为何布局巴西TikTok宣布在英国扩大投资分析师郭明錤评WWDC2025:苹果AI表现令人失望台积电5月营收107亿美元同比继续大增但环...
Photoshop制造商Adobe已收购印度AI视频创作平台Rephrase.ai11月24日消息,据外媒报道,Photoshop制造商Adobe已收购印度人工智能(AI)视频创作平台Rephrase.ai。虽然这笔交易的成本尚未披露,但此举有望加强Adobe的CreativeCloud产品套件。与许多软件供应商一样,Adobe最近几...
古尔曼:苹果在AI领域至少落后谷歌两到三年8月15日消息,昨天谷歌提前召开新品发布会,抢在苹果iPhone16系列发布前展示了Pixel9系列搭载的全新AI功能,引发业内广泛关注。彭博社记者马克・古尔曼称,苹果在AI技术方面至少落后谷歌两三年。谷歌在本次发布会上...
苹果市值两个交易日蒸发超过1万亿元 近5个交易日蒸发近1.4万亿3月6日消息,据外媒报道,在人工智能浪潮的推动下,英伟达股价在近一段时间大涨,市值已超过了2万亿美元,成为仅次于微软和苹果的美股市值第三大公司,要远高于英特尔、AMD等芯片厂商。但与英伟达股价大涨不同,此前...
同程旅行“程心AI”升级 新域名DeepTrip.com支持9种语言助力入境游3月24日消息,同程旅行发布“程心AI”升级版,从分析推理、产品功能、UI界面、多语种覆盖等方面实现多维度升级。与此同时,同程旅行还推出服务国内及国际游客的全新域名——“DeepTrip.com”,为9种语言的游客提供中...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...