腾讯混元发布并开源图生视频模型 上线对口型与动作驱动等玩法

3月7日消息,据腾讯混元官方公众号消息,腾讯混元发布图生视频模型并对外开源,同时上线对口型与动作驱动等玩法,并支持生成背景音效及2K高质量视频。

根据官方介绍,基于图生视频的能力,用户只需上传一张图片,并简短描述希望画面如何运动、镜头如何调度等,混元即可按要求让图片动起来,变成5秒的短视频,还能自动配上背景音效。

此外,上传一张人物图片,并输入希望“对口型”的文字或音频,图片中的人物即可“说话”或“唱歌”;使用“动作驱动”能力,还能一键生成同款跳舞视频。

目前用户可以通过混元AI视频官网体验,企业和开发者可在腾讯云申请使用API接口使用。

此次开源的图生视频模型,是混元文生视频模型开源工作的延续,模型总参数量保持 130 亿,模型适用于多种类型的角色和场景,包括写实视频制作、动漫角色甚至CGI角色制作的生成。

开源内容包含权重、推理代码和LoRA训练代码,支持开发者基于混元训练专属LoRA等衍生模型。目前可以在Github、HuggingFace等主流开发者社区下载体验。(周小白)

GPT4o发布后实测:拍照识图精准 语音交互丝滑

点击图片跳转视频

通用AI代理Manus引发热烈关注 公司合伙人回应“付费邀请码”传闻

全球首款通用AI代理Manus引发热烈关注和讨论后,ManusAI的合伙人张涛在社交平台上发布声明,对近期关于邀请码的传闻进行了回应。张涛首先对公众对Manus的关注表示感谢,并对以下三点进行了澄清:1.Manus从未开设过任...

消息称马斯克AI初创公司xAI融资50亿美元 估值达到500亿美元

11月22日消息,据外媒报道,在5月底宣布融资60亿美元后仅半年,由马斯克创立并领导、推出了Grok系列模型的人工智能初创公司xAI,已在新一轮的融资中筹集到了50亿美元的资金,公司的估值也达到了500亿美元。在新融资5...

具身智能创企灵初智能宣布获高瓴、蓝驰领投天使轮融资

11月13日消息,具身智能公司灵初智能宣布完成天使轮融资,本轮融资由高瓴创投(GLVentures)和蓝驰创投(LanchiVentures)领投。本轮融资完成后,灵初智能将继续推进基于强化学习算法的机器人技能集训练、场景化的数...

OpenAI宣布向未注册用户开放ChatGPT 但并不是最新版功能也有限制

4月2日消息,据外媒报道,当地时间周一是西方流传已久的愚人节,有不少人在当天开玩笑整蛊他人,也有部分看热闹不嫌事大的人将大公司当成整蛊的对象,传播一些用户期待但却不实消息,这也导致当天的很多消息会受到怀...

上一篇:OpenAI将与甲骨文联手打造数据中心 部署6.4万块英伟达GB200
下一篇:字节不甘心