腾讯混元发布并开源图生视频模型 上线对口型与动作驱动等玩法
3月7日消息,据腾讯混元官方公众号消息,腾讯混元发布图生视频模型并对外开源,同时上线对口型与动作驱动等玩法,并支持生成背景音效及2K高质量视频。
根据官方介绍,基于图生视频的能力,用户只需上传一张图片,并简短描述希望画面如何运动、镜头如何调度等,混元即可按要求让图片动起来,变成5秒的短视频,还能自动配上背景音效。
此外,上传一张人物图片,并输入希望“对口型”的文字或音频,图片中的人物即可“说话”或“唱歌”;使用“动作驱动”能力,还能一键生成同款跳舞视频。
目前用户可以通过混元AI视频官网体验,企业和开发者可在腾讯云申请使用API接口使用。
此次开源的图生视频模型,是混元文生视频模型开源工作的延续,模型总参数量保持 130 亿,模型适用于多种类型的角色和场景,包括写实视频制作、动漫角色甚至CGI角色制作的生成。
开源内容包含权重、推理代码和LoRA训练代码,支持开发者基于混元训练专属LoRA等衍生模型。目前可以在Github、HuggingFace等主流开发者社区下载体验。(周小白)
GPT4o发布后实测:拍照识图精准 语音交互丝滑点击图片跳转视频
通用AI代理Manus引发热烈关注 公司合伙人回应“付费邀请码”传闻全球首款通用AI代理Manus引发热烈关注和讨论后,ManusAI的合伙人张涛在社交平台上发布声明,对近期关于邀请码的传闻进行了回应。张涛首先对公众对Manus的关注表示感谢,并对以下三点进行了澄清:1.Manus从未开设过任...
消息称马斯克AI初创公司xAI融资50亿美元 估值达到500亿美元11月22日消息,据外媒报道,在5月底宣布融资60亿美元后仅半年,由马斯克创立并领导、推出了Grok系列模型的人工智能初创公司xAI,已在新一轮的融资中筹集到了50亿美元的资金,公司的估值也达到了500亿美元。在新融资5...
具身智能创企灵初智能宣布获高瓴、蓝驰领投天使轮融资11月13日消息,具身智能公司灵初智能宣布完成天使轮融资,本轮融资由高瓴创投(GLVentures)和蓝驰创投(LanchiVentures)领投。本轮融资完成后,灵初智能将继续推进基于强化学习算法的机器人技能集训练、场景化的数...
OpenAI宣布向未注册用户开放ChatGPT 但并不是最新版功能也有限制4月2日消息,据外媒报道,当地时间周一是西方流传已久的愚人节,有不少人在当天开玩笑整蛊他人,也有部分看热闹不嫌事大的人将大公司当成整蛊的对象,传播一些用户期待但却不实消息,这也导致当天的很多消息会受到怀...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...