阿里万相视频生成大模型重磅开源!消费级显卡也能运行

xiaofeng2025-02-26 10:17:26快科技

2月26日消息,25日深夜,阿里云视频生成大模型万相2.1(Wan)重磅开源。

此次开源采用Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在Github、HuggingFace、魔搭社区下载体验。

据介绍,14B版本万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,在权威评测集Vbench中,万相2.1以总分86.22%大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置。

1.3B版本万相模型不仅超过了更大尺寸的开源模型,甚至还和一些闭源的模型结果接近,同时能在消费级显卡运行,仅需8.2GB显存就可以生成480P视频,适用于二次模型开发和学术研究。

官方表示,从2023年开始,阿里云就坚定大模型开源路线,千问(Qwen)衍生模型数量已超过10万个,是全球最大的AI模型家族。

在视频生成方面,万相2.1通过自研高效VAE和DiT架构增强了时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现了中文文字视频生成功能。

随着万相的开源,阿里云两大基模全部开源,实现了全模态、全尺寸大模型的开源。

自2025年1月DeepSeek爆火以来,开源已经逐渐成为国内外大模型领域的“标配”。

进入2月,字节豆包、昆仑万维、百度文心、阿里通义千问等纷纷推出自家的开源模型,加入这场开源热潮。(拾柒)

英伟达市值周二大增1.1万亿元 但仍不及上周四

3月13日消息,据外媒报道,在人工智能热潮持续的推动下,英伟达的股价在今年已有明显上涨,市值也已超过2万亿美元,成为仅次于微软和苹果的美股市值第三大公司,与苹果公司的市值差距在上周四更是缩小到了3000亿美元...

前谷歌AI工程师徐鹏领导蚂蚁AGI部门

随着人工智能时代的迅速发展,蚂蚁集团积极加大对AI领域的投入。据悉,蚂蚁集团已经在内部设立了AI创新研发与应用部门NextEvo,并聘任了徐鹏作为该部门的负责人。徐鹏曾在Google工作了11年,期间负责并领导了Google...

vivo发布自研蓝心大模型及蓝河操作系统 OriginOS 4同期亮相

11月1日,2023vivo开发者大会在深圳举办,大会以“同心·同行”为主题,共设有1个主会场及9个分会场。会上,vivo正式发布自研蓝心大模型BlueLM、OriginOS4、自研蓝河操作系统BlueOS,以及在人文关怀、生态建设等领域...

市值暴跌超万亿,苹果急需AI大模型「新解药」

在交出连续三个季度负增长的业绩后,苹果公司市值失守3万亿美元。上周五,苹果市值一天之内蒸发超万亿元,4.8%的跌幅也创下了去年9月以来的最大单日跌幅。而在美股8月7日的交易中,苹果股价下跌1.73%,市值再度蒸发5...

Anthropic 新研究:打错字就能“越狱”GPT-4、Claude等AI模型

IT之家12月25日消息,据404Media报道,人工智能公司Anthropic近期发布了一项研究,揭示了大型语言模型(LLM)的安全防护仍然十分脆弱,且绕过这些防护的“越狱”过程可以被自动化。研究表明,仅仅通过改变提示词(pr...

TAG:阿里云 AI
上一篇:消息称字节跳动AI视频生成产品“即梦”考虑接入DeepSeek
下一篇:消息称字节跳动即梦考虑接入DeepSeek 移动端迎来新负责人