阿里万相视频生成大模型重磅开源!消费级显卡也能运行
2月26日消息,25日深夜,阿里云视频生成大模型万相2.1(Wan)重磅开源。
此次开源采用Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在Github、HuggingFace、魔搭社区下载体验。
据介绍,14B版本万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,在权威评测集Vbench中,万相2.1以总分86.22%大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置。
1.3B版本万相模型不仅超过了更大尺寸的开源模型,甚至还和一些闭源的模型结果接近,同时能在消费级显卡运行,仅需8.2GB显存就可以生成480P视频,适用于二次模型开发和学术研究。
官方表示,从2023年开始,阿里云就坚定大模型开源路线,千问(Qwen)衍生模型数量已超过10万个,是全球最大的AI模型家族。
在视频生成方面,万相2.1通过自研高效VAE和DiT架构增强了时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现了中文文字视频生成功能。
随着万相的开源,阿里云两大基模全部开源,实现了全模态、全尺寸大模型的开源。
自2025年1月DeepSeek爆火以来,开源已经逐渐成为国内外大模型领域的“标配”。
进入2月,字节豆包、昆仑万维、百度文心、阿里通义千问等纷纷推出自家的开源模型,加入这场开源热潮。(拾柒)
英伟达市值周二大增1.1万亿元 但仍不及上周四3月13日消息,据外媒报道,在人工智能热潮持续的推动下,英伟达的股价在今年已有明显上涨,市值也已超过2万亿美元,成为仅次于微软和苹果的美股市值第三大公司,与苹果公司的市值差距在上周四更是缩小到了3000亿美元...
前谷歌AI工程师徐鹏领导蚂蚁AGI部门随着人工智能时代的迅速发展,蚂蚁集团积极加大对AI领域的投入。据悉,蚂蚁集团已经在内部设立了AI创新研发与应用部门NextEvo,并聘任了徐鹏作为该部门的负责人。徐鹏曾在Google工作了11年,期间负责并领导了Google...
vivo发布自研蓝心大模型及蓝河操作系统 OriginOS 4同期亮相11月1日,2023vivo开发者大会在深圳举办,大会以“同心·同行”为主题,共设有1个主会场及9个分会场。会上,vivo正式发布自研蓝心大模型BlueLM、OriginOS4、自研蓝河操作系统BlueOS,以及在人文关怀、生态建设等领域...
市值暴跌超万亿,苹果急需AI大模型「新解药」在交出连续三个季度负增长的业绩后,苹果公司市值失守3万亿美元。上周五,苹果市值一天之内蒸发超万亿元,4.8%的跌幅也创下了去年9月以来的最大单日跌幅。而在美股8月7日的交易中,苹果股价下跌1.73%,市值再度蒸发5...
Anthropic 新研究:打错字就能“越狱”GPT-4、Claude等AI模型IT之家12月25日消息,据404Media报道,人工智能公司Anthropic近期发布了一项研究,揭示了大型语言模型(LLM)的安全防护仍然十分脆弱,且绕过这些防护的“越狱”过程可以被自动化。研究表明,仅仅通过改变提示词(pr...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...