AI生视频:智谱“清影” VS 生数科技“Vidu”,谁胜出?

jiduhehe2024-08-20 10:05:17TechWeb.com.cn

8月19日消息,自OpenAI放出文生视频模型Sora后,国内AI生视频的产品研发脚步也加快了。上一期,我们测试了国内短视频领域的两家头部企业快手和抖音旗下的AI生视频产品“可灵” 和“即梦AI”的效果(详细情况可点击链接)

这一期,我们将测试国内两家AI创业企业推出的AI生视频产品,一个是智谱AI在7月26日推出的“清影”,另一个是生数科技在7月底推出的“Vidu”。

目前,智谱“清影”支持文生视频、图生视频,能生成6s时长的视频。免费使用,但是需要排队,如果想要加速,可以付费5元/天或199元/年。

Vidu同样支持文生视频、图生视频,提供4s和8s两种视频时长选择。目前,用户可以免费生成4秒视频,如果要生成8s视频,则需要付费,9.99美元/月或者95.99美元/月。

测试条件:

因此,这一期,我们选择了免费的默认设置下,清影(6s)和Vidu(4s)图生视频和文生视频生成的效果进行比较。

一、图生视频

从动物、风景、人物图片来测试比较。

第一个

使用一张含有“熊猫”的照片。

输入提示词要求:熊猫头抬起来,看向我,露出笑容

看看清影(6s)和Vidu(4s)的生成结果表现。

点击图片跳转视频

视频结果比较:

清影表现不错,熊猫抬头、挥手、微笑动作连贯。不过,熊猫在挥手的时候,手部有较明显失真。不过,有一个惊喜的地方是:原图片中左下角有一个自拍杆连接的手机在对熊猫进行拍摄。在生成视频的时候,清影似乎是试图让手机拍摄的熊猫画面也动起来。

Vidu这个视频就很尴尬了,除了首帧是原图外,之后视频出现的熊猫太突兀了,而且和原熊猫没有关系。

这一局PK,站清影(+1分)。

第二个

用一张含有上海东方明珠塔的风景图。

输入提示词要求:东方明珠塔从下往上依次亮起彩灯

看看清影(6s)和Vidu(4s)的生成结果表现。

点击图片跳转视频

视频结果比较:

清影生成的视频没有显示完整的图片内容,聚焦在局部,这一点受到图生视频最初对竖版图片选择的影响。不过,这也带来东方明珠塔局部更清晰的视频效果,从下往上、依次亮、彩灯这几个元素都有很好展现。清影聚焦局部细节,且背景一致性更稳定,感觉就像东方明珠塔在眼前一点一点亮灯了,真实感更好。

Vidu完整展示了东方明珠塔及亮灯,不过忽略了“从下往上依次”亮灯的需求,背景中云朵变幻非常快速,感觉像是视频被加了倍速。

这局PK站清影(+2分)。

第三个

用一张含有人物的图。

输入提示词要求:孩子翻动手中的书,并露出微笑

看看清影(6s)和Vidu(4s)的生成结果表现。

点击图片跳转视频

视频结果比较:

清影生成视频中,书、人物手、挥动胳膊都有明显失真。

Vidu生成视频中,小孩举起书翻动、仰头等动作,整体更连贯自然。

这局PK站Vidu(+1分)。

二、文生视频

第一个: 采用Sora经典视频的提示词,让清影和Vidu各自生成视频。

输入提示词:A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

看看清影(6s)和Vidu(4s)的生成结果表现。

点击图片跳转视频

视频结果比较:

清影生成的视频,前2s人物走动姿态还略显生硬,后续更自然。背景街道景物、远方及周围人的高度与主人公相比更为协调。

Vidu这个视频中,主人公特别突兀,其身高与周边路过和远方的人相比明显高出,显得格格不入。另外,背景街道景色过于模糊。

这局PK站清影(+3分)

第二个:

输入提示词文本:在桂林山水间,一位侠女乘坐竹筏前行,她穿着红色的长裙,手拿黑色的佩剑,注视着远方,阳光洒在水面,波光粼粼,有白云从山顶飘过。

看看清影(6s)和Vidu(4s)的生成结果表现。

点击图片跳转视频

视频结果比较:

清影对桂林山水、竹筏、红色长裙、阳光洒在水面,波光粼粼等都有不错的呈现。问题还是出在手拿黑色的佩剑上,有明显失真。

Vidu对竹筏理解有误,侠女乘坐的更像是小船,而且视频画面整体较为模糊。

这局PK,从清晰度上还是站清影(+4分)。

最后,总结一下:

这5局,Vidu生成的4s 视频大小在200K左右,清影生成的6s视频大小均超过2M。虽然Vidu号称生成的视频“分辨率最高达1080P”,但是就目前生成的视频来看,在清晰度上清影明显要更优。

从上面5五局PK来看,清影4局胜出Vidu。

大家觉得哪个更好呢?

知情人士称沙特计划设立基金投资人工智能 规模约400亿美元

3月20日消息,据外媒报道,在OpenAI训练的人工智能聊天机器人ChatGPT大火后,科技巨头们纷纷加大了在人工智能方面的投资,这一领域的初创公司也大量涌现,风投公司对这一领域的投资也大幅增加。而外媒最新的报道显示...

美国多家汽车经销商将AI用于车辆初步检查:1分钟内可生成全面报告

IT之家6月24日消息,当前AI几乎是“无处不在”,以汽车领域为例,有车载大模型语音助手,还有各种各样的智能辅助驾驶,不过AI的潜力还远不止于此。据Carscoops今日报道,美国多家经销商采用了AI系统用于车辆初步检查...

看齐微软!谷歌表示将保护用户免受人工智能版权诉讼

10月13日消息,当地时间周四谷歌表示,如果谷歌云(GoogleCloud)和谷歌办公套件(Workspace)生成式人工智能系统的用户被指控侵犯知识产权,谷歌将为其辩护。此前,微软和Adobe等公司也做出了类似承诺。谷歌等大型科技...

撤销此前诉讼后,马斯克再次起诉OpenAI及其CEO奥尔特曼

8月6日消息,据外媒报道,“天生爱搞事”的马斯克又有新动作了,他再次起诉OpenAI及其CEO奥尔特曼。五个月前,马斯克对OpenAI提起诉讼,声称该公司违反了合同,应再次回归非营利组织。两个月前,马斯克撤销了对OpenA...

OpenAI员工:提示词工程技能被夸大,学会和人打交道更重要

12月29日消息,作为提示词工程师,也就是聊天机器人ChatGPT等工具背后引导人工智能模型生成最佳输出的专家,你可能会获得颇为丰厚的报酬。然而OpenAI的一名员工表示,这项技能并不像看起来那么神奇。本周早些时候,O...

上一篇:AMD宣布以49亿美元收购数据中心解决方案供应商ZT Systems
下一篇:OpenAI开放GPT-4o定制功能,企业可更轻松打造专属AI助手