谷歌发布 AI 图像生成新工具 Whisk,支持上传多张图片以图生图

daya2024-12-17 12:26:23IT之家

IT之家 12 月 17 日消息,谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具,该工具允许用户使用其他图像作为提示来生成图像,而不需要冗长的文本提示。用户只需提供图像,即可指定 AI 生成图像的主题、场景和风格。

使用 Whisk 时,用户可以为主题、场景和风格分别提供多张图像作为提示。(当然,用户仍然可以选择使用文字提示。)如果手头没有合适的图像,用户还可以点击骰子图标,由谷歌自动填充一些图像作为提示(这些图像似乎也是 AI 生成的)。此外,用户还可以在流程的最后阶段在文本框中输入一些文字,以添加关于目标图像的额外细节,但这并非必需步骤。

Whisk 随后会生成图像,并为每张图像生成相应的文本提示。如果用户对生成结果满意,可以选择收藏或下载图像;如果需要进一步调整,则可以通过在文本框中输入更多文字或点击图像并编辑文本提示来进行优化。

IT之家注意到,谷歌在一篇博文中强调,Whisk 的设计初衷是“快速的视觉探索,而非像素级的精细编辑”。该公司还表示,Whisk 可能会出现“偏差”,因此允许用户编辑底层的提示。

据体验者称,在短暂的使用过程中,Whisk 带来了有趣的体验。图像生成需要几秒钟的时间,虽然生成的图像有时会有些奇怪,但所有生成的内容都易于迭代修改。

谷歌表示,Whisk 使用的是其最新一代的 Imagen 3 图像生成模型,该模型也于今日发布。

蚂蚁集团:聚力发展坚持科技创新,2023年科研投入211.9亿元

6月13日,蚂蚁集团发布2023年可持续发展报告。报告显示,2023年蚂蚁集团科研投入达到211.9亿元,再创历史新高,蚂蚁科技投入的重点是人工智能和数据要素技术。蚂蚁集团董事长兼CEO井贤栋在报告致辞中说,面向未来,...

跌去2000亿美元,「AI卖铲人」英伟达怎么了?

AI需求是否强劲,「卖铲人」第一个感受市场水温。随着云厂商资本支出攀升引发的「AI泡沫论」甚嚣尘上,英伟达迎来了最受关注的财报季。当地时间周三收盘后,英伟达公布了2025财年Q2财报业绩表现,该季度,英伟达营收...

ChatGPT能记住你说的话了,OpenAI宣布小范围测试“记忆”功能

2月14日消息,OpenAI当地时间13日通过新闻稿宣布,当前正在小范围测试ChatGPT的“记忆”功能:记住用户在聊天中讨论过的事情,并避免重复信息。据介绍,用户可以控制ChatGPT需要记住的内容,可向ChatGPT发出明确指令...

比亚迪布局机器人:全球招聘具身智能人才

12月16日消息,据“比亚迪招聘”官微发文,比亚迪将面向2025届全球高校硕士、博士毕业生招聘具身智能研究团队。境内院校毕业时间为2024年9月~2025年8月,境外院校毕业时间为2024年7月~2025年12月。据悉,本次招聘涵...

Photoshop制造商Adobe已收购印度AI视频创作平台Rephrase.ai

11月24日消息,据外媒报道,Photoshop制造商Adobe已收购印度人工智能(AI)视频创作平台Rephrase.ai。虽然这笔交易的成本尚未披露,但此举有望加强Adobe的CreativeCloud产品套件。与许多软件供应商一样,Adobe最近几...

TAG:谷歌 AI Whisk
上一篇:这家普通人不熟悉的公司,市值如何超过万亿美元
下一篇:谷歌前CEO:中国人非常聪明 AI以惊人速度追赶美国