豆包视频生成大模型发布:支持多风格多比例的一致性多镜头生成

kouhong2024-09-24 16:06:55新浪科技

 新浪科技讯 9月24日下午消息,火山引擎总裁谭待正式发布豆包视频生成大模型。其特性包括高效的DiT融合计算单元、全新设计的扩散模型训练方法和深度优化的Transformer结构,可以实现更充分地压缩编码视频与文本,支持一致性多镜头生成,能够大幅提升视频生成的泛化能力,谭待表示,豆包视频生成大模型支持多风格多比例的一致性多镜头生成,可应用在电商营销、动画教育、城市文旅、微剧本等领域。

 此外,谭待表示,豆包大模型发布以来,使用量爆发式增长。豆包大模型日均tokens使用量超过1.3万亿,日均生成图片5000万张,日均处理语音85万小时。(罗宁)

谷歌AI Overviews引发争议: 给出胶水披萨和吃石头的AI建议

谷歌最新推出的AIOverviews功能近期在社交媒体上引发了广泛争议。用户们分享了AI给出的一些建议,包括在披萨上涂胶水和吃石头等,这些内容不仅令人困惑,甚至可能危险。这些争议性内容的传播,导致谷歌不得不手动禁...

马斯克称xAI 60亿美元融资是新增资金,部分投资者也是OpenAI股东

5月28日消息,埃隆·马斯克(ElonMusk)的人工智能初创公司xAI宣布,该公司已成功筹集到60亿美元资金,这是迄今为止规模最大的一轮风险投资融资之一。这笔资金将助力马斯克在人工智能领域追赶他曾共同创立的OpenAI。...

消息称马斯克旗下xAI最快本周完成融资,估值180亿美元

5月9日消息,彭博社报道称,埃隆・马斯克旗下的人工智能初创公司xAI最快将于本周完成本轮融资,估值约为180亿美元(备注:当前约1301.4亿元人民币),红杉是潜在投资者之一。彭博社上周还报道称,xAI将在新一轮融资...

库克:苹果将在生成式人工智能领域“开辟新天地”

2月29日消息,苹果今日召开年度股东大会,会上,苹果CEO蒂姆・库克(TimCook)再次谈及了苹果的人工智能(AI)计划。库克表示,公司将在2024年在生成式人工智能领域“开辟新天地(breaknewground)”,他强调:“我们...

亚马逊开发出有史以来最大的文本转语音模型

2月18日消息,据外媒报道,亚马逊的一个人工智能研究团队宣布,他们开发出了有史以来最大的文本转语音模型。所谓“最大”,是指拥有最多的参数,使用最大的训练数据集。外媒报道称,这个名为BASETTS的新模型拥有9.8...

上一篇:OpenAI劲敌Anthropic正考虑以300~400亿美元估值进行融资
下一篇:声网发布aPaaS灵动会议 AI成为下一代视频会议的新方向