亚马逊开发出有史以来最大的文本转语音模型

hailingke2024-02-18 18:17:54TechWeb.com.cn

2月18日消息,据外媒报道,亚马逊的一个人工智能研究团队宣布,他们开发出了有史以来最大的文本转语音模型。所谓“最大”,是指拥有最多的参数,使用最大的训练数据集。

外媒报道称,这个名为BASE TTS的新模型拥有9.8亿个参数,在同类产品中最大,在规模和能力上都超越了之前的迭代版本。它使用了10万个小时的录音(来自公共网站)来进行训练,其中大部分为英语语音,但也包括德语、荷兰语和西班牙语,这使它成为自然语音的新标准。

研究人员表示,尽管遇到了文本转语音引擎固有的困难,如发音错误或语调错误,但该模型在处理复杂的语言结构方面表现出了非凡的能力。

研究人员进一步指出,与之前的文本转语音模型相比,该模型提高了单词的发音质量。

外媒称,这一突破标志着文本转语音技术的发展向前迈出了重要的一步,在不久的将来有可能得到广泛的应用。

然而,该团队表示,为了避免滥用,BASE TTS不会向公众发布。相反,他们计划把它作为一种学习应用。(小狐狸)

YouTube新规定要求创作者披露视频中使用AI技术部分

YouTube日前宣布,现要求创作者向观众披露视频内容中使用人工智能技术制作的部分。该平台在CreatorStudio中引入了新的工具,当观众可能误认为视频中的人物、场景或事件是真实的,而实际上通过AI技术如修改、合成等方...

苹果要在中国上线AI 传正与百度阿里百川等谈合作

6月21日消息,本月苹果在演示人工智能服务时,展示了如自定义表情生成器等美国iPhone用户即将享受到的AI工具,但并未提及中国这个第二大iPhone市场。业内人士指出,由于OpenAI开发的ChatGPT等AI模型在中国不可用,苹...

外媒:英特尔计划将重点放在人工智能和芯粒等未来技术上

1月22日消息,据外媒报道,芯片制造商英特尔计划将重点放在人工智能和芯粒(别称“小芯片”)等未来技术上。英特尔是为数不多的既设计又制造自己芯片的半导体公司之一,而高通和苹果等竞争对手的芯片设计依赖于代工...

国内首个大模型安全一体化解决方案亮相:蚂蚁集团发布“蚁天鉴”

9月11日消息,今日,蚂蚁集团发布大模型安全一体化解决方案“蚁天鉴”。该方案包含了大模型安全检测平台“蚁鉴2.0”、大模型风险防御平台“天鉴”两大产品,拥有AIGC安全性和真实性评测、大模型智能化风控、AI鲁棒和...

OpenAI成立监督委员会评估AI安全,并已开始训练新的AI模型

5月28日消息,据彭博社报道,OpenAI成立了一个董事会委员会,用来评估其人工智能模型的安全性。这一举措距离该公司解散内部安全团队以及安全问题负责人离职仅数周时间。此前,OpenAI的治理问题受到了来自两位前董事...

上一篇:英国AI芯片厂商Graphcore寻求出售 已在同一家科技公司洽谈
下一篇:Sora刷屏视频出现多处失误 OpenAI回应:正在积极改进