OpenAI发布全新旗舰生成式AI模型GPT-4o:语音对话更流畅,免费提供

sanjianke2024-05-14 08:58:09IT之家

5 月 14 日消息,OpenAI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o,该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。最让人惊喜的是,GPT-4o 将免费提供给所有用户使用。

OpenAI 首席技术官穆里・穆拉蒂 (Muri Murati) 表示,GPT-4o 将提供与 GPT-4 同等水平的智能,但在文本、图像以及语音处理方面均取得了进一步提升。

“GPT-4o 可以综合利用语音、文本和视觉信息进行推理,”穆拉蒂在 OpenAI 公司总部举行的主题演讲中表示。GPT-4 是 OpenAI 此前的旗舰模型,可以处理由图像和文本混合而成的信息,并能完成诸如从图像中提取文字或描述图像内容等任务,GPT-4o 则在此基础上新增了语音处理能力。

GPT-4o 的运行速度将大大提升,最大亮点在于其语音交互模式采用了新技术。OpenAI 一直致力于让用户通过语音与 ChatGPT 进行交流,仿佛与真人对话一般。然而,之前的版本由于延迟问题,严重影响了对话的沉浸感。GPT-4o 则采用了全新的技术,让聊天机器人对话的响应速度大幅提升。

注意到,发布会上 OpenAI 展示了使用 GPT-4o 进行语音对话的演示。演示者提问结束后,GPT-4o 几乎可以即时回应,并通过文本转语音功能进行朗读,让对话感觉更加自然逼真。

另一个演示展示了 GPT-4o 根据要求调整说话时语气,GPT-4o 可以根据指令改变声音,从夸张戏剧到冰冷机械,展现了出色的可塑性。最后,演示还展示了 GPT-4o 的唱歌功能。

以往,OpenAI 发布新版 ChatGPT 模型时,通常会将其置于付费墙之后。不过这次 GPT-4o 将免费提供给所有用户,付费用户则可以享受五倍的调用额度。

此外,OpenAI 还发布了桌面版的 ChatGPT 和新的用户界面。“我们认识到这些模型正变得越来越复杂,” 穆拉蒂说道,“但我们希望用户与人工智能模型的交互体验能够更加自然、轻松,让用户可以将注意力完全集中在与模型的协作上,而无需在意界面本身。”(远洋)

研究表明ChatGPT提供的建议比专栏作家更全面、更有帮助

12月26日消息,据外媒报道,最近的一项研究表明,OpenAI旗下的ChatGPT提供的建议比专栏作家提供的回复更平衡、更全面、更善解人意、更有帮助。在这项研究中,研究人员使用了支持GPT-4模型的付费版ChatGPT。然而,尽...

台积电量产特斯拉Dojo AI训练模块,目标到2027年将算力提高40倍

5月21日消息,据DigiTimes,台积电宣布开始利用其InFO_SoW技术生产特斯拉DojoAI训练模块,目标是到2027年通过更复杂的晶圆级系统将计算能力提高40倍。InFO_SoW(整合型扇出晶圆级系统封装)是“InFO”技术应用于高性...

谷歌CEO皮查伊深度解析谷歌史上最强大模型Gemini及即将到来的人工智能时代

12月7日消息,美国当地时间周三,谷歌发布了其新一代人工智能模型Gemini。Gemini反映了谷歌内部多年来在首席执行官桑达尔·皮查伊(SundarPichai)的监督和推动下所做的努力。此前负责Chrome和安卓业务的皮查伊是出...

发布会被指“演示造假” 华为回应!

5月16日消息,日前,华为在近期一场发布会上展示大模型文生图能力时疑似“翻车”。网传图片显示,华为在5月10日举行一场发布会上展示大模型文生图能力时,演示过程中因为运行时按下Ctrl-C中断,显示出了一段“time.s...

库克:苹果将在生成式人工智能领域“开辟新天地”

2月29日消息,苹果今日召开年度股东大会,会上,苹果CEO蒂姆・库克(TimCook)再次谈及了苹果的人工智能(AI)计划。库克表示,公司将在2024年在生成式人工智能领域“开辟新天地(breaknewground)”,他强调:“我们...

TAG:OpenAI AI
上一篇:Anthropic宣布在欧洲推出Claude聊天机器人,精通多种语言
下一篇:OpenAI创投基金继续扩大规模 支持多家人工智能初创公司