ChatGPT 升级多模态交互 语音文本无缝合并打破体验边界

heiyubai2025-11-26 09:14:21TechWeb.com.cn

11月26日消息,OpenAI 正式宣布 ChatGPT 完成重大功能迭代,将原独立的 “语音模式”(Voice Mode)全面整合至主聊天界面,实现语音与文本交互的深度融合,用户无需切换模式即可同步获取语音应答、视觉呈现与文字转录服务。

据 OpenAI 官方博文披露,此前需单独启动的语音对话功能,现已完全嵌入主聊天窗口,用户通过语音提问时,系统不仅能以自然流畅的语音回应,还可实时生成对应的地图、图表、图片等视觉内容,同时自动完成语音转文字转录。

例如用户查询旅游路线时,既能听到语音导航指引,又能同步查看界面显示的路线地图,转录文本还可随时回溯查阅,大幅提升信息获取效率。

针对不同用户的使用习惯,OpenAI 特别保留了个性化选择空间。新版本在设置菜单中增设模式切换开关,偏好沉浸式音频体验的用户可一键恢复旧版独立语音模式,兼顾了功能升级与用户习惯的兼容性。
 

50万中国跨境商家,在海外靠AI“掘金”

“今年欧洲的体育用品订单明显变多了,我们的生产排期已经排到了9月份。”2024年巴黎奥运会开幕在即,在巴黎的机场、地铁、火车站以及香榭丽舍大街等地,推广中国外贸商家的广告已经铺天盖地。早在今年3月,阿里国际...

SK海力士将建新厂 提升HBM产能以应对AI领域高速增长需求

4月30日消息,据外媒报道,在去年年初OpenAI训练的人工智能聊天机器人ChatGPT大火,谷歌等厂商加速推进人工智能聊天机器人和大语言模型的研发及应用之后,就有外媒称高性能GPU、高带宽存储器(HBM)等领域,将迎来新...

为什么DeepSeek出现后,大厂们反而加大了算力基础设施投资?

3月7日消息,DeepSeek通过技术创新降低了对GPU等硬件的依赖,以更低的算力需求实现了世界一流的模型性能,这是其突然全球爆火的原因之一。题图:豆包AI按理说,DeepSeek的出现打破了全球人工智能行业里“拼算力炼模...

因非法收集用户虹膜信息,韩国对OpenAI CEO阿尔特曼的“世界币”项目开出罚单

9月26日消息,韩国个人信息保护委员会(PIPC)周四对加密货币项目Worldcoin(世界币)处以11亿韩元(备注:当前约579.9万元人民币)的罚款,原因是其在韩国非法收集了约3万名用户的虹膜信息并将其转移到海外。Worldc...

AI芯片企业Tenstorrent完成超6.93亿美元D轮融资,贝索斯家族办公室参投

12月3日消息,由著名芯片设计师吉姆・凯勒(JimKeller)担任CEO的AI芯片企业Tenstorrent美国加州当地时间昨日宣布以20亿美元(备注:当前约145.57亿元人民币)的投前估值完成超过6.93亿美元(当前约50.44亿元人民币...

上一篇:英伟达:我们为谷歌在AI方面的成功而高兴,但现阶段我们的芯片领先一代
下一篇:马斯克忙着搞机器人,特斯拉汽车销售陷困局