周鸿祎谈GPT-4o:给人工智能装上了“眼睛耳朵嘴巴”
新浪科技讯 5月14日上午消息,昨日,OpenAI发布可实时进行音频、视觉和文本推理的新一代AI模型GPT-4o引发广泛关注。今日,360集团创始人、董事长周鸿祎发表视频分享了自己对于GPT-4o技术原理的理解和潜在的社会影响。
在谈及GPT-4o的技术原理时,周鸿祎指出,据OpenAI发布会上简短的技术原理介绍,区别于传统将把语音先翻译成文字处理后再翻译成语音的做法,这次的技术是直接把语音进行了处理,形成了一个整合的大模型引擎,实现对语音输入的直接理解——包括把语音中饱含的情绪、感情、语调、口音这些细节都进行了理解,同时是直接输出语音。
“这就带来了一个全新的体验,就是时延大概只有300毫秒左右,达到了人类和人类谈话的响应速度,这样不仅能听得懂你话里的情绪,在输出回答的时候也可以伴随着高兴、悲伤、失望、兴奋或者是更复杂的感情。”周鸿祎表示。
周鸿祎还指出,除了语音处理层面带来的惊艳之外,有一个容易被忽视的地方是,实际上GPT-4o的还可以直接打开手机摄像头,直接通过手机摄像头赋予它更强大的眼睛的能力。这个可能还比不上Sora,但是它比GPT-4.5的版本可以输入图片输入表格的能力又提升了一步。“所以总结来讲就是,GPT-4.0相当于给人工智能赋予了对知识理解的能力,相当于有了一个大脑,然后GPT-4.5相当于给了一些初级的看见的能力,而GPT-4o实际上是给它增加了真正能看懂这个世界的眼睛,和能听明白人说话的耳朵,而且嘴巴还能够自由自在地表达自己情绪和情感的能力。”。
在周鸿祎看来,有些人会对此次发布OpeanAI没有推出GPT-5.0觉得比较失望,但是通向通用人工智能不仅是要在超级的推理能力、知识能力、逻辑能力上要赶超人类,更重要的能力还包括跟人交互的能力。所以,当AI能通过无论是手机摄像头还是无处不在的物联网摄像头更看明白这个世界,而且能以跟人一样的响应速度进行交互的时候,这件事就变得非常可怕了,“也就是它就让人工智能真正的更像人了”。(文猛)
安全使用生成式AI,亚马逊首席安全官的3个问题和3条建议4月16日消息,近日,亚马逊首席安全官SteveSchmidt接受了《华尔街日报》的访谈,就生成式AI时代下的企业安全的热点议题发表观点,并提出可行建议。SteveSchmidtSteveSchmidt于2010年加入亚马逊,并在亚马逊云科技首...
投资者只想看 AI 赚钱,不想听 AI 烧钱作者|郑玥编辑|郑玄2024开年,海外互联网巨头开始兑现AI业务的商业化潜力。过去一周,谷歌、微软、Meta相继公布2024年一季度财报,三者有喜有忧。微软、谷歌财报发布后分别上涨4%、15%,后者更是触及历史新高;相比...
AI PC最新进展:超500款AI模型得以在Ultra处理器上优化运行5月6日消息,近日英特尔宣布在全新英特尔®酷睿™Ultra处理器上,有超过500款AI模型得以优化运行。这是市场上目前可用的业界出众的AIPC处理器,兼具全新AI体验、沉浸式图形和出色电池续航表现。这一重大里程碑是英特...
微软AI研究人员意外暴露大量内部数据,因云存储链接配置错误9月19日消息,一家网络安全公司的最新研究显示,微软公司的人工智能研究团队意外在软件开发平台GitHub上暴露了大量私人数据。有超过3万条微软员工通过Teams沟通的内部消息遭泄露。微软在收到警告后迅速删除了曝光数...
华为高级工程师回应“Pura 70 Ultra 手机 AI 消除衣服”争议:模型根据肉色人体背景自动补全IT之家4月26日消息,华为Pura70Ultra手机中的AI消除功能近日引发热议,据IT之家此前报道,这款手机中的自带图像编辑功能由盘古大模型提供AI消除技术,主打“可自动消除照片背景中的路人、杂物等”内容。不过近日有网...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...