苹果研究人员称其设备端模型 ReALM 性能优于 GPT-4,可大幅提升 Siri 智能程度
IT之家 4 月 2 日消息,虽然目前 Siri 可以尝试描述信息中的图像,但效果并不稳定。不过,苹果公司并没有放弃人工智能领域的探索。在最近的一篇研究论文中,苹果的人工智能团队描述了一种可以显著提升 Siri 智能的模型,而且他们认为这个名为 ReALM 的模型在测试中优于 OpenAI 的知名语言模型 GPT-4.0。
IT之家注意到,ReALM 的特别之处在于,它可以同时理解用户屏幕上的内容和正在进行的操作。论文将信息分为以下三种类型:
屏幕实体:指的是当前显示在用户屏幕上的内容。
对话实体:指的是与对话相关的内容。例如,用户说“打电话给妈妈”,那么妈妈的联系人信息就是对话实体。
背景实体:指的是与用户当下操作或屏幕显示内容可能并不直接相关的实体,比如正在播放的音乐或即将响起的闹铃。
如果能够完美运行,ReALM 将使 Siri 变得更加智能和实用。他们将 ReALM 与 OpenAI 的 GPT-3.5 和 GPT-4.0 进行了性能对比:
“我们同时测试了 OpenAI 提供的 GPT-3.5 和 GPT-4.0 模型,并为它们提供了上下文信息,让它们预测一系列可能的实体。GPT-3.5 只接受文本输入,因此我们只提供了文字提示。而 GPT-4 能够理解图像信息,因此我们为它提供了屏幕截图,这显著提升了它的屏幕实体识别性能。”
那么苹果的 ReALM 表现如何呢?
“我们的模型在识别不同类型实体方面均取得了显著进步,即使是最小的模型,在屏幕实体识别上的准确率也比原有系统提升了 5% 以上。与 GPT-3.5 和 GPT-4.0 的对比中,我们最小的模型与 GPT-4.0 的性能相当,而更大的模型则明显优于它。”
论文的结论之一是,ReALM 即使拥有比 GPT-4 少得多的参数,也能在性能上与之匹敌,并且在处理特定领域的用户指令时表现更加出色,这使得 ReALM 成为一种可以在设备端运行的、实用高效的实体识别系统。
对于苹果而言,如何在不影响性能的情况下将这项技术应用于设备似乎是关键所在,随着 WWDC 2024 开发者大会即将于 6 月 10 日召开,外界普遍期待苹果将在 iOS 18 等新系统中展示更多的人工智能技术成果。
赋能AI PC 美光推出基于LPDDR5X的LPCAMM2内存模块1月22日消息,近日美光宣布推出首款标准低功耗压缩附加内存模块LPCAMM2,提供从16GB至64GB的容量选项,为PC提供更高性能、更低功耗、更紧凑的设计空间及模块化设计。美光LPCAMM2模块采用LPDDR5XDRAM,与SODIMM产品相...
奥普发布4款新品 以科技创新满足消费需求迭代升级4月16日消息,近日,奥普家居股份有限公司揭晓了2024新品,用“科技创新”实现功能、体验、颜值、性价比和交付效率的全面升级。此次,奥普共发布了4款科技新品,每一款都实现了突破性的科技创新。第一款新品是奥普美...
中国移动发布“九天”人工智能基座5月24日消息,在中国移动人工智能生态大会上,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,为数字中国建设注入更加强劲动能。算力是AI+发展的基...
高德宣布逐步开放AI能力 将落地首个时空智能城市5月20日消息,高德地图旗下高德云图宣布将逐步开放云睿时空融合大模型和云境AI三维重建平台。高德称已经与浙江省衢州市达成合作意向,双方拟共同打造首个时空智能城市。高德地图副总裁、高德云图总经理董振宁表示,...
爆火的AI面试,逼疯打工人曾经出现在银行、外企、快消等领域的AI面试官,正在渗透到更多的行业。一位应聘酒店前台客服岗位的应届毕业生告诉Tech星球,虽然已经接到通知去线下面试,但她仍需去完成企业发来的AI面试。在线下面试现场,面试官也...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...