OpenAI o3 AI模型突破推理极限背后:成本飙升,没“钞能力”用不起

yinghuochong2024-12-24 09:53:37IT之家

 12 月 24 日消息,科技媒体 TechCrunch 昨日(12 月 23 日)发布博文,认为 OpenAI 的 o3 模型虽然在 ARC-AGI 等测试中取得了亮眼成绩,但背后的高计算成本,让其短期内很难在实际应用中普及。

o3 性能

o3 的新功能之一是可以调整推理时间,分为低、中、高三种计算级别,计算级别越高,o3 的任务执行性能越好。

而 o3 是 OpenAI 是迈向该目标的重要一步,在 ARC-AGI 基准测试中,o3 在高计算设置下获得了 87.5% 的分数,在低计算设置下得分为 75.7%,性能是 o1 的三倍。

在 EpochAI 的 Frontier Math 基准测试中,o3 解决了 25.2% 的问题(其他模型均不超过 2%),创造了新纪录。

o3 模型成本过高

ARC-AGI 基准测试的创建者 François Chollet 在博文中写道,OpenAI 的 o3 模型虽然是 AI 领域的一个重要突破,但成本着实太高。

根据 ARC-AGI 测试的性能图标,o3 的高分版本每项任务都使用了价值超过 1000 美元(备注:当前约 7303 元人民币)的计算资源,o1 模型每个任务使用约 5 美元的计算资源,而 o1-mini 仅使用几美分。

这意味着 OpenAI 虽然获得了将近 88% 的高分,但却消耗了 170 多倍的计算资源,而高计算版本 o3 整个测试下来,调用资源成本超过 1 万美元(当前约 73033 元人民币),只有财力雄厚的机构和个人才能负担得起 o3 模型的使用成本。

o3 模型的高计算成本使其更适合处理复杂问题,例如长期战略决策,而非日常小问题;更高效的 AI 推理芯片和更具成本效益的 AI 芯片可能是未来降低 o3 模型使用成本的关键。(故渊)

中国AI出海须防“TikTok式危机”

“我们的目标是星辰大海”,这句出自田中芳樹的著名太空歌剧《银河英雄传说》的话,是很多创业者喜欢的口头禅。这话激励了人们投身广阔而未知的海外市场。尤其是国内市场高度内卷,只要一个生意能赚钱,一大批同行竞...

IDC发布360、百度、夸克、天工等五大“AI搜索”APP评估报告

10月31日消息,今日,IDC发布《大模型驱动的移动端搜索引擎评估,2024》研究报告。报告从五个维度:用户体验、搜索能力、APP用户数据、AI能力以及安全保障,综合评估了360AI搜索、百度搜索、夸克、秘塔AI搜索、天工...

OpenAI的ChatGPT Mac版应用已向所有用户开放,支持语音对话

6月26日消息,OpenAI公司宣布,其首款适用于Mac的ChatGPT聊天机器人应用正式面向所有用户开放下载。此前一个月,该应用一直处于测试阶段,仅Plus付费订阅用户可以使用。OpenAI称,ChatGPT的Mac应用旨在与用户日常操...

番茄小说 AI 协议遭平台作家集体抵制?公司回应:已上线解除条款功能入口

IT之家7月23日消息,近期有不少网文作家发帖称,番茄小说签约协议中增加了“AI训练补充协议”,要求作者同意把作品“喂”给平台的AI,用于内容开发,引发不少作家反对。据新浪科技报道,对此番茄小说相关负责人表示...

OpenAI发布新模型GPT-4o,TechWeb实测来了!

5月14日消息,今日凌晨,OpenAI正式发布了新一代的旗舰模型GPT-4o,可以利用语音、视频和文本信息进行实时推理。据介绍,GPT-4o在英文文本和代码中的表现与GPT-4Turbo相当,但在非英文文本上的能力大幅提升,在视频...

TAG:OpenAI AI
上一篇:Counterpoint:生成式AI手机普及浪潮将至,写作辅助等成主要驱动力
下一篇:前谷歌CEO施密特警告:AGI自我改进时或需暂停发展,马斯克也称AI存在风险