OpenAI o3 AI模型突破推理极限背后：成本飙升，没“钞能力”用不起-AI资讯-资讯-创佳网

12 月 24 日消息，科技媒体 TechCrunch 昨日（12 月 23 日）发布博文，认为 OpenAI 的 o3 模型虽然在 ARC-AGI 等测试中取得了亮眼成绩，但背后的高计算成本，让其短期内很难在实际应用中普及。

o3 性能

o3 的新功能之一是可以调整推理时间，分为低、中、高三种计算级别，计算级别越高，o3 的任务执行性能越好。

而 o3 是 OpenAI 是迈向该目标的重要一步，在 ARC-AGI 基准测试中，o3 在高计算设置下获得了 87.5% 的分数，在低计算设置下得分为 75.7%，性能是 o1 的三倍。

在 EpochAI 的 Frontier Math 基准测试中，o3 解决了 25.2% 的问题（其他模型均不超过 2%），创造了新纪录。

o3 模型成本过高

ARC-AGI 基准测试的创建者 François Chollet 在博文中写道，OpenAI 的 o3 模型虽然是 AI 领域的一个重要突破，但成本着实太高。

根据 ARC-AGI 测试的性能图标，o3 的高分版本每项任务都使用了价值超过 1000 美元（备注：当前约 7303 元人民币）的计算资源，o1 模型每个任务使用约 5 美元的计算资源，而 o1-mini 仅使用几美分。

这意味着 OpenAI 虽然获得了将近 88% 的高分，但却消耗了 170 多倍的计算资源，而高计算版本 o3 整个测试下来，调用资源成本超过 1 万美元（当前约 73033 元人民币），只有财力雄厚的机构和个人才能负担得起 o3 模型的使用成本。

o3 模型的高计算成本使其更适合处理复杂问题，例如长期战略决策，而非日常小问题；更高效的 AI 推理芯片和更具成本效益的 AI 芯片可能是未来降低 o3 模型使用成本的关键。（故渊）

“我们的目标是星辰大海”，这句出自田中芳樹的著名太空歌剧《银河英雄传说》的话，是很多创业者喜欢的口头禅。这话激励了人们投身广阔而未知的海外市场。尤其是国内市场高度内卷，只要一个生意能赚钱，一大批同行竞...

10月31日消息，今日，IDC发布《大模型驱动的移动端搜索引擎评估，2024》研究报告。报告从五个维度：用户体验、搜索能力、APP用户数据、AI能力以及安全保障，综合评估了360AI搜索、百度搜索、夸克、秘塔AI搜索、天工...

6月26日消息，OpenAI公司宣布，其首款适用于Mac的ChatGPT聊天机器人应用正式面向所有用户开放下载。此前一个月，该应用一直处于测试阶段，仅Plus付费订阅用户可以使用。OpenAI称，ChatGPT的Mac应用旨在与用户日常操...

IT之家7月23日消息，近期有不少网文作家发帖称，番茄小说签约协议中增加了“AI训练补充协议”，要求作者同意把作品“喂”给平台的AI，用于内容开发，引发不少作家反对。据新浪科技报道，对此番茄小说相关负责人表示...

5月14日消息，今日凌晨，OpenAI正式发布了新一代的旗舰模型GPT-4o，可以利用语音、视频和文本信息进行实时推理。据介绍，GPT-4o在英文文本和代码中的表现与GPT-4Turbo相当，但在非英文文本上的能力大幅提升，在视频...

OpenAI o3 AI模型突破推理极限背后：成本飙升，没“钞能力”用不起