OpenAI o3碾压式AI数学成绩遭质疑：既当选手又是裁判，翻版 Theranos 世纪骗局-AI资讯-资讯-创佳网

IT之家 1 月 20 日消息，科技媒体 TechCrunch 昨日（1 月 19 日）发布博文，报道称 Epoch AI 因未及时披露 OpenAI 的资助而引发争议，其开发的数学基准测试 FrontierMath 的客观性受到质疑。

IT之家简要介绍下 Epoch AI 组织，是主要由 Open Philanthropy 资助的非营利组织。该组织推出了 FrontierMath 基准测试，通过整合专家级数学问题，衡量和测试 AI 模型的数学能力。

OpenAI 的 o3 模型在 EpochAI 的 FrontierMath 基准测试中，以碾压式优势傲视其它模型，准确率高达 25%，而其他模型得分在 2% 左右。

Epoch AI 的一位承包商“Meemi”在 LessWrong 论坛上发帖称，许多 FrontierMath 的贡献者直到公开宣布时才知道 OpenAI 参与了该基准搭建。

Meemi 写道：“沟通完全不透明。我认为 Epoch AI 应该披露 OpenAI 的资助，承包商在选择是否参与基准测试工作时，应该获得关于其工作成果可能被用于能力提升的透明信息。”

六位参与 FrontierMath 基准测试设计的数学家表示，他们并不知道 OpenAI 拥有独家访问权限。如果事先知道，他们可能不会参与。

一些社交媒体用户担心，这种保密行为可能会损害 FrontierMath 作为客观基准的声誉。除了资助 FrontierMath 之外，OpenAI 还可以访问该基准测试中的许多问题和解决方案 ——Epoch AI 在 12 月 20 日 o3 发布之前并未透露这一事实。

Epoch AI 副主任兼联合创始人之一 Tamay Besiroglu 在回复 Meemi 的帖子时坚称，FrontierMath 的完整性没有受到损害，但也承认 Epoch AI 在未能更加透明方面“犯了一个错误”。

AI 专家 Gary Marcus 质疑 OpenAI 的声明，将此事件与 Theranos 丑闻相提并论。IT之家注：该丑闻是由伊丽莎白・霍尔姆斯创立的血液检测公司 Theranos 的欺诈事件，该公司声称其技术只需几滴血就能进行数百项检测，但最后谎言被揭穿，公司最终倒闭，霍尔姆斯也被判犯有欺诈罪。

Besiroglu 承认 OpenAI 可以访问 FrontierMath 的大部分问题和答案，但有一个“OpenAI 未见过的保留数据集”用于验证模型的能力。

Besiroglu 写道

我们被限制在 o3 发布前后才能披露合作关系，事后看来，我们应该更努力地争取尽快对基准测试贡献者保持透明。我们的数学家应该知道谁可以访问他们的工作。即使我们在合同上受到限制，我们也应该让与贡献者的透明度成为我们与 OpenAI 协议中不可协商的一部分。

OpenAI阿尔特曼称将进行12场直播有望发布文生视频工具Sora

12月5日消息，据外媒报道，AI初创公司OpenAICEO阿尔特曼日前在社交媒体透露，接下来每个工作日（12月5日起太平洋时间上午10点）将进行一场直播，总共12场直播，直播内容为产品发布或演示。阿尔特曼称，其中包括一些...

联想发布三大新品 AI导向基础设施产品组合再添“新军”

12月19日，“智算无限全栈智能联想算力基础设施新品品鉴会”在天津成功举办。联想集团正式宣布，联想问天和联想ThinkSystem全面支持第五代英特尔®至强®可扩展处理器。同时，在与会嘉宾的见证下，联想集团重磅发布...

周鸿祎谈大模型：可以让安全降本增效别让我亏那么多

新浪科技讯8月12日下午消息，360集团创始人、董事长周鸿祎在网络社交平台发布视频表示，大模型提供了两个巨大的机会。他表示，其中一个机会就是，用大模型来给安全赋能，“可以让安全能够降本增效，能够把安全上为国...

A股爆炒“AI耗电黑洞”

人们对AI的恐惧似乎是深藏在骨髓里的。近期大热影片《沙丘2》的故事背景是在遥远的未来，人类与AI爆发战争，虽然人类惨胜，但消灭AI后，人类不再相信人脑以外的智能技术，选择了靠“香料”来供养有特异功能的人，进...

360回应被指“盗图”：对方希望10倍价格购买模型，愿诉诸法律

6月12日消息，近日AIGC创作者DynamicWang在X上发文，吐槽360的AI发布会盗用了他通过AI绘图模型生成的原图，并在发布会上进行产品“局部重绘”功能演示。据悉，在近日的360发布会上，360创始人周鸿祎在发布会上演示36...

OpenAI o3碾压式AI数学成绩遭质疑：既当选手又是裁判，翻版 Theranos 世纪骗局

如何选购kawai电钢琴？？2023年kawai选购攻略大全来了！

苹果招募生成式AI人才提供数十个大模型岗位

昆仑万维旗下Opera生成式AI服务海外用户数突破100万

创始人王慧文退出美团成AI公司光年之外唯一股东

OpenAI o3碾压式AI数学成绩遭质疑：既当选手又是裁判，翻版 Theranos 世纪骗局

如何选购kawai电钢琴？？2023年kawai选购攻略大全来了！

苹果招募生成式AI人才 提供数十个大模型岗位

昆仑万维旗下Opera生成式AI服务海外用户数突破100万

创始人王慧文退出 美团成AI公司光年之外唯一股东

苹果招募生成式AI人才提供数十个大模型岗位

创始人王慧文退出美团成AI公司光年之外唯一股东