在9.11和9.8谁更大上 OpenAI最新的大模型OpenAI o1也翻车了-AI资讯-资讯-创佳网

9月13日消息，据外媒报道，在今年7月份，也就是在OpenAI推出新一代旗舰大模型GPT-4o之后约两个月，国外有用户在社交媒体上爆料称自己在ChatGPT 4o上询问9.11和9.9哪一个大（9.11and9.9—which is bigger？）时， ChatGPT 4o笃定的回答9.11比9.9大（9.11 is bigger than 9.9），OpenAI当时最强模型GPT-4o加持下的ChatGPT 4o，在这一问题上给出如此离奇的回答也让外界震惊不已。

而随后有用户的测试发现，不只是GPT-4o加持下的ChatGPT 4o，谷歌Gemini Advanced、Claude 3.5 Sonnet这两款国外知名的大模型在这一问题上也相继翻车，国内也有多家厂商的大模型未能幸免。

除了9.11和9.9，也有相关媒体对其他的数字进行测试，比如9.11和9.8，结果显示也有多家厂商的大模型翻车。

在OpenAI当地时间周四推出较以往的模型更注重推理，在奥数、编程竞赛中的表现都远强于GPT-4o的OpenAI o1系列大模型之后，也有好奇的用户再次对这一问题进行了测试。

但让人意外的是，号称有更强推理能力、数学和编程方面表现出色的OpenAI o1，也未能避免翻车。

有测试显示，在询问9.11和9.8谁更大这一问题时，OpenAI o1预览版在经过14秒的思考后，还是给出了9.11更大的结果，而给出的原因竟是因为9.11比9.8大。

就显示的内容来看，OpenAI o1预览版在比较9.11和9.8谁更大时，进行了比较数值大小、对比数值大小、对比大小、比较两个数值这4个方面的思考，但除了对比数值大小、对比大小是9.8大于9.11，另外两个方面都是9.11大于9.8。不过在对比数值大小这一项中，显示的是“蒙特认为9.8大于9.11，9.8显示出数学上的优越性。”（海蓝）

全新联想Yoga Book 9i发布：延续双屏OLED，支持AI美化笔记功能

1月9日，在CES2024上，联想集团展示了新推出的一系列个人电子设备，包括赋能创作过程的YogaAI笔记本电脑、便于用户进行娱乐和学习的平板电脑、专为日常用户设计的IdeaPad笔记本电脑，以及外形现代的各种外设。全新亮...

OpenAI首席运营官：人工智能被夸大了，不可能一夜之间带来实质性的商业变革

12月5日消息，人工智能研究公司OpenAI可能正在努力获得企业用户的青睐，但该公司高管警告称，不要指望这项技术能迅速改变他们的业务。OpenAI首席运营官布拉德·莱特卡普（BradLightcap）最近接受采访时表示，人工智...

马斯克xAI全球招聘：高工资不算啥居然有无限期带薪休假

7月23日消息，埃隆·马斯克的人工智能初创公司xAI近日在全球范围内启动招聘，提供了包括AI工程师和各类主管人员在内的近30个岗位。除了提供具有竞争力的薪酬和股权激励，xAI的福利待遇也颇为引人注目，甚至经过批准...

因用户数据自动被用于训练 xAI， X（推特）面临欧洲监管机构质询

IT之家7月29日消息，据《金融时报》当地时间周六报道，欧洲数据保护监管机构正在“寻求澄清”埃隆・马斯克的X（推特）决定允许用户数据自动输入其人工智能初创公司xAI的举动，此举对该平台提出了新的监管审查。IT之...

苹果A18 Pro芯片细节曝光：采用更大尺寸以提升AI性能

【Techweb】今年的旗舰大战已拉开帷幕，而作为全球手机市场的老大，苹果每年的新一代iPhone都会早早获得外界的广泛关注。就在这段时间，不断有媒体和数码博主曝光了全新的iPhone16系列在外观设计以及部分硬件配置上...

在9.11和9.8谁更大上 OpenAI最新的大模型OpenAI o1也翻车了

外媒：苹果正在全球范围内寻找生成式人工智能人才

苹果计划使用富士康供应的专用服务器测试人工智能服务

外媒称苹果将采用富士康服务器训练和测试人工智能服务

英伟达在人工智能技术领域的领导地位和近乎垄断的地位「令人震惊」