OpenAI o1预览模型发布：推理能力更强可达理科博士生水准-AI资讯-资讯-创佳网

9月13日消息，今日凌晨，OpenAI正式推出了OpenAI o1预览模型。

对于复杂推理任务而言，新模型代表着人工智能能力的崭新水平，其特点就是会在回答之前花更多时间进行思考，就像人类思考解决问题的过程一样。

OpenAI曾解释过，2023年发布的GPT-4类似于高中生的智能水平，而GPT-5则是完成AI从“高中生跃升至博士”的成长，o1模型就是其中关键的一步。

根据测试，o1模型在国际数学奥林匹克的资格考试中，能够拿到83%的分数，而GPT-4o只能正确解决13%的问题。

而在编程能力比赛Codeforces中，o1模型拿到89%百分位的成绩，而GPT-4o只有11%。

OpenAI表示，根据测试，在下一个更新的版本中，AI在物理、化学和生物学的挑战性基准测试中，表现能够与博士生水平类似。

相较于GPT-4o等现有的大模型，OpenAI o1能够解决更加困难的推理问题，同时改善过往模型中存在的机制性缺陷。

比如在解答编程问题时也会更有条理，在着手写代码前，把整个回答的流程全部思考完一遍，再动手输出代码。

o1会花更多时间思考

在o1模型中，AI会不断试错并打磨答案，从而显著提高生成结果的准确率和质量。

OpenAI 宣布，ChatGPT订阅用户从9月12日起可以访问这两个新模型，o1-preview每周消息数量限制为30条，o1-mini则为50条。（建嘉）

9月25日消息，百川智能发布Baichuan2-53B闭源大模型，全面升级了Baichuan1-53B的各项能力。Baichuan2-53B不仅数学和逻辑推理能力提升显著，还通过高质量数据体系和搜索增强极大降低了模型幻觉。作为首批通过备案的大...

5月31日消息，奇富科技智能营销及贷后提醒业务场景中，每天都能接到大量带方言口音的电话，客户口音的多样性直接影响到语音识别的准确率和业务的流畅度。为此，奇富科技宣布“QI语精灵”方言识别技术再度升级，成功...

9月11日消息，据外媒报道，OpenAI计划在接下来的两周内推出专注于推理的AI大模型“草莓”（Strawberry），并将其整合到ChatGPT服务中。这一时间点比外媒早前报道的要更早，不过仍有可能变动。外媒称，“草莓”包含在...

5月27日消息，国内大模型全面进入价格战模式。上周，字节跳动、阿里、百度、腾讯、科大讯飞等厂商相继宣布参战，下调旗下大模型使用价格。至于大模型价格战对企业的影响，Gartner高级研究总监方琦向TechWeb表示，“...

9月6日消息，2024Inclusion·外滩大会上，名为“拥抱科技”（Hugtics）的创新AI黑科技引发广泛关注。这是一项可实现“拥抱传递”的设备，特制的背心内嵌人造肌肉纤维，当你拥抱一个装有压力传感器的模型时，它会复制...

OpenAI o1预览模型发布：推理能力更强可达理科博士生水准