OpenAI o1预览模型发布:推理能力更强 可达理科博士生水准
9月13日消息,今日凌晨,OpenAI正式推出了OpenAI o1预览模型。
对于复杂推理任务而言,新模型代表着人工智能能力的崭新水平,其特点就是会在回答之前花更多时间进行思考,就像人类思考解决问题的过程一样。
OpenAI曾解释过,2023年发布的GPT-4类似于高中生的智能水平,而GPT-5则是完成AI从“高中生跃升至博士”的成长,o1模型就是其中关键的一步。
根据测试,o1模型在国际数学奥林匹克的资格考试中,能够拿到83%的分数,而GPT-4o只能正确解决13%的问题。
而在编程能力比赛Codeforces中,o1模型拿到89%百分位的成绩,而GPT-4o只有11%。
OpenAI表示,根据测试,在下一个更新的版本中,AI在物理、化学和生物学的挑战性基准测试中,表现能够与博士生水平类似。
相较于GPT-4o等现有的大模型,OpenAI o1能够解决更加困难的推理问题,同时改善过往模型中存在的机制性缺陷。
比如在解答编程问题时也会更有条理,在着手写代码前,把整个回答的流程全部思考完一遍,再动手输出代码。
o1会花更多时间思考
在o1模型中,AI会不断试错并打磨答案,从而显著提高生成结果的准确率和质量。
OpenAI 宣布,ChatGPT订阅用户从9月12日起可以访问这两个新模型,o1-preview每周消息数量限制为30条,o1-mini则为50条。(建嘉)
百川智能发布Baichuan2-53B,开放API全面进军To B领域9月25日消息,百川智能发布Baichuan2-53B闭源大模型,全面升级了Baichuan1-53B的各项能力。Baichuan2-53B不仅数学和逻辑推理能力提升显著,还通过高质量数据体系和搜索增强极大降低了模型幻觉。作为首批通过备案的大...
奇富科技智能语音模型川渝方言识别准确率提升超35%5月31日消息,奇富科技智能营销及贷后提醒业务场景中,每天都能接到大量带方言口音的电话,客户口音的多样性直接影响到语音识别的准确率和业务的流畅度。为此,奇富科技宣布“QI语精灵”方言识别技术再度升级,成功...
消息称OpenAI将在两周内发布“草莓”大模型 专注于推理9月11日消息,据外媒报道,OpenAI计划在接下来的两周内推出专注于推理的AI大模型“草莓”(Strawberry),并将其整合到ChatGPT服务中。这一时间点比外媒早前报道的要更早,不过仍有可能变动。外媒称,“草莓”包含在...
Gartner方琦:大模型价格战的影响可能没有市场想象的那么大5月27日消息,国内大模型全面进入价格战模式。上周,字节跳动、阿里、百度、腾讯、科大讯飞等厂商相继宣布参战,下调旗下大模型使用价格。至于大模型价格战对企业的影响,Gartner高级研究总监方琦向TechWeb表示,“...
和母亲分隔两地 他发明了一个可以隔空拥抱的AI黑科技9月6日消息,2024Inclusion·外滩大会上,名为“拥抱科技”(Hugtics)的创新AI黑科技引发广泛关注。这是一项可实现“拥抱传递”的设备,特制的背心内嵌人造肌肉纤维,当你拥抱一个装有压力传感器的模型时,它会复制...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...