探索AI写代码极致:Claude Opus 4.1模型登场,软件工程能力再攀新高峰
8 月 6 日消息,Anthropic 公司今天(8 月 6 日)发布公告,宣布推出 Claude Opus 4.1 模型,相比较今年 5 月推出的 Claude 4 系列模型,主要改进了编码、推理和执行指令的能力。
Anthropic 表示,Claude Opus 4.1 在 SWE-bench Verified 上(用于评估软件工程准确性)提升到了 74.5%,作为对比,Claude Sonnet 3.7 的准确率为 62.3%,而 Claude Opus 4 的准确率为 72.5%。具体来说,更新后的模型在“深度研究和数据分析技能,尤其是在细节追踪和代理搜索方面”表现得更加出色。
与 Opus 4 相比,Opus 4.1 在大多数功能上都有所提升,特别是在多文件代码重构方面表现尤为突出。附上相关数据如下:
Rakuten Group 发现,Opus 4.1 不做不必要的调整或引入新的错误,能够精确地在大型代码库中定位并修正错误。
Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中,比 Opus 4 表现提高了标准差的一个单位,这一性能飞跃与从 Sonnet 3.7 到 Sonnet 4 的跳跃相当。
最新的模型今日起面向 Claude 客户开放,可以通过 Claude Code、Anthropic 的 API、亚马逊 Bedrock 和谷歌云的 Vertex AI 使用。
同时,Anthropic 在社交媒体上表示,计划在未来几周内发布“对我们模型的重大改进”,因此可以期待 Claude 系列模型的更多升级。OpenAI 也预计将在本周发布新消息。(故渊)
WPS AI海外版活跃用户超2亿,“Amazon Bedrock+ Claude 3”成关键助力6月25日消息,生成式AI正在重塑办公模式,大幅提升办公效率,催生协同办公创新产品加速落地。全球办公软件巨头微软就通过在Office四件套中嵌入AICopilot能力来加强产品竞争力。国内老牌办公软件和服务提供商金山办公...
降价!免费!圈地!大模型价格战卷到飞起巨头接连下场!降价!免费!属于大模型赛道的价格战,已彻底陷入疯狂。近日,百度和阿里同一天发布了旗下大模型价格调整,其中阿里降价幅度高至97%,而百度更加夸张,直接宣布免费。从时间线来看,百度和阿里对大模...
“地球上最聪明AI”Grok 3发布,头部大模型之争愈演愈烈北京时间2月18日中午,埃隆·马斯克的人工智能初创公司xAI发布了Grok3大模型,马斯克称之为“地球上最聪明的人工智能”。Grok3的发布,势必将现在已经炙热的模型之战推向新的高潮。Grok3的现场演示在当天的直播中,...
大模型,还是救不了困境中的AI企业去年,ChatGPT掀起的一片浪花,卷起了全球互联网科技创新的浪潮,大模型成为当之无愧的风口,这也给近几年略显平静和停滞的AI行业注入了新的活力,让AI相关企业再次站在互联网舞台的中央。围绕大模型的创业潮流也在...
要做中国的OpenAI?字节跳动2024年研发开支接近BAT之和12月27日消息,浙商证券最新报告指出,字节跳动2024年在AI领域的资本开支达800亿元,接近百度、阿里和腾讯三家的总和(约1000亿元),显示其AI研发投入已显著领先同行。2025年字节跳动资本开支有望达到1600亿元,旨...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...