混合推理+最强编码能力大模型Claude Sonnet 3.7上线Amazon Bedrock

along2025-02-26 14:15:32TechWeb.com.cn

2月26日消息,Anthropic首款混合推理模型Claude Sonnet 3.7近日发布,并第一时间上架亚马逊云科技,用户通过Amazon Bedrock等即可丝滑使用。

作为Anthropic迄今为止最智能的模型,Claude 3.7 Sonnet在编码和前端Web开发方面显著提升,实现了全面领先。

此外,Claude 3.7 Sonnet的突出优势是:其是首个混合推理模型,既能快速响应也能进行深度思维,能通过细致、逐步的推理解决复杂问题。通过API调用时,用户可精准控制大模型思考时间,进而准确控制推理成本。一经上线,吸引业内广泛关注。

亚马逊云科技CEO Matt Garman在LinkedIn上发文表示:“Claude 3.7 Sonnet现已在Amazon Bedrock上线,它代表了人工智能推理技术的一项进步。作为Anthropic目前最智能的模型,3.7 Sonnet引入了混合推理功能,既能快速响应,又能进行深入分析,并且可以在这两种模式之间切换。这意味着它具备非凡的灵活性,无论是驱动面向客户的人工智能智能体,还是处理复杂的工作流程,都能对速度、性能和成本进行控制。”

首个混合推理模型Claude Sonnet 3.7,推理成本优化能手

如Anthropic强调,Claude 3.7 Sonnet与市面上的其他推理模型不同,它是一款混合推理模型。

“正如人类使用同一个大脑进行快速反应和深度思考一样,我们认为推理应该是前沿模型的综合能力,而不是完全独立的模型。这种统一的方法也为用户创造了更无缝的体验。”

因此,Claude 3.7 Sonnet同时具备深度推理(深度思维模式,一步一步思考复杂答案)与快速回复(标准模式,实时生成答案)的能力。API用户可以对模型的思考时间进行细粒度控制。

具体而言,Claude 3.7 Sonnet Claude 3.7 Sonnet既可以当作大语言模型使用,也可以当作深度推理模型使用:用户可以选择什么时候让模型快速回答,什么时候让它在回答之前思考更长时间。

在标准模式下,Claude 3.7Sonnet代表了Claude 3.5 Sonnet的升级版。在深度思维模式下,它在回答之前进行深度思考,这提高了Claude 3.7Sonnet在数学、物理、指令遵循、编码和许多其他任务上的表现。

与Claude 3.5 Sonnet相比,Claude 3.7Sonnet模型的输出长度提升15倍以上。Claude 3.7 Sonnet支持最长128K token的输出(64K为普遍可用版本,128K为测试版)。这一增强能力在需要详细内容、多个示例或额外上下文及背景信息时尤为实用。若要生成长输出,可尝试要求模型提供详细大纲(针对写作场景,可指定段落级大纲细节并包含目标字数),然后要求响应按大纲索引段落并重申字数。

当通过API使用Claude 3.7 Sonnet时,用户可以精准控制模型的思考时间,开发者可以通过精准控制模型在处理查询时使用的计算资源量,API用户可以告诉Claude思考的数量不超过 N 个token,N 的值可以是任何值,但输出上限不能超过 128K个token。而模型能力的表现,取决于允许思考的token数量,Claude 3.7 Sonnet让开发者在速度(和成本)与答案质量之间进行权衡。

另外值得一提的是,Claude 3.7 Sonnet也是Anthropic最强大的编码模型,在编码和前端Web开发方面显著提升,实现了全面领先。

根据Anthropic的数据,其标准模式在SWE-bench Verified上的成绩为70.3%,达到行业领先水平。Claude 3.7 Sonnet在多数基准测试中的表现也优于Claude 3.5 Sonnet。这些增强能力使其成为驱动AI智能体和复杂工作流的理想选择。

Claude 3.7 Sonnet的增强能力可惠及多个行业场景。企业可创建直接与客户交互的先进AI助手与智能体;在医疗领域,它能辅助医学影像分析与研究摘要;在金融服务领域,它解决复杂金融建模问题的能力能带来诸多益处。对于开发者而言,它可作为编码助手,审查代码、解释技术概念,并针对不同语言提出改进建议。

上线Amazon Bedrock,助力构建更强大的生成式AI应用

Anthropic的Claude 3.7 Sonnet基础模型在发布的第一时间就已上线Amazon Bedrock。

Claude 3.7 Sonnet提供两种模式——标准模式和深度思维模式,可在Amazon Bedrock中切换,用户可控制思考预算,帮助用户在速度、成本和性能之间找到最优解。

此外,Claude 3.7 Sonnet也被加入Amazon Q Developer的模型列表中。Amazon Q基于Amazon Bedrock构建,开发者可通过Amazon Q为特定任务选择最合适的模型(例如Claude 3.7 Sonnet),以支持更高级的编码工作流,从而加速整个软件开发生命周期的构建。

据亚马逊云科技生成式AI副总裁Vasi Philomin介绍:"使用 Claude 3.7 Sonnet 的早期用户反馈,在使用深度思维模式时,该模型在数学、物理、竞赛编程和深入分析方面表现最为出色。再结合Amazon Bedrock的丰富功能,Claude 3.7 Sonnet将帮助客户构建更强大的生成式AI应用。"

下面,附上Amazon Bedrock上使用Claude 3.7 Sonnet的方法:

在Amazon Bedrock控制台中请求访问权限。在导航窗格中,选择模型访问。然后,修改模型访问以请求访问Claude 3.7 Sonnet。

尝试Claude 3.7 Sonnet,选择导航窗格中Playgrounds下的Chat/Text。然后,选择“选择模型”,并在“类别”下选择了“ Anthropic”,在“模型”下选择“Claude 3.7 Sonnet”。为了启用深度思维模式,在“配置”下切换“模型推理”(Model reasoning)。即可在右侧文本框输入需求问题进行体验。

Claude 3.7 Sonnet还有很强的图像到文本的视觉能力,上传了一张使用Amazon Bedrock创建的详细建筑平面图的图像,就可以收到这份网站计划的详细分析和合理见解。

台积电亚利桑那州第二座晶圆厂制程工艺升级至2nm 是为AI相关强劲需求

4月29日消息,据外媒报道,台积电本月8日在官网宣布,他们在亚利桑那州建设的第二座晶圆厂,制程工艺将由最初计划的3nm升级为更先进的2nm,量产时间也由2026年推迟到了2028年。对于将第二座晶圆厂的制程工艺由最初计...

宁德时代携手上海交大布局机器人领域,自研人形及四足机器人助力工厂智能化

【TechWe】当前,机器人技术作为科技行业的重点发展赛道,吸引了众多科技巨头的关注和投入。《智能涌现》今日报道指出,宁德时代未来能源(上海)研究院(简称“未来能源研究院”)正与上海交通大学合作研发多款机器...

消息称OpenAI董事会正与Altman就回归事宜进行谈判

11月22日消息,福特汽车于当地时间周二表示,已恢复密歇根州电池厂的建设工作,但规模较原计划有所缩减,理由是未来电动汽车需求料将降温。今年9月,福特暂停了这家位于密歇根州马歇尔的电池厂的建设,当时表示正在...

外媒爆料萨姆·奥特曼遭罢免原因:OpenAI取得可能威胁人类的Q*技术突破

11月23日消息,据路透社援引两位知情人士透露,在OpenAI首席执行官萨姆·奥特曼(SamAltman)被公司前董事会罢免之前,几名研究人员向董事会发出了一封信,警告称人工智能领域的一项技术突破可能会威胁到人类。两位消...

OpenAI突然推送高级语音模式,又抢了谷歌风头

9月25日早,Google发布两款新模型Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。在谷歌的系列模型中,GeminiPro属于中号模型,付费用户可以使用。而GeminiFlash则由GeminiPro蒸馏而来,在今年5月的GoogleI/O上第一次亮...

上一篇:全球AI顶会AAAI 2025在美开幕 产学研联手的“中国队”表现亮眼
下一篇:IBM亚太区总经理:AI的开源时刻可能是其未来的转折点