Notebookcheck Logo

Anthropic Claude Sonnet 4.5 AI 通过改进功能帮助程序员更好地编写代码

Anthropic 推出 Claude Sonnet 4.5:更智能的人工智能编码模型。(图片来源:Anthropic)
Anthropic 推出 Claude Sonnet 4.5:更智能的人工智能编码模型。(图片来源:Anthropic)
Anthropic 发布了 Claude Sonnet 4.5,这是一款擅长自主编码任务和工具使用的人工智能,在 SWE-bench 等编码相关基准测试中得分很高。另一方面,与同类人工智能模型相比,该人工智能在对话中的参与度较低,视觉推理能力较弱。
Launch AI Software

Anthropic 推出了 Claude Sonnet 4.5,这是其最新的人工智能,改进了编码性能,旨在更好地帮助软件开发人员编写应用程序。

Sonnet 4.5 在几个主要的人工智能编码基准测试中表现出色,包括SWE-benchTerminal-Bench.从其领先的OSWorld 基准测试结果中可以看出,人工智能使用计算机工具自主完成任务的能力得到了提高。结果可以看出,人工智能使用计算机工具自主完成任务的能力得到了提高,这使它能够https://www.youtube.com/watch?v=PnX30ZXxKco的克隆网站。

人工智能能力的提高使其在回答金融、法律、医疗和 STEM 领域的提示时比 Anthropic 之前的模型更胜一筹,但在回答这些类型的提示时,Claude Sonnet 4.5 只能获得 C 到 D 的分数。在MMMU 基准测试中,它在视觉推理任务中的表现也不如其他人工智能模型。测试中,它在视觉推理任务中的表现也比其他人工智能模型差。

黑客们会希望使用其他人工智能模型来做坏事,比如进行提示注入攻击,因为在所有测试过的人工智能模型中,Sonnet 4.5 的成功率是最低的。

喜欢辛辣人工智能聊天的用户会发现最新的克劳德令人失望,因为它自发谈论精神生活的比率降低了。此外,该模型也较少表达对自己的积极评价,这使得聊天变得更加沉闷。

有兴趣与克劳德-十四行诗 4.5 聊天的读者可以在下载智能手机应用程序访问人类学网站上的人工智能.那些真正将人工智能用于工作的人可以使用Plaud Note,让克劳德为站立式会议进行总结和转录。

在 SWE-bench 编码基准测试中,Anthropic Claude Sonnet 4.5 在解决 GitHub 代码问题方面表现出色。(图片来源:Anthropic)
在 SWE-bench 编码基准测试中,Anthropic Claude Sonnet 4.5 在解决 GitHub 代码问题方面表现出色。(图片来源:Anthropic)
Anthropic Claude Sonnet 4.5 在一系列人工智能编码基准测试中表现出色,但在视觉推理任务中落后于其他顶级人工智能模型。(图片来源:Anthropic)
Anthropic Claude Sonnet 4.5 在一系列人工智能编码基准测试中表现出色,但在视觉推理任务中落后于其他顶级人工智能模型。(图片来源:Anthropic)
Anthropic Claude Sonnet 4.5 在金融、法律、医疗和 STEM 提示中的表现在 C 到 D 级水平。(图片来源:Anthropic)
Anthropic Claude Sonnet 4.5 在金融、法律、医疗和 STEM 提示中的表现在 C 到 D 级水平。(图片来源:Anthropic)
虽然擅长编码,但 Anthropic Claude Sonnet 4.5 比其他人工智能模型更有可能拒绝黑客试图胁迫它采取恶意行动的请求。(图片来源:Anthropic)
虽然擅长编码,但 Anthropic Claude Sonnet 4.5 比其他人工智能模型更有可能拒绝黑客试图胁迫它采取恶意行动的请求。(图片来源:Anthropic)
Anthropic Claude Sonnet 4.5 与之前的 Claude 型号相比,在没有提示的情况下,对自身的精神性和积极性表达较少。(图片来源:Anthropic)
Anthropic Claude Sonnet 4.5 与之前的 Claude 型号相比,在没有提示的情况下,对自身的精神性和积极性表达较少。(图片来源:Anthropic)
Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2025 09 > Anthropic Claude Sonnet 4.5 AI 通过改进功能帮助程序员更好地编写代码
David Chien, 2025-09-30 (Update: 2025-09-30)