Anthropic 近期发布了其 Claude 系列模型的最新成员——Claude Haiku 4.5。这款新模型主打轻量化与高效率,在保持较高准确性的同时,显著提升了响应速度并降低了使用成本。
根据官方介绍,Claude Haiku 4.5 在软件编程等任务上的能力已可媲美系列中的中型模型 Claude Sonnet 4,而其计算成本仅为后者的三分之一,速度却提升了两倍以上,甚至在部分涉及计算机操作的任务中表现更优。在专门评估AI编程能力的 SWE-bench Verified 基准测试中,该模型与 Claude Sonnet 4 及市场同类先进模型表现相当。
在商业化方面,Claude Haiku 4.5 已向 Anthropic 的免费用户开放,同时也提供了面向开发者的 API 接口。其定价策略极具竞争力,输入和输出每百万 tokens 的费用分别约为1美元和5美元。公司首席产品官 Mike Krieger 在接受采访时进一步说明,Haiku 模型的日常使用成本约为 Sonnet 模型的三分之一,而 Sonnet 的成本又大约是顶级模型 Opus 的五分之一。他还透露,公司计划在年底或明年初推出新款模型,预计将是 Opus 的升级版本。
技术特性:支持深度思考与多模型协作
Claude Haiku 4.5 的一个重要特性是引入了“扩展思维”模式。在该模式下,模型会进行更长时间的内部推理后再输出答案,旨在提升复杂问题的解决质量。当思考过程异常冗长时,系统会自动调用另一个模型实例对思考内容进行摘要,以优化效率。这一特性是其前代版本所不具备的。
此外,该模型具备更强的上下文窗口管理能力,能够根据剩余上下文长度动态调整回答的详略程度,这有助于缓解模型在长任务中可能出现的“懒惰”现象(即提前终止任务或输出不完整结果)。Krieger 还展示了多模型协同工作的潜力,例如,可由 Claude Sonnet 4.5 制定复杂问题的解决计划,再由 Claude Haiku 4.5 高效执行其中的具体子任务。
安全性能:达到中大型模型水准
在安全性评估中,Claude Haiku 4.5 在应对单轮有害请求时,其无害响应率与 Claude Sonnet 4.5 等更大型号模型处于同一水平。对于涉及敏感话题但本质无害的良性请求,其过度拒绝的频率相比前代显著降低,回答更具实用性。
在针对AI智能体(Agent)的对抗性测试(Agent Red Teaming)中,该模型在防止恶意指令执行、敏感数据泄露、生成有害代码等多个安全维度上表现稳健,成功抵御攻击的比例与 Claude Sonnet 4.5 相近或更优,显示出强大的安全属性。
行业背景:紧密迭代以保持竞争力
当前,Anthropic 估值已高达1830亿美元,服务超过30万企业客户,年化收入接近70亿美元。面对谷歌和 OpenAI 的激烈竞争,Anthropic 明显加快了研发节奏,在近期接连发布了 Claude Sonnet 4.5 和 Claude Opus 4.1 之后,又迅速推出 Claude Haiku 4.5。这种无缝衔接的发布模式,反映了公司在大型模型领域加速追赶的决心。据悉,在训练 Sonnet 4.5 的同时,Haiku 4.5 的开发工作便已同步启动。
综上所述,Claude Haiku 4.5 通过在速度、成本和安全维度上的综合优化,有望在编程辅助、企业级安全应用等场景中发挥更大作用。
(撰写 | 潇飞)