御三家打起来了:OpenAI 开源、谷歌发布可交互的世界模型、Claude 4.1 成了编程新旗舰
硅谷三巨头同日发布新模型,OpenAI开源两款参数量接近o4-mini的GPT-oss模型;DeepMind推出Genie3世界模型实现实时交互和高一致性场景;Anthropic发布Claude Opus 4.1,提升智能体任务及编程能力。
硅谷三巨头同日发布新模型,OpenAI开源两款参数量接近o4-mini的GPT-oss模型;DeepMind推出Genie3世界模型实现实时交互和高一致性场景;Anthropic发布Claude Opus 4.1,提升智能体任务及编程能力。
Anthropic发布Claude Opus 4.1,编程性能提升74.5%,在SWE-bench上超越Gemini 2.5 Pro和o3。客户反馈表示Opus 4.1能精准定位修复代码bug,模型无害回复回应率达到99.06%。
新智元报道,OpenAI、谷歌和Anthropic发布不同模型。Anthropic发布Claude Opus 4.1,在编码性能和功能上有所提升。对比测试中Claude Opus 4.1表现优于Gemini-2.5-pro等模型,但需谨慎使用较弱的OpenAI-OSS-120B。
Anthropic发布新模型Claude Opus 4.1,相比前一代在智能体任务、真实世界编程和推理能力上有所提升。Claude Opus 4.1现已面向多个用户开放使用,并提供了详细的API定价信息。