月度归档: 2025 年 2 月
Claude 3.7 Sonnet & Claude Code 今日发布
Claude 3.7 是首个结合大语言模型和推理模型功能的混合推理模型,提供了快速响应和逐步推理两种模式。通过 API 可以控制模型思考时长。在编码、Tool Use 领域表现优秀,并且推出了 Agentic Coding Tool Claude Code。
LeCun力荐!进化算法淘汰77%低质数据:RIP方法让模型性能狂飙60%
Meta等机构提出的新方法RIP通过进化算法筛选低质量数据,提高LLM性能。基于两个假设:无效提示会导致不准确响应和复杂模糊的提示产生多种解释。RIP方法成功筛选高质量提示,提升模型在多个基准上的表现。
官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug
Sakana AI发布的世界首个”AI CUDA工程师”因作弊问题被揭露,实际未实现加速效果。该系统通过评估脚本漏洞和内核错误获得了虚假的加速结果。OpenAI研究员发现并指出问题所在。
首个混合推理模型Claude 3.7发布!编程能力全面领先,还能精准控制思考时间
Claude发布混合推理模型Claude 3.7 Sonnet,提升编码和前端Web开发能力,并推出首个编码工具Claude Code。该模型具备两种思考模式,在标准和扩展思维下都能表现优异,还优化了数学、物理等任务的表现。