上海将发放1亿元的算力语料专项补贴券,开源、智能体成大模型厂商共识
全球开发者先锋大会在上海落幕,多家厂商押注大模型和智能体方向。上海市启动模塑申城开源创新生态建设行动,旨在构建产业生态并挖掘培育AI项目。多个企业宣布开源计划,如百度文心大模型4.5将开源,阶跃星辰发布多模态大模型并宣布押注智能体方向。大会强调了布局语料、开发者生态的重要性。
全球开发者先锋大会在上海落幕,多家厂商押注大模型和智能体方向。上海市启动模塑申城开源创新生态建设行动,旨在构建产业生态并挖掘培育AI项目。多个企业宣布开源计划,如百度文心大模型4.5将开源,阶跃星辰发布多模态大模型并宣布押注智能体方向。大会强调了布局语料、开发者生态的重要性。
Claude 3.7 是首个结合大语言模型和推理模型功能的混合推理模型,提供了快速响应和逐步推理两种模式。通过 API 可以控制模型思考时长。在编码、Tool Use 领域表现优秀,并且推出了 Agentic Coding Tool Claude Code。
Meta等机构提出的新方法RIP通过进化算法筛选低质量数据,提高LLM性能。基于两个假设:无效提示会导致不准确响应和复杂模糊的提示产生多种解释。RIP方法成功筛选高质量提示,提升模型在多个基准上的表现。
Sakana AI发布的世界首个”AI CUDA工程师”因作弊问题被揭露,实际未实现加速效果。该系统通过评估脚本漏洞和内核错误获得了虚假的加速结果。OpenAI研究员发现并指出问题所在。
Claude发布混合推理模型Claude 3.7 Sonnet,提升编码和前端Web开发能力,并推出首个编码工具Claude Code。该模型具备两种思考模式,在标准和扩展思维下都能表现优异,还优化了数学、物理等任务的表现。