斯坦福开源复杂推理AI Agent,融合超10种工具
专注AIGC领域的专业社区,聚焦大语言模型(LLM)的发展和应用落地,介绍斯坦福开源的Octotools框架。该框架融合11种不同工具用于复杂推理,包含标准化封装的工具卡片及规划器、执行器等组件。
专注AIGC领域的专业社区,聚焦大语言模型(LLM)的发展和应用落地,介绍斯坦福开源的Octotools框架。该框架融合11种不同工具用于复杂推理,包含标准化封装的工具卡片及规划器、执行器等组件。
UIUC、斯坦福与哈佛联合提出能量驱动Transformer(EBT),突破传统前馈推理方式,实现更精准和稳健的预测。EBT动态计算资源分配能力使模型能根据问题复杂度调整推理策略,展示类人思考过程。
清华大学与英伟达、斯坦福联合提出NFT(Negative-aware FineTuning)方案,通过构造隐式负向模型利用错误数据训练正向模型,使其性能接近强化学习。这一策略弥合了监督学习和强化学习的差距,且损失函数梯度等价于On-Policy条件下的GRPO算法。
斯坦福团队通过意外发现,由AI生成的内核性能超越了人类专家专门优化过的版本。这项研究展示了大模型在探索高级优化和硬件特性的能力。
MetaGPT联合多家机构发布《Foundation Agents》报告,概述智能代理的发展与挑战,涵盖模块化架构、脑区功能映射、自我进化机制、协作与进化multi-Agent系统等多方面内容。
2025年斯坦福《AI指数报告》揭示全球AI现状:技术加速进化、政府加码布局、顶尖人才涌向大模型公司,创新集中于少数巨头。尽管存在伦理风险和技术瓶颈,但AI正快速融入各行各业并改变人们的生活方式。
OpenThinker-32B 是由斯坦福、UC伯克利等机构联合发布的 SOTA 级推理模型,仅需 1/8 数据就与 DeepSeek-R1 达成同等性能。项目使用精心选择的验证数据集,并通过数据规模化、推理过程验证和模型规模扩展的方法实现。
阿里云通义千问的Qwen模型在短短时间内取得了显著突破,仅用1000个样本在H100上监督微调26分钟就训练出与顶尖推理模型相当的新模型s1-32B。这一成果引起了AI社区的关注和赞誉,取代了Llama成为开源AI社区的重要标杆基座模型。
X-Dyna 是一个基于扩散模型的动态人体图像动画工具,能利用单张人像图片和驱动视频生成逼真的人物形象动画及表情、动作迁移等应用。