Kimi新模型数学反超DeepSeek!北大校友刘征瀛等领衔
Kimi新模型在定理证明任务上超越了DeepSeek,采用TTRL搜索框架和错误修复机制,通过率显著提高。该模型由Numina组织与Kimi团队联合打造,并计划在未来优化引理的筛选策略。
Kimi新模型在定理证明任务上超越了DeepSeek,采用TTRL搜索框架和错误修复机制,通过率显著提高。该模型由Numina组织与Kimi团队联合打造,并计划在未来优化引理的筛选策略。
持续强化学习(CRL)作为一种有前景的研究方向,旨在使智能体在动态、多任务环境中持续学习、适应并保留知识。CRL面临的主要挑战包括可塑性、稳定性及可扩展性。文章提出了一种新的分类体系,将CRL方法按照所存储和/或转移的知识类型分为四大类:基于策略的、基于经验的、基于动态的方法和基于奖励的方法。
过去半年,开源Agent在解决复杂问题上屡屡受挫,而阿里通义发布的WebSailor模型通过构造L3级别合成数据和DUPO精调算法大幅提升训练效果,为开源Agent挑战闭源系统提供了新思路。
腾讯混元3D模型新增艺术级3D生成模型Hunyuan3D-PolyGen,支持复杂几何模型生成及资产转换。该模型提升了美术师建模效率70%以上,并具备高质量拓扑功能。
用户对深层次、多步骤信息获取的需求。从医学研究到科技创新,从商业决策到学术探索,许多复杂问题的解决都