一篇持续强化学习技术最新综述

持续强化学习(CRL)作为一种有前景的研究方向,旨在使智能体在动态、多任务环境中持续学习、适应并保留知识。CRL面临的主要挑战包括可塑性、稳定性及可扩展性。文章提出了一种新的分类体系,将CRL方法按照所存储和/或转移的知识类型分为四大类:基于策略的、基于经验的、基于动态的方法和基于奖励的方法。

2025年AI Agent大爆发,全面拥抱智能体

2025年是Agent从概念走向主流的关键时刻。Agent是一种自主智能体,能感知环境、决策并进化。它对程序员来说就像“超级外挂”,具备感知-决策-执行闭环和工具调用能力。为了拥抱Agent,开发者需要进行认知升级和技能重构,并通过相关课程和技术资料快速掌握技术原理。

国产开源LLM大爆发的一周:腾讯、百度、华为,冲~

百度文心4.5系列开源10款混合专家模型,包含MoE和稠密参数模型;ERNIE-4.5-300B-A47B-Base在28个基准测试中超越DeepSeek-V3-671B-A37B-Base。腾讯Hunyuan-A13B语言模型采用混合推理,支持超长上下文理解;盘古Pro MoE模型使用分组混合专家架构,参数量高达72B、激活参数量16B。