普林斯顿大学归档 - 第2页共2页

强化学习也涌现？自监督RL扩展到1000层网络，机器人任务提升50倍

2025年3月22日16时作者机器之心

普林斯顿大学和华沙理工的研究表明，将对比 RL 扩展到1000层可以显著提高自监督强化学习的性能，在各种机器人任务中可实现50倍以上的提升。

2025年3月11日8时作者 AI寒武纪

腾讯发布首个混合Transformer-Mamba MoE架构的超大模型Hunyuan-TurboS，其在数学、推理等关键benchmark上超越或持平GPT-4o-0806、DeepSeek-V3。模型成本降低7倍。

2025年2月24日8时作者 NLP工程化

普林斯顿大学机器学习课程简介：涵盖基础知识、模型训练、评估与优化等内容，提供可执行示例代码及参考文献。