今年“诺奖风向标”来了一位华南农大校友
2025年斯隆研究奖揭晓,126位学者获奖。其中,3位北大数院校友、4位清华校友及多所高校的优秀学者获得认可。华人占比近四分之一。姚班继续保持蝉联计算机领域的荣誉。
2025年斯隆研究奖揭晓,126位学者获奖。其中,3位北大数院校友、4位清华校友及多所高校的优秀学者获得认可。华人占比近四分之一。姚班继续保持蝉联计算机领域的荣誉。
开源大模型训练工具箱发布,微调DeepSeek-V3/R1实现低成本高质量私有模型。Colossal-AI提供多种训练资源和优化方案,支持国产NPU硬件,并验证GRPO奖励机制用于强化学习微调。
OpenAI前员工John Schulman和Barret Zoph分享了他们在后训练阶段开发ChatGPT的经验,并发布了相关PPT。他们讨论了监督微调、奖励模型和强化学习等关键组成部分,以及如何处理拼写错误和其他挑战。
百度搜索正式全量接入DeepSeek-R1满血版,实现用户与AI深度融合。通过百度APP直接搜索“AI+”,即可访问新功能。实测显示,百度搜索的DeepSeek-R1能准确回答各种问题,包括文化背景分析、日常生活答疑等场景。
字节跳动大模型团队再添强将。Google Fellow吴永辉加盟,加入Seed基础研究负责人职位。他曾是谷歌神经机器翻译项目及Rank Brain项目的贡献者,并参与了谷歌大模型Gemini的研发工作。
人大高瓴人工智能研究院与蚂蚁集团提出LLaDA模型,使用扩散模型替代自回归,挑战了大语言模型的固有限制,并在上下文学习、指令遵循和反转诗歌任务中超越GPT-4。