全球首次,Transformer「混血」速度狂飙65倍!英伟达已下注 2025年6月14日16时 作者 新智元 康奈尔、CMU等机构的研究者,提出了前所未有的「混合体」——Eso-LM。有人惊呼:「自回归危险了。
快速理解一下!RL 究竟是如何与 LLM 做结合的? 2025年5月17日19时 作者 Datawhale RLHF 想必今天大家都不陌生,但在 ChatGPT 问世之前,将 RL 和 LM 结合起来的任务
DeepSeek数学大翻车?普林斯顿谷歌锤爆LLM:做题不会推理,全靠死记硬背 2025年2月13日23时 作者 新智元 普林斯顿、谷歌等研究者详细剖解了o1-mini等模型做数学题的过程,发现它们靠的是记!最实锤的证据之