强化学习归档 - 第41页共46页

DeepSeek-R1与Kimi k1.5深度分析：大模型进化的4大趋势！

2025年1月21日14时作者 AI信息Gap

木易分享了近期国内大模型圈的最新动态，强调DeepSeek-R1和Kimi k1.5在推理模型上的亮眼表现及技术细节，包括强化学习、长上下文扩展、蒸馏技术和基于规则奖励机制等重要概念。

2025年1月21日12时作者硅星人Pro

头图由豆包生成。提示词：一条海底大鲸鱼，赛博朋克，金属发光。
作者
｜
王兆洋
邮箱
｜
wangz

2025年1月21日12时作者机器之心

机器之心报道
机器之心编辑部
OpenAI 的最初愿景，最终被一家国内创业公司实现了？
昨晚，大模型

2025年1月21日8时作者 PaperWeekly

如何将全模态大模型与人类的意图相对齐，已成为一个极具前瞻性且至关重要的挑战。
在当前 AI 领域的快

2025年1月20日23时作者 NLP工程化

DeepSeek发布R1系列推理模型，媲美O1-preview，在数学和编程竞赛中表现优异，目前仅支持网页使用，正式版将开源。

2025年1月20日23时作者机器之心

机器之心报道
机器之心编辑部
春节前最后一周，能媲美 Open AI 满血版 o1（Full Ver

2025年1月20日23时作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨猫先生
来源丨魔方AI空间
编辑丨极市平台
极市导读
本文从强化

2025年1月17日16时作者机器之心

OpenAI 的研究引发热议，有人认为其可能已经突破临界点，达到可以自我递归改进的程度。

2025年1月16日23时作者机器之心

机器之心报道
作者：泽南
城市、高速一体化，从车位到车位的全程自动。
最近一段时间，随着新车型和新技