跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

强化学习算法

200多行代码,超低成本复现DeepSeek R1「Aha Moment」!复旦大学开源

下午12时 2025/02/18 作者 机器之心

复旦大学知识工场实验室团队基于 GRPO 算法高效复现了 R1-zero 自发反思能力,项目代码简洁,仅依赖基础库实现,训练 7B 模型成本低至 7.3 元。

分类 学术、 资讯 标签 7B模型、 GRPO、 R1-Zero、 强化学习算法、 知识工场实验室、 肖仰华 发表评论

DeepSeek核心成员履历揭秘!

下午2时 2025/02/11 作者 Datawhale

DeepSeek吸引顶尖人才加入,通过独特文化与薪酬优势。团队成员来自中国知名大学,如清华大学和北京大学,享受自由的工作环境和激励措施,实现技术突破并获得全球认可。

分类 分享 标签 DeepSeek、 Junxiao Song、 强化学习算法、 潘梓正、 顶尖大学、 高薪酬 发表评论

OpenAI联创Schulman闪电跳槽!从Anthropic转投Murati新公司

下午12时 2025/02/07 作者 量子位

John Schulman从OpenAI跳槽到Mira Murati的新创业公司,该公司的工作与AGI相关,并已吸引多名顶尖研究员和工程师。

分类 资讯 标签 Anthropic、 John Schulman、 OpenAI、 对齐/后训练团队、 强化学习算法、 离职时间间隔不到半年、 超级对齐团队 发表评论

DeepSeek-R1:强化学习驱动的AI推理模型,性能媲美OpenAI o1

下午2时 2025/01/31 作者 小兵的AI视界

2025
年
1
月
20
日,深度求索公司正式发布了其最新的人工智能推理模型
DeepSeek-R

分类 开源 标签 671亿参数、 DeepSeek R1、 GitHub模型库、 多模态任务、 实时推断能力、 强化学习算法 发表评论

制糖工厂蛇年惊喜|微信送礼物,拜年新姿势

下午12时 2025/01/25 作者 APPSO

阿里的云服务器ECS服务升级,提供更高性能和更优价格,助力企业快速部署和管理弹性计算资源。

分类 资讯 标签 张伟、 强化学习算法、 提高运输效率、 显著降低物流成本、 至少15%的燃油消耗、 阿里巴巴 1 条评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

近期文章

  • 走进杭州“六小龙”等AI先锋企业,解码AI商业新动能|2025杭州AI创变营来啦
  • 国产AI智能体竞逐海外!Manus推出数据分析师、思维导图,Genspark上线AI表格、幻灯片
  • “由 AI 生成的代码,从诞生那一刻起就是「遗留代码」!”
  • 王兴兴放话“人形机器人订单爆了” 受制于产能
  • 王兴兴:很多人形机器人企业爆单了,宇树科技非常缺人!

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×