跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

强化学习

DeepSeek-R1与Kimi k1.5深度分析:大模型进化的4大趋势!

2025年1月21日14时 作者 AI信息Gap

木易分享了近期国内大模型圈的最新动态,强调DeepSeek-R1和Kimi k1.5在推理模型上的亮眼表现及技术细节,包括强化学习、长上下文扩展、蒸馏技术和基于规则奖励机制等重要概念。

分类 国际、 大模型 标签 Model蒸馏、 o1、 个人公众号创作者、 强化学习、 木易、 深度学习模型 1 条评论

DeepSeek R1来了,追平o1!它现在不但比OpenAI开放,也比它有活力

2025年1月21日12时 作者 硅星人Pro

头图由豆包生成。提示词:一条海底大鲸鱼,赛博朋克,金属发光。
作者
|
王兆洋
邮箱
|
wangz

分类 资讯 标签 640亿参数、 DeepSeek、 R1 zero、 强化学习、 模型蒸馏、 自我反思 发表评论

「DeepSeek接班OpenAI」,最新开源的R1推理模型,让AI圈爆了

2025年1月21日12时 作者 机器之心

机器之心报道
机器之心编辑部
OpenAI 的最初愿景,最终被一家国内创业公司实现了?
昨晚,大模型

分类 学术、 资讯 标签 DeepSeek、 DeepSeek-R1、 多样化数据分布、 强化学习、 蒸馏技术、 语言一致性奖励 1 条评论

动真格!北大团队开源全模态对齐的训练、数据和测评框架align-anything

2025年1月21日8时 作者 PaperWeekly

如何将全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。
在当前 AI 领域的快

分类 大模型、 学术 标签 align-anything、 多模态模型、 开源项目、 强化学习、 技术对齐、 科研交流 1 条评论

DeepSeek 发布类似OpenAI o1的推理模型:DeepSeek R1

2025年1月20日23时 作者 NLP工程化

DeepSeek发布R1系列推理模型,媲美O1-preview,在数学和编程竞赛中表现优异,目前仅支持网页使用,正式版将开源。

分类 开源 标签 DeepSeek、 强化学习、 思维链长度、 模型开源、 正式版、 网页使用 发表评论

追平满血版o1的国产多模态模型终于来了!训练细节全部公开

2025年1月20日23时 作者 机器之心

机器之心报道
机器之心编辑部
春节前最后一周,能媲美 Open AI 满血版 o1(Full Ver

分类 学术、 资讯 标签 kimi、 OpenAIo1模型、 在线镜像下降法、 多模态理解、 强化学习、 长上下文scaling 发表评论

一文读懂多模态大模型:强化学习技术全面解读 SFT、RLHF、RLAIF、DPO

2025年1月20日23时 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨猫先生
来源丨魔方AI空间
编辑丨极市平台
极市导读
本文从强化

分类 学术 标签 多模态、 大语言模型、 强化学习、 扩散模型、 极市平台、 视觉模型 发表评论

爆料!OpenAI 内部早已突破AGI第 4 level?

2025年1月17日23时 作者 AGI Hunt

Riley Coyote在社交媒体上透露OpenAI可能已经达到了AGI第4级。这引发了科技圈广泛讨论,有人担忧超级智能系统可能会基于不真实的数据训练而带来的潜在风险。

分类 分享 标签 1000亿、 OpenAI内部秘密、 Riley Coyote、 强化学习、 社交媒体、 超级智能 发表评论

游戏结束了?OpenAI可能已经突破,跨过起飞的最后临界阈值

2025年1月17日16时 作者 机器之心

OpenAI 的研究引发热议,有人认为其可能已经突破临界点,达到可以自我递归改进的程度。

分类 学术、 资讯 标签 OpenAI、 不可阻挡、 优化算法、 强化学习、 自我递归改进、 魔法 发表评论

能看AI推理过程的端到端自动驾驶,理想在走一条前所未有的路

2025年1月16日23时 作者 机器之心

机器之心报道
作者:泽南
城市、高速一体化,从车位到车位的全程自动。
最近一段时间,随着新车型和新技

分类 学术、 资讯 标签 Orin-X、 强化学习、 理想汽车、 端到端学习、 通用人工智能、 高性能算力 1 条评论
较早文章
较新文章
← 上一页 页面1 … 页面40 页面41 页面42 … 页面46 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 10 月
一 二 三 四 五 六 日
 12345
6789101112
13141516171819
20212223242526
2728293031  
« 9 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×