跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

训练成本

辛顿、闫俊杰WAIC完整演讲:一个预警,一个拥抱

2025年7月26日19时 作者 智能涌现

幕主论坛上,多位AI行业的顶级大咖出席并发表演讲,为与会者烹饪了一道学术大餐。
“深度学习教父”、图

分类 资讯 标签 AGI、 多Agent系统、 开源模型、 模型大小、 训练成本、 闭源模型 发表评论

斯坦福2025 AI指数出炉!中美AI终极对决差距仅剩0.3%,DeepSeek领衔

2025年4月8日16时 作者 新智元

AI领域的最新趋势:中美顶级模型性能差距缩至0.3%,以DeepSeek为代表的模型强势崛起,逼近闭

分类 资讯 标签 报告、 推理成本、 模型参数、 算力需求、 训练成本、 顶级模型 发表评论

DeepSeek效应初现:Grok-3补刀ChatGPT,OpenAI已在ICU?

2025年3月1日16时 作者 新智元

:预训练Scaling
L
aw不是OpenAI的护城河。将来95%的算力将用在推理,而不是现在的训

分类 资讯 标签 AI模型、 开源社区、 技术创新、 推理成本、 新兴公司、 训练成本 发表评论

目前为止分析DeepSeek最全面的文章了

2025年2月3日23时 作者 NLP工程化

DeepSeek-V2 采用 DeepSeekMoE 架构优化训练成本和推理效率,引入稀疏激活的专家网络。

分类 开源 标签 DeepSeek-V2、 DeepSeekMoE架构、 动态分配机制、 推理效率、 稀疏激活的专家网络、 训练成本 2 条评论

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×