跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

PyTorch

32B小模型吊打671B巨无霸?普林斯顿清华联手扔出AI数学界”王炸”!

2025年7月24日14时 作者 小兵的AI视界

明方面取得了显著进展。
Goedel-Prover-V2
是由普林斯顿大学、清华大学、英伟达等顶尖机

分类 开源 标签 AutoTokenizer、 Goedel-LM、 Goedel-Prover-V2-32B、 Hugging Face、 PyTorch、 Transformers 发表评论

LatentCoT-Horizon:探索隐式推理与语言模型的前沿研究

2025年7月19日16时 作者 NLP工程化

LatentCoT-Horizon汇集了2025年最新的隐式推理相关论文和代码,涵盖多种方法及应用场景,提供优化策略。

分类 开源 标签 2025年、 ArXiv、 LatentCoT-Horizon、 Python、 PyTorch、 TensorFlow 发表评论

Qwen3-RL训练过程详解

2025年7月16日19时 作者 机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进

分类 学术 标签 2023-10-05、 MLNLP、 NLP Conference、 PyTorch、 技术交流群邀请函、 自然语言处理 发表评论

torch-profiling-tutorial:PyTorch模型性能优化的利器

2025年7月15日0时 作者 NLP工程化

PyTorch模型性能优化教程:简单易用的性能分析工具与GPU效率提升方法详解

分类 开源 标签 GPU效率、 PyTorch、 优化前、 优化后、 性能分析、 教程 发表评论

Ring-lite:2.75B参数碾压大模型?蚂蚁开源推理神器如何做到小身材大智慧

2025年7月10日14时 作者 小兵的AI视界

ite
,
作为一款基于
MoE
架构的轻量级推理模型,凭借其创新的
C3PO
强化学习训练方法和高

分类 开源 标签 8192、 Inclusion AI、 PyTorch、 Ring-lite、 Transformers、 因果语言模型 发表评论

还在为AI数据发愁?张文涛和鄂维南院士团队推出Data-centric AI系统

2025年7月8日23时 作者 机器之心

。然而,这些公司通常并不公开其原始数据及数据处理工具,使得学术界在大模型训练数据的构建与优化方面难以

分类 学术、 资讯 标签 DataFlow、 NumPy、 pandas、 PyTorch、 模型训练、 算子组合 发表评论

从 0 手撕 LLM 分布式训练:DP, ZeRO, TP, PP, CP, EP

2025年7月7日14时 作者 GiantPandaCV

小冬瓜AIGC发布的X-R1开源框架课程,手撕PyTorch的五大并行算法DP、TP、PP、CP、EP,并实现分布式训练中的关键算法如Backward和MoE。该课程包含实操项目及多个测评工具,适合对LLM技术有兴趣的学员。

分类 学术 标签 DP、 EP、 MoE、 PyTorch、 TP、 分布式训练 发表评论

Gemini负责人爆料!多模态统一token表示,视觉至关重要

2025年7月3日16时 作者 量子位

刚刚,Gemini模型行为产品负责人
Ani Baddepudi
在谷歌自家的开发者频道开启了爆料模

分类 资讯 标签 Google Lens、 PyTorch、 TensorFlow、 多模态AI、 教育领域、 用户体验 发表评论

难度爆表!从 LLM 到 Infra,手撕 5 大并行训练算法

2025年6月30日14时 作者 PaperAgent

现高校LLM对齐研究课程介绍,涵盖手撕PyTorch五大并行算法DP、TP、PP、CP和EP,以及Backward梯度计算与重叠通信技术。课程内容丰富,提供多卡DeepSpeed RLHF训练及垂域大模型实操项目。

分类 分享 标签 OpenAI、 PyTorch、 RLHF、 ZeRO-Adam、 分布式训练、 多模态 发表评论

miniDiffusion,一个用PyTorch重新实现的Stable Diffusion 3.5

2025年6月25日8时 作者 NLP工程化

miniDiffusion是用PyTorch实现的Stable Diffusion 3.5项目,包含核心组件和训练/推理脚本,用于教育和实验目的。

分类 开源 标签 GitHub、 miniDiffusion、 PyTorch、 Stable Diffusion、 Yousef Rafat、 教育实验 发表评论
较早文章
页面1 页面2 … 页面8 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×