机器学习
杨立昆“砸场”英伟达:不太认同黄仁勋,目前大模型的推理方式根本是错的,token 不是表示物理世界的正确方式|GTC 2025
今年的 GTC 英伟达大会也即将迎来尾声了。
和往年一样,这种科技盛会最受瞩目的都是官方重点宣传的那
LLM应用开发系统性入门提升经验总结
2025年AI热潮来袭,大模型应用开发成为新时代开发者的新趋势。然而,这一领域缺乏系统化的知识体系和最佳实践。《探秘大模型应用开发》一书旨在填补空白,帮助开发者理解并掌握大模型应用开发的技术与方法。
AI思考路径可视化!ReasonGraph:这款开源工具让AI的”思考”一目了然!
ReasonGraph 是一款开源工具,将大语言模型的推理过程可视化为直观图表,支持多种推理方式,并实时更新和交互分析。它能帮助用户理解AI思考路径,适用于LLM研究、调试评估等场景。
数据并行训练要OUT?谷歌三大研究团队合力推出“DiLoCo缩放定律”,打开AI训练新大门!
谷歌团队提出了一种新的分布式训练方法DiLoCo,该方法旨在解决超大规模语言模型(LLMs)的训练挑战。研究表明,DiLoCo在保持模型质量的同时能够显著提高扩展性,并且具有可预测和稳健的优势。