CUDA-MODE课程笔记 第17课 GPU集合通信(NCCL) 2024年12月31日14时 作者 GiantPandaCV 我的课程笔记,欢迎关注:https://github.com/BBuf/how-to-optim-a
最新!Yann LeCun:AI将成为超级智能,堪比新的文艺复兴,人类新的启蒙 2024年12月23日8时 作者 AI寒武纪 老杨在全球演讲中强调,未来人工智能应是开源和分布式的。他指出基础模型必须开放且可访问,并建议通过合作建立全球分布式训练中心来推动AI发展。
NeurIPS 2024|让模型预见分布漂移:动态系统颠覆性设计引领时域泛化新革命 2024年12月11日8时 作者 极市干货 ↑ 点击 蓝字 关注极市平台 作者丨PaperWeekly 来源丨PaperWeekly 编辑丨极市
大模型长文本所面临的主要问题 2024年12月5日11时 作者 AI探索时代 大模型在处理长文本时面临输入长度限制、计算资源消耗及上下文保持等问题,提出解决方案包括分段处理、滑动窗口、外部记忆机制等方法。