PyTorch 归档 - 第3页共8页

如何从零构建”小”大语言模型

2025年5月23日8时作者 NLP工程化

通过零基础学习和实现一个大语言模型，让读者仅需Python、PyTorch和基本的深度学习知识即可掌握其各个组成部分及训练微调代码。

2025年5月22日16时作者 NLP工程化

PyTorch通过设置PYTORCH_CUDA_ALLOC_CONF环境变量中的max_split_size_mb参数来优化CUDA显存分配，从而缓解CUDA Out of Memory错误。

MLNLP社区是国内外知名机器学习与自然语言处理社区，旨在促进学术界、产业界和技术爱好者的交流合作。

2025年5月7日14时作者老刘说NLP

PyTorch作为深度学习框架，因其对初学者的友好性和灵活性而受到广泛欢迎。为了帮助用户快速掌握PyTorch常用函数，作者团队整理了一份200+函数手册，并提供书签版PDF和视频资料供下载。

2025年4月18日14时作者老刘说NLP

PyTorch作为深度学习框架之一受到广泛欢迎，本文推荐了一份包含超200个常用函数的PDF手册，并提供视频学习资料，覆盖神经网络训练和设计等内容。

2025年4月17日16时作者 HyperAI超神经

题组开发了一个专为蛋白质工程量身打造的一站式开放平台 VenusFactory，HyperAI超神经

2025年4月15日8时作者 NLP工程化

GRPO训练实现极简依赖版本，仅依赖tokenizers和pytorch完成分词与训练。