PyTorch
RTX 4090单卡跑满血版DeepSeek-R1?清华&趋境科技联合推出KTransformers方案!
清华大学博士生木易介绍如何使用KTransformers库在RTX 4090 GPU上运行DeepSeek-R1/V3模型,包括环境搭建、模型加载及推理参数设置等步骤。
神经网络理论与技术学习以及工具
文章介绍了神经网络模型的学习方法,包括数学计算工具(如PyTorch和TensorFlow)以及神经网络模型结构。强调了理论基础的重要性,并提到了训练过程中的损失计算、反向传播等步骤。学习建议是从案例开始实现自己的神经网络模型,理解其工作机制再深入实践。
关于神经网络的一些思考与感受
文章讲述了神经网络模型的重要性以及设计不同类型模型来解决不同问题的必要性。文章还提到了训练数据的质量和使用TensorFlow或PyTorch框架的技术实现,强调了实践对于理解神经网络运作机制的重要性。
神经网络技术栈介绍——PyTorch,Transformer,NLP,CV,Embedding
文章介绍了神经网络的基本概念及其在不同任务领域中的应用,包括RNN、CNN和Transformer等模型。指出PyTorch和TensorFlow是实现这些思想的具体工具,并强调了神经网络与自然语言处理(NLP)和计算机视觉(CV)任务结合的重要性。同时提醒学习者不要过分依赖神经网络技术来解决NLP和CV的问题。
PyTorch Forecasting:基于PyTorch的时间序列预测工具
PyTorch Forecasting:一个基于PyTorch的时间序列预测工具,支持用户实现高精度预测,适用于专业人士和初学者。