unsloth 归档 - 每时AI

万亿参数模型Kimi-K2部署、微调需要多大配置及4个代表性的大模型训练框架

2025年7月12日19时作者老刘说NLP

今天是2025年7月12日，星期六，北京有雨。文章介绍了四个代表性大模型训练框架，并使用资源计算器分析了最新万亿参数模型Kimi-K2的运行和微调需求。

2025年5月15日8时作者 NLP工程化

Unsloth 发布了GRPO的新互动教程，用户可以轻松微调Qwen3-Base并开启其思考模式，实现几乎无监督学习。

2025年4月26日8时作者 NLP工程化

Unsloth发布Dynamic v2.0量化版本，在MMLU和KL Divergence上表现更好，并修复了Llama.cpp中的问题，同时推出了新量化版本DeepSeek-R1/DeepSeek-V3-0324。

2025年3月13日14时作者老刘说NLP

enManus-RL增强Agent规划能力训练框架》，https://mp.weixin.qq.co

2025年2月27日16时作者 NLP工程化

通过Unsloth技术减少90%VRAM使用量训练自己的推理LLM模型

2025年2月22日8时作者 NLP工程化

unsloth优化微调框架，Qwen2.5-1.5B模型微调仅需5GB显存。

2025年2月14日8时作者 NLP工程化

该项目是用于微调和优化大型语言模型（LLM）的Python工具库，通过动态量化和显存优化技术提高模型微调速度并降低80%以上显存占用。