Unsloth 再升级,Qwen2.5-1.5B 模型微调仅需 5GB 显存,较2周前再降29%
近日,Unsloth 团队升级了微调框架,使得使用其Qwen2.5-1.5B模型仅需5GB显存,相比之前减少了约29%。新的Efficient GRPO算法通过优化内存使用效率,使VRAM需求降至原本的54.3GB。
近日,Unsloth 团队升级了微调框架,使得使用其Qwen2.5-1.5B模型仅需5GB显存,相比之前减少了约29%。新的Efficient GRPO算法通过优化内存使用效率,使VRAM需求降至原本的54.3GB。
OpenAI的Deep Research工具推出后,多家厂商跟进开发了类似的应用。基于现有框架或专门设计的开源实现项目提供了快速构建和了解Deep Research应用的方法。
Cline 推出 MCP 应用商店简化 AI 功能安装管理,让更广泛受众轻松使用 AI 工具,实现大众化 AI 开发体验。
Thinking Machines Lab由前OpenAI成员组成,包括Lilian Weng、John Schulman等。该公司强调开源共享、平等享用人工智能,并致力于研发多模态系统和安全措施。
Sam Altman 更新了 OpenAI 的未来路线图,计划首先发布 GPT-4.5(Orion),随后实现核心目标,包括统一 o 系列和 GPT 系列模型并推出更高智能水平的 GPT-5。
英伟达工程师使用DeepSeek-R1模型结合推理时扩展技术,让AI自动生成GPU内核代码,并在某些情况下比人工优化的代码表现更好。
Windsurf Wave 3 是 Codeium 的最新更新,带来了 MCP 支持、Tab-to-jump、’Turbo’模式等功能增强。Wave 3 还增强了编辑体验,并引入了自定义应用图标和 MCP 支持的 Cursor。相关研究表明 AI 编程工具正在快速发展,Vibe 编程成为一种趋势。
一款国产推理加速框架KTransformers介绍,显著提升Hugging Face Transformers的推理速度,支持多种硬件优化策略和接口。