AI工程化

Unsloth 再升级，Qwen2.5-1.5B 模型微调仅需 5GB 显存，较2周前再降29%

2025年2月23日16时作者 AI工程化

近日，Unsloth 团队升级了微调框架，使得使用其Qwen2.5-1.5B模型仅需5GB显存，相比之前减少了约29%。新的Efficient GRPO算法通过优化内存使用效率，使VRAM需求降至原本的54.3GB。

2025年2月22日23时作者 AI工程化

OpenAI的Deep Research工具推出后，多家厂商跟进开发了类似的应用。基于现有框架或专门设计的开源实现项目提供了快速构建和了解Deep Research应用的方法。

2025年2月21日12时作者 AI工程化

Cline 推出 MCP 应用商店简化 AI 功能安装管理，让更广泛受众轻松使用 AI 工具，实现大众化 AI 开发体验。

2025年2月19日23时作者 AI工程化

这是一个由@liucong开源的中文数据集，包含Math、Exam、STEM和General四类数据，总样本数为110K。

2025年2月19日8时作者 AI工程化

Thinking Machines Lab由前OpenAI成员组成，包括Lilian Weng、John Schulman等。该公司强调开源共享、平等享用人工智能，并致力于研发多模态系统和安全措施。

2025年2月18日16时作者 AI工程化

xAI 推出Grok 3，性能提升一个数量级，超越Gemini 2 Pro和GPT-4等模型。

2025年2月17日16时作者 AI工程化

Sam Altman 更新了 OpenAI 的未来路线图，计划首先发布 GPT-4.5（Orion），随后实现核心目标，包括统一 o 系列和 GPT 系列模型并推出更高智能水平的 GPT-5。

2025年2月15日16时作者 AI工程化

英伟达工程师使用DeepSeek-R1模型结合推理时扩展技术，让AI自动生成GPU内核代码，并在某些情况下比人工优化的代码表现更好。

2025年2月14日12时作者 AI工程化

Windsurf Wave 3 是 Codeium 的最新更新，带来了 MCP 支持、Tab-to-jump、’Turbo’模式等功能增强。Wave 3 还增强了编辑体验，并引入了自定义应用图标和 MCP 支持的 Cursor。相关研究表明 AI 编程工具正在快速发展，Vibe 编程成为一种趋势。

2025年2月14日8时作者 AI工程化

一款国产推理加速框架KTransformers介绍，显著提升Hugging Face Transformers的推理速度，支持多种硬件优化策略和接口。

较早文章

较新文章