资讯归档 - 第718页共1078页

DeepSeek满血微调秘籍来了，全网首发打破低价内卷！解锁升级版全家桶

2025年2月19日12时作者新智元

全网首发！DeepSeek V3/R1满血版低成本监督微调秘籍来了。Colossal-AI发布开源大模型后训练工具箱，支持多种硬件和算法优化。通过简化步骤快速完成私有模型构建，助力提升业务竞争力。

DeepSeek V3+R1满血微调工具上线！一键启动，硬件要求降10倍

2025年2月19日12时作者机器之心

Colossal-AI 发布了大模型后训练工具箱，包含低成本监督微调解决方案及强化学习工具链等。通过 Colossal-AI 的一键启动脚本，用户可以快速完成 DeepSeek V3/R1 模型的微调，并支持多种硬件配置。同时，团队还验证并实现了 GRPO 算法及奖励设计方法用于深度学习模型优化。

ICLR 2025 Spotlight 让城市「动」起来！DynamicCity突破4D大场景生成技术边界

2025年2月19日12时作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，

OpenAI推出真实世界百万报酬AI编程能力测试基准：实测Claude 3.5 最强！

2025年2月19日12时作者 AI寒武纪

OpenAI联合一众大佬发布SWE-Lancer，一个评估前沿LLM在真实软件工程任务中的基准测试。它从Upwork精选了超过1400个真实的软件工程任务，总价值高达100万美元。SWE-Lancer包含个人贡献者和技术领导者的两种类型的任务，采用端到端测试模拟真实环境。研究结果显示模型表现仍有提升空间，OpenAI开源了数据集以促进更多研究。