每时AI - 第1417页共1984页 - 你的AI资讯助手

4500美元验证强化学习「魔力」，1.5B模型也能超越o1预览版，模型、数据、代码全开源

2025年2月12日23时作者机器之心

DeepScaleR-1.5B-Preview 成功复现 Deepseek-R1 的训练方法，成本仅需4500美元。该模型在AIME2024竞赛中超越了O1-Preview，展示了小模型通过强化学习也能实现飞跃的潜力。

2025年2月12日23时作者极市干货

B！多机构联手巧妙应用计算最优TTS策略，不仅0.5B模型在数学任务上碾压GPT-4o，7B模型更是

2025年2月12日23时作者智东西

欧洲启动InvestAI计划，旨在调动2000亿欧元投资AI领域，建设4座AI超级工厂提供算力资源和服务，目标成为全球AI强国。

2025年2月12日23时作者 PaperWeekly

大语言模型（LLMs）的注意力头功能与工作机制引起了广泛关注。《Attention Heads of Large Language Models》综述论文整合了现有研究，提出四阶段认知框架和详细分类，并梳理实验方法与评估基准，为LLM可解释性研究提供了系统性的理论支持与实践指导。

2025年2月12日23时作者机器之心

50B 的性能。
这是一种全新的语言模型架构，能够通过使用循环语言模型在潜在空间中隐式推理，显著提升

2025年2月12日23时作者智东西

苹果正在与中国互联网巨头阿里巴巴合作开发中国版AI功能。此前曾考虑百度，但因DeepSeek团队缺乏支持大型客户的资源和技术经验而放弃。

2025年2月12日23时作者新智元

国优先」，不接受任何国家的强加监管，拒签70多个国家和组织参与的「AI宣言」。欧洲「背水一战」，斥资

2025年2月12日23时作者智东西

DeepSeek已集成至上百款应用，涵盖金融、教育、医疗等多个场景。开发者可通过满血版和蒸馏小模型等选择接入，提高用户体验。

2025年2月12日23时作者 PaperWeekly

的 Gemini、DeepSeek 和 Qwen-QwQ 等，通过模拟人类推理过程，在多个专业领域

2025年2月12日23时作者极市干货

径比较清晰，意在初步梳理DeepSeek技术的演进及进化之路，主要包括三大方向：大语言模型、视觉语言