R1 归档 - 每时AI

野生DeepSeek火了，速度碾压官方版，权重开源

2025年7月4日23时作者机器之心

DeepSeek R1T2 是一款由 TNG 公司推出的 AI 模型，其速度比 R1 快 20%，且在智能水平和输出效率之间实现了完美平衡。

DeepSeek升级，媲美OpenAI最强模型！

2025年5月29日11时作者财联社AI daily

DeepSeek开源最新0528 R1版本，性能接近OpenAI o3模型，引发广泛关注。

R1–Zero强化学习路线新发现及R1思路用于GUI Agent动作预测方案

2025年4月2日14时作者老刘说NLP

2025年4月1日，北京天气晴。文章介绍了R1进展中的两个工作，一是研究多种基础模型预训练特性的影响；二是将GRPO-RL强化用于Agent的UI动作预测，数据和奖励函数设计有趣。研究发现Qwen2.5模型在不使用模板的情况下有强大的推理能力，但模板会破坏数学解题能力。此外，文章还讨论了强化学习在图形用户界面（GUI）动作预测中的应用。

人工智能应用就是大模型能力+场景，基于大模型构建应用，首先要了解大模型的能力圈

2025年4月1日14时作者 AI探索时代

大模型的应用在于多体验和尝试不同模型功能差异，理解其能力与其它技术的区别。

介绍了利用 DeepSeek R1 进行法律文档检索增强生成的实践经验

2025年3月8日8时作者 NLP工程化

Skypilot介绍了利用DeepSeek R1进行法律文档检索和生成的经验，并总结了使用专门嵌入模型及加速推理的方法。

R1-Think能力如何用于RAG及多模态场景？Rank1及R1-Onevision实现思路解析

2025年2月28日14时作者老刘说NLP

今天继续看RAG进展，看推理模型用于RAG的两个思路。
另一个看看将R1推理路径用于多模态模型的一个

传DeepSeek R2提速！字节豆包灰测深度思考，微软Copilot已免费开放

2025年2月26日12时作者智东西

科技巨头纷纷推出深度推理模型。微软面向所有Copilot用户免费提供语音和深度思考功能，并宣布由OpenAI的o1模型支持。近期多家AI企业如OpenAI、谷歌等也发布了新的深度推理/深度思考模型。