跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

R1模型

关于深度思考的一些深度思考:Deepseek官网深度思考模型,真的是DeepSeek-R1吗?

2025年4月10日14时 作者 机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进

分类 学术 标签 DeepSeek、 R1模型、 V3tokenizer、 回答过程、 思考过程、 特殊字符 发表评论

再看行业R1模型如何构建及减少推理大模型过度思考

2025年3月23日14时 作者 老刘说NLP

今天是2025年3月23日,星期日。文章介绍了Fin-R1模型在金融领域的应用及其构建路线,包括数据处理和训练方法,并总结了减少推理大模型过度思考的技术方案。

分类 大模型 标签 Fin-R1、 R1模型、 强化学习、 数据集60k+、 监督微调、 金融计算 发表评论

解剖「百川」:王小川的AI医疗赌局

2025年3月17日14时 作者 智能涌现

卫生军团的消息,聚焦医疗大模型的临床落地。这一消息,在作为“AI六小虎”的百川智能内部,一石激起千层

分类 资讯 标签 R1模型、 医疗业务、 华为医疗军团、 反馈强化学习、 提示词工程、 百川智能 发表评论

Agent or SFT or RL ? 9个多模态R1推理开源项目核心思路解析

2025年3月2日14时 作者 老刘说NLP

个整理的技术工作。
DeepSeek-R1在处理数学、编码、谜题和科学问题以及回应一般问题时表现出出

分类 大模型 标签 R1模型、 SFT+课程式学习、 Transformer、 强化学习、 深度推理、 视频分析 发表评论

速递|DeepSeek 声称其“理论”利润率为 545%

2025年3月2日12时 作者 Z Potentials

DeepSeek 提出其在线服务成本利润率可达 545%,但实际收入低于预期,主要受夜间折扣、较低定价以及免费访问应用程序和网站等因素影响。

分类 国际、 资讯 标签 24小时、 545%、 AI models、 DeepSeek、 R1模型、 理论利润 发表评论

DeepSeek R1 最新全面综述,近两个月的深度思考!

2025年2月20日14时 作者 Datawhale

发者TALK 杭州站《DeepSeek深度技术解析》分享的文字版。由于时间关系,实际分享是本文的简化

分类 分享 标签 R1模型、 开源贡献、 新技术应用、 深度强化学习、 算法工程师、 自反馈机制 发表评论

DeepSeek让所有人都变成了Perplexity

2025年2月14日12时 作者 硅星人Pro

DeepSeek R1带来大模型新趋势,引发众多厂商拥抱开源模型热潮。从定价策略到商业模式,巨头们纷纷加入免费或低收费使用行列。这标志着AI领域正进入一个新的时代。

分类 资讯 标签 DeepSeek、 GPT-4、 R1模型、 微软、 文心一言、 腾讯云 发表评论

两极反转,外国人开始在X上卖中国AI的课了?

2025年2月11日12时 作者 硅星人Pro

老外们开始热捧DeepSeek模型,通过知识付费和教程等形式推广。DeepSeek因其思维链、开源和低成本等特性受到欢迎,并在X平台和YouTube上广泛传播。它已经吸引了一大批开发者和用户的兴趣。

分类 资讯 标签 DeepSeek、 R1模型、 创业机会、 技术分析、 用户增长、 职业转型 发表评论

DeepSeek-R1 是怎么训练的|深度拆解

2025年2月7日14时 作者 赛博禅心

eepSeek 又开源了 DeepSeek-R1 模型(后简称 R1),再次炸翻了中美互联网:
R1

分类 分享 标签 DeepSeek、 GRPO算法、 Qwen、 R1模型、 奖励机制设计、 模型蒸馏 发表评论

DeepSeek低成本AI模型催生光通信需求了

2025年2月5日23时 作者 陳寳

春节前夕发布的大语言模型R1给市场带来了全新活力,重塑了光通信产业。DeepSeek低成本AI模型大幅降低了成本壁垒,使得光通信成为AI数据传输的最佳选择,并推动了其在智慧城市、智能制造等领域的应用拓展。

分类 分享 标签 DeepSeek、 R1模型、 低成本AI、 光通信、 智慧城市、 智能制造 发表评论
较早文章
页面1 页面2 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM MCP Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 马斯克:Grok 4 将「改写」人类所有知识
  • 蚂蚁集团频频出手具身智能,新投资宇树科技、钛虎、灵心巧手
  • 英国研发出新型 “ 机器人皮肤 ” ,可用于人类假肢等需要触觉感知场景
  • Claude要挟人类只为活命!16大模型实测:受到威胁,敲诈勒索绝不犹豫
  • DeepSeek开源生态再下一城!DeepSite V2上线,一句话建网页、做动画、改样式

2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×