DeepSeek
张雪峰回应被AI取代:DeepSeek只有公开信息
张雪峰回应DeepSeek对教育行业的影响:打破了信息差但也有情绪价值。其旗下公司主要提供考研和升学规划服务。相关报告《教育科技这一年·2022》等重磅发售。
通俗易懂地说说DeepSeek的原理
DeepSeek 是一款在 AI 领域表现卓越的语言模型,它不仅性能超越 OpenAI 的 ChatGPT,在 App Store 下载排行榜中位居第一。其训练过程包括预训练和后训练两阶段,通过预测互联网文本数据中的下一个 Token 来学习语言规律,并采用指令微调和基于人类反馈的强化学习进行后训练优化。
AI替身:一个工作流,两个DeepSeek
同事推荐DeepSeek后节约她两天工作量,Qwen分享如何利用DeepSeek和Kimi替代传统工作方法,并设计了一整套工作流以实现反推提示词及自动输出图片到自媒体平台的功能。
DeepSeek GRPO 技术揭秘:Unsloth 助力 7GB 显存体验“顿悟时刻”
DeepSeek R1 模型利用 GRPO 算法实现自主学习能力,仅需 7GB 显存即可训练出具备推理能力的模型,大幅降低训练门槛和成本。
历史时刻:DeepSeek GitHub星数超越OpenAI,仅用时两个月
DeepSeek-V3 大语言模型在 GitHub 上的 Star 量超过 OpenAI,其引入动态注意力机制和 MoE 架构大幅降低计算成本。
烧钱超3千亿美元,DeepSeek冲击下云厂商加码算力基建
美国四大云厂商继续大规模投资AI基础设施,尽管有新兴技术路线出现,仍预计资本开支超3000亿美元,包括亚马逊、谷歌、Meta和微软等在内,主要集中在服务器和数据中心建设上。
阿里巴巴10亿美元投资DeepSeek?阿里“已辟谣”
阿里巴巴否认投资DeepSeek,但其加速布局大模型的投资行为引发资本市场关注。自2023年下半年以来,阿里已投资多个AI初创公司,并与DeepSeek有合作。目前对该领域感兴趣的投资人表示将参与融资,认为这将有助于见证AGI的诞生。