大语言模型
历史时刻:DeepSeek GitHub星数超越OpenAI,仅用时两个月
DeepSeek-V3 大语言模型在 GitHub 上的 Star 量超过 OpenAI,其引入动态注意力机制和 MoE 架构大幅降低计算成本。
李飞飞、DeepSeek为何偏爱这个国产模型?
阿里云通义千问的Qwen模型在短短时间内取得了显著突破,仅用1000个样本在H100上监督微调26分钟就训练出与顶尖推理模型相当的新模型s1-32B。这一成果引起了AI社区的关注和赞誉,取代了Llama成为开源AI社区的重要标杆基座模型。
突发|刚加入Anthropic的OpenAI联创John Schulman,又离职了!
OpenAI 联合创始人 John Schulman 离职 Anthropic,Anthropic 成为 OpenAI 在人工智能基础模型领域的竞争对手。
DeepSeek访问受限?一招助你无障碍体验“满血版” DeepSeek R1
DeepSeek 爆火后访问受限,秘塔 AI 搜索整合 DeepSeek R1 解决问题。通过稳定访问、实时联网和一站式体验优势,用户无需自建环境即可使用强大的大模型助手。
Andrej Karpathy 提出”Vibe Coding”:AI 时代的新型编程范式
OpenAI 前研究员 Andrej Karpathy 提出了一种新的编程方式——vibe coding(氛围编程),利用大语言模型实现极简交互的自然编程,显著提升开发效率,但也有局限性,如可能产生难以维护的代码。
刚刚,OpenAI发布o3-mini,可免费使用、3大推理模式
今日凌晨,OpenAI发布o3-mini模型,支持多项开发者需求特性,包括函数调用、结构化输出和开发者消息。o3-mini在数学、科学等领域性能表现优异,比OpenAI o1提升明显。
麻省理工大佬: DeepSeek是科技史上伟大时刻,5年后依旧难忘!
专注于AIGC领域的专业社区报道了OpenAI发布的新模型o3-mini及其对DeepSeek R1的评价。Lex认为R1模型在推理过程透明度和性价比方面具有优势,并期待更强大的未来模型出现。