AI寒武纪，作者每时AI - 第23页共33页

DeepSeek综合征？Yann LeCun：硅谷存在一种“错位的优越感”

2025年2月2日12时作者 AI寒武纪

著名人工智能科学家Yann LeCun批评硅谷某些圈子存在的错位优越感，并将其分为三个阶段的症状：早期、中期和晚期。他认为科学和技术的进步需要更多人参与并积极分享创新成果，强调了开放共享的重要性。

2025年2月1日12时作者 AI寒武纪

OpenAI 推出 o3-mini 模型，主打高性价比推理，适用于 STEM 领域。其优势包括卓越的 STEM 能力、强大的功能特性、灵活的推理模式以及更快的速度和更低的延迟等。

2025年1月31日23时作者 AI寒武纪

Andrej Karpathy 比喻训练大型语言模型 (LLM) 过程像教育学生，提出了背景信息、例题及解答与练习题对应预训练、监督式微调和强化学习的概念。他强调了提供大量背景知识、示范性例子以及实践练习的重要性。

2025年1月31日23时作者 AI寒武纪

DeepSeek发布R1模型引发关注，中国生成式AI正赶超美国。开源权重模型降低了基础模型的成本，推动了更多应用开发机遇。Qwen、Kimi等模型展示了AI领域的发展与潜力。

2025年1月31日23时作者 AI寒武纪

OpenAI宣布与美国国家实验室合作，利用最新推理模型加速科学突破。合作将重点聚焦基础科学研究、疾病治疗、网络安全等领域，并将在洛斯阿拉莫斯国家实验室的超级计算机上部署。

2025年1月30日23时作者 AI寒武纪

大家蛇年好运连连！
DeepSeek 携其最新模型 R1 破空而来，并以“低成本、高性能”之姿，直逼

2025年1月29日12时作者 AI寒武纪

国产 AI 新锐 DeepSeek（深度求索）发布 o1 级别推理模型R1，引发硅谷与全球关注。OpenAI首席研究 Mark Chen 对其表示肯定但态度微妙，强调成本控制和蒸馏技术优势。DeepSeek前实习生 Zihan Wang 回应认为 OpenAI 有保守倾向，质疑开源政策。

2025年1月28日16时作者 AI寒武纪

阿里千问家族迎来了新的旗舰级成员Qwen2.5-VL，重点提升视觉理解、智能体能力和长视频理解能力。亮点包括精准图像识别、智能交互与任务完成、长时间视频内容理解和结构化数据输出等。

2025年1月28日16时作者 AI寒武纪

DeepSeek发布的新多模态模型Janus-Pro-7B在GenEval和DPG-Bench基准测试中击败了OpenAI的DALL-E 3和Stable Diffusion，其解耦视觉编码框架带来灵活性、性能提升和简洁高效的优势。

2025年1月27日8时作者 AI寒武纪

阿里通义千问团队推出Qwen2.5-1M开源模型，支持百万Token上下文长度，并带来闪电般快速的推理框架。