华为盘古风暴升级:吹哨人再发《讨贼檄文》,实锤细节公开
华为盘古模型项目负责人王云鹤被指剽窃成果、技术造假。文章指出,王云鹤调集资源将国产昇腾芯片训练体系替换为NVIDIA方案,并通过135B模型的署名问题进一步曝光人才流失情况。
华为盘古模型项目负责人王云鹤被指剽窃成果、技术造假。文章指出,王云鹤调集资源将国产昇腾芯片训练体系替换为NVIDIA方案,并通过135B模型的署名问题进一步曝光人才流失情况。
华为盘古Pro MoE 72B模型与阿里Qwen-2.5 14B模型在注意力层参数上的相关性高达0.927,引发了业界对模型相似性和版权的广泛讨论。华为否认使用了任何其他开源模型进行训练,并强调其自主开发性质。
这个夏天,有多个新模型(如Grok 4、DeepSeek-R2等)备受期待。近期,关于疑似Grok 4 / Grok 4 Code的基准测试截图引发了广泛关注。这些数据虽然没有被官方认证,但表现出色,尤其是HLE和GPQA测试中表现突出。
功能开启免费测试,支持复杂任务处理,可生成可视化报告并一键转换为播客。
2️⃣
🎯 百度开源文心 4
OpenAI 的 ChatGPT 于 11 月 30 日发布,最初命名‘Chat with GPT-3.5’。产品负责人在最后一刻决定简化为‘ChatGPT’。ChatGPT 凭借简洁的界面和易于上手的特点迅速走红,成为OpenAI历史上最成功的产品之一。
马斯克宣布xAI将跳过Grok 3.5,直接发布Grok 4。新模型包含两个版本:Grok 4和Grok 4 Code,具有强大的文本处理能力和编程相关任务支持。但Grok 4存在多模态限制及上下文长度不足的问题。
谷歌 Gemini 的新功能‘Scheduled Actions’被设计成一个隐蔽的对话形式,用户通过与Gemini进行对话来创建、编辑和测试定时任务。该功能目前仅限于Gemini Pro和Ultra用户使用,并且缺乏明显的操作入口。
DeepSeek-R2 模型因 CEO 对性能不满及美国出口管制影响而推迟发布,目前面临算力短缺问题。该模型原计划在 2025 年初发布,但已延期多周,团队正尝试通过国产替代和优化模型结构来重新建立发布条件。
Gemini 2.5 Pro实验版发布后备受好评,但谷歌于5月中旬关闭了免费层级的API访问通道。经过近一个月的时间,谷歌重新开放了这一功能,并提供了详细的使用指南和第三方客户端介绍。
布的
DeepSeek-R2
因美国对英伟达 H20 芯片出口限制和 CEO 对性能不满而推迟。
2