Grok 4 实测全纪录:数学、写作、编程全拉垮,马斯克最强 AI 翻车了?
Grok 4发布引发争议,实测表现不佳。在数学推理和写作测试中多次出现错误,编程能力也未达到预期,对比其他模型存在明显差距。
Grok 4发布引发争议,实测表现不佳。在数学推理和写作测试中多次出现错误,编程能力也未达到预期,对比其他模型存在明显差距。
月之暗面发布Kimi K2模型,拥有1万亿总参数和320亿激活参数的混合专家(MoE)模型。该模型在编码、数学及工具使用方面达到头部大模型水平,并支持指令微调以供聊天和智能体应用。其训练过程采用MuonClip优化器解决大规模预训练中的注意力问题,通过虚拟世界模拟数据提升Agent能力。
AI芯片初创公司Groq寻求3-5亿美元融资,投后估值可达60亿美元。该公司专注于推理市场,计划在沙特和芬兰建设数据中心以促进销售。Groq已筹集超过10亿美元的权益融资,并预计今年收入将增长四倍以上。
AWS将于7月15日在纽约市推出AI智能体市场,Anthropic已成为其合作伙伴之一。该市场将帮助初创企业触达更多客户,并可能带来显著增长动力。
马斯克在发布会上介绍了xAI的新模型Grok 4,表示它达到了博士水平。Grok 4分为标准版和Heavy版本,后者由四个智能体构成,适用于复杂任务。Grok 4的价格为300美元/月或3000美元/年,并且支持多种输入方式和API调用。
MaintainX,一家工业制造监控维护软件初创公司,在最近的一轮融资中获得了1.5亿美元资金。该公司将利用这些资金加速研发、拓展市场并进军政府领域。
华为盘古模型项目负责人王云鹤被指剽窃成果、技术造假。文章指出,王云鹤调集资源将国产昇腾芯片训练体系替换为NVIDIA方案,并通过135B模型的署名问题进一步曝光人才流失情况。