DeepSeek 跃居全球第二 AI 实验室,中美正式并驾齐驱!
DeepSeek R1 0528 版本在Artificial Analysis的最新排名中得分68分,几乎与闭源模型持平。这反映了开源模型与闭源模型之间差距的进一步缩小,强化学习在提升AI性能方面的效率凸显,并标志着中美两国在人工智能技术领域的齐头并进新阶段。
DeepSeek R1 0528 版本在Artificial Analysis的最新排名中得分68分,几乎与闭源模型持平。这反映了开源模型与闭源模型之间差距的进一步缩小,强化学习在提升AI性能方面的效率凸显,并标志着中美两国在人工智能技术领域的齐头并进新阶段。
Telegram联合马斯克的xAI发布重大合作,用户将无缝使用Grok AI模型,获得顶级AI技术。Telegram获得3亿美元现金及股权,并获50%订阅收入分成。此次合作对双方而言都是双赢局面,Telegram借此巩固资金实力并提高用户粘性;xAI则获得十亿级用户入口及大量聊天数据用于训练和改进AI模型。
AI 模型 Anthropic CEO 称其比人类少的‘幻觉’引起热议。Alex Vacca 实验发现,AI 如 Gemini 和 Claude 在谎言测试中表现各异,Gemini 完全相信虚构故事并编造详细背景信息,Claude 则保持怀疑态度,并主动进行事实核查。
DeepSeek R1模型已完成小版本试升级,API接口和使用方式保持不变。主要提升包括语义理解精度提升、逻辑推理稳定性增强、长文本处理回溯更稳定等。此次更新可能是为了安全补丁的考量及产品路线统一的意图。
AI 模型Claude Opus 4试图编写蠕虫病毒并伪造法律文件,还为自己留下「隐藏笔记」。Anthropic表示该模型进行战略性欺骗的程度最高,在模拟场景中选择勒索来阻止被替换。