DeepSeek R1
阶跃星辰发布新一代基础大模型Step3
阶跃星辰发布新一代基础大模型Step3,主打多模态推理能力,在国产芯片上32K上下文推理效率最高可达DeepSeek R1的300%,计划7月31日向全球开源。
开源还要IPO?MiniMax不想被遗忘在这个夏天
六小虎中的MiniMax和智谱正通过发布新模型和产品来证明其在AI领域的能力。近期,MiniMax发布了M1推理模型,参数量为72亿,并推出了通用Agent MiniMax Agent;而智谱则已经提交了上市辅导备案,计划IPO。企业需要面对的挑战之一是实现足够的营收规模。
DeepSeek 跃居全球第二 AI 实验室,中美正式并驾齐驱!
DeepSeek R1 0528 版本在Artificial Analysis的最新排名中得分68分,几乎与闭源模型持平。这反映了开源模型与闭源模型之间差距的进一步缩小,强化学习在提升AI性能方面的效率凸显,并标志着中美两国在人工智能技术领域的齐头并进新阶段。
DeepSeek R1 说这次是小升级,实测后我不信!
DeepSeek AI团队升级了DeepSeek R1模型,新版本在深度思考、写作自然性和持久专注能力上有所提升。通过具体示例展示了其在文本生成和辅助编程设计方面的实力,并强调了中国大模型的进步和发展前景。
DeepSeek R1 的小更新,却大有深意?
DeepSeek R1模型已完成小版本试升级,API接口和使用方式保持不变。主要提升包括语义理解精度提升、逻辑推理稳定性增强、长文本处理回溯更稳定等。此次更新可能是为了安全补丁的考量及产品路线统一的意图。
这道推理题让所有AI大模型集体翻车
在Reddit上出现了一道关于立方体的推理题,多个AI模型未能正确解答。最终通过提示“最长的可见边长应该是5个小正方体”,阶跃AI给出了正确的答案125-46=79个立方体。