DeepSeek R2意外泄露~

DeepSeek R2信息遭到泄露:
  • 1.2T参数,78B激活,混合MoE架构

  • 比GPT-4o便宜97.3%(每百万输入0.07美元,每百万输出0.27美元)

  • 5.2PB训练数据,在C-Eval 2.0上达到89.7%的准确率

  • 更好的视觉能力,在COCO数据集上达到92.4%的准确率

  • 在华为昇腾910B芯片上达到82%的利用率

    有网友表示如果这些关于DeepSeek R2的信息有一半是真的,那将是震撼性的:
    DeepSeek R2 更详细的信息:
    更多信息:《动手设计AI Agents:CrewAI版》、《高级RAG之36技》、新技术实战:中文Lazy-GraphRAG/Manus+MCP/GRPO+Agent、大模型日报/月报、最新技术热点追踪解读(GPT4-o/数字人/MCP/Gemini 2.5 Pro)

    https://www.jiuyangongshe.com/a/1h4gq724su0

    (文:PaperAgent)

    发表评论

    ×

    下载每时AI手机APP

     

    和大家一起交流AI最新资讯!

    立即前往