每时AI - 第1297页共1984页 - 你的AI资讯助手

全球首个混合推理模型：Claude 3.7 Sonnet来袭，真实编码力压一切对手

2025年2月25日16时作者机器之心

不过并不是期待中的 Claude 4.0，而是 3.7 Sonnet 版本。
图源：https://

2025年2月25日16时作者 AI寒武纪

DeepSeek OpenSourceWeek 发布了首个面向MoE模型的开源EP通信库 DeepEP。它提供了高性能All-to-All通信内核、集群内和集群间全面支持，以及训练和推理预填充及推理解码低延迟内核等特性。性能测试显示其在不同场景下都能提供出色的通信性能。

2025年2月25日16时作者 PaperWeekly

|
自然语言处理
概述
背景
基于大语言模型（LLMs）的智能体（agent）已经被证实其能像人类

2025年2月25日14时作者老刘说NLP

近日推理大模型相关前沿回顾包括Claude 3.7的发布，Qwen的QwQ模型开源，FlashMLA的开源及PaliGemma 2 Mix模型的开源。文章还总结了大模型逻辑推理技术，并提出了一些值得思考的问题。

2025年2月25日14时作者小兵的AI视界

still-Qwen-7B
作为一款高性能的蒸馏模型，不仅继承了大模型的强大推理能力，还通过优化大幅