刚刚!Qwen3推理模型发布,开源界Top1,比肩o4-mini
阿里发布Qwen3-235B-A22B-Thinking-2507推理模型,参数、上下文等均与前作一致,采用宽松开源协议。该模型在编程和数学能力上表现突出,在知识、创意写作等通用能力上也有显著提升。
阿里发布Qwen3-235B-A22B-Thinking-2507推理模型,参数、上下文等均与前作一致,采用宽松开源协议。该模型在编程和数学能力上表现突出,在知识、创意写作等通用能力上也有显著提升。
DeepSeek发布R1-0528,显著提升代码生成能力,推理速度和质量提高,性能接近OpenAI的o3等前沿模型,在数学、编程和复杂任务上表现出色。
DeepSeek发布V3-0324版本,推理性能大幅提升,并在多项基准测试中超越GPT-4.5。这次更新还增强了前端开发能力、工具调用能力和中文写作能力,同时采用了更高效的训练方法。
LLM模型通过纯强化学习提升推理能力,并提出无需监督数据的新方法。端侧模型性能提升主要依赖蒸馏而非强化学习,DeepSeek-R1-Zero展示了自我进化能力及语言一致性奖励的应用。
谷歌DeepMind团队提出了一种名为‘可微缓存增强’的技术,该技术通过引入外部协处理器来增强大语言模型(LLMs)的键值(kv)缓存,显著提升了推理性能,并在多个基准测试中提高了准确率和性能。