Kimi 刚登顶,阿里连发两模型反击!国产大模型,卷疯了
最近国产大模型竞争激烈,阿里Qwen发布新版本Qwen3-235B-A22B-Instruct-2507及Qwen3-Coder。Qwen3-235B-A22B-Instruct-2507为纯非推理模型,性能优于Kimi K2和Claude 4 Opus;Qwen3-Coder采用MoE架构,支持代理式编程任务,并提供命令行工具以接入开发环境。
最近国产大模型竞争激烈,阿里Qwen发布新版本Qwen3-235B-A22B-Instruct-2507及Qwen3-Coder。Qwen3-235B-A22B-Instruct-2507为纯非推理模型,性能优于Kimi K2和Claude 4 Opus;Qwen3-Coder采用MoE架构,支持代理式编程任务,并提供命令行工具以接入开发环境。
多模态统一嵌入框架UNITE通过Modal-Aware Masked Contrastive Learning解决跨模态干扰,显著提升细粒度检索、指令检索等多个任务性能。
阿里开源首个视觉推理模型QVQ,能读图像解数学题、算沙发面积等。它在多个基准测试中得分70.3分,超过GPT-4o和Claude 3.5 Sonnet。目前处于实验阶段,存在语言混合、递归推理等问题。
阿里发布QVQ开源模型,能在图片和指令间进行推理。QVQ在视觉推理任务中表现出色,在多项基准测试中获得高分,并且在语言混合、递归推理等方面仍存在局限性。