小而强大,阿里开源全球最强开源模型 Qwen3!
Qwen3 是全球最强开源模型。它在代码、数学、通用能力等基准测试中超越了 DeepSeek-R1 等顶级模型,并且仅需4张H20就能实现本地部署,成本仅为DeepSeek-R1的35%。
Qwen3 是全球最强开源模型。它在代码、数学、通用能力等基准测试中超越了 DeepSeek-R1 等顶级模型,并且仅需4张H20就能实现本地部署,成本仅为DeepSeek-R1的35%。
阿里巴巴开源新一代通义千问Qwen3系列模型,包含8款不同尺寸。旗舰模型Qwen3 235B采用混合专家(MoE)架构,在多项测评中超越DeepSeek-R1、OpenAI-o1等主流模型。性能提升体现在推理、指令遵循、工具调用、多语言能力等方面。Qwen3全尺寸发布后,社区反响热烈,参数正在“变小”但保持出色表现。
以色列初创公司Lightrun完成7000万美元B轮融资,其可观测性平台旨在识别并修复代码问题。该公司指出市场上急需此类工具,并强调AI编码导致代码量激增及问题丛生的现状。
Megagon实验室提出了一种新的框架Insight-RAG,通过洞察力识别器、挖掘器和生成器三步,提高模型在深层信息检索和多源信息聚合任务中的性能。
阿里开源最新大模型Qwen3,在多个测试平台上超越知名模型。Qwen3支持多种语言和方言,覆盖119种语言,包含2个MoE模型权重及6个Dense模型。其预训练数据集庞大,涵盖36万亿token,性能与Qwen2.5相当甚至超过。