大模型
杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距
阿里自研Qwen2.5-Max在Chatbot Arena大模型竞技场中表现优异,总分1332位列第七。尤其在编程、数学方面突出,综合排名第三,超越谷歌Gemini家族和Llama 3.1等模型。
硅基流动上线DeepSeek R1&V3推理服务!和华为云合作,全国产服务
硅基流动联合华为云发布大模型云服务平台SiliconCloud,首发上线DeepSeek-V3和DeepSeek-R1两款基于昇腾的推理服务。特点包括零部署门槛、稳定生产级服务等。
中国不只有DeepSeek,阿里除夕夜抛出重磅新模型,是时候整体重估中国AI资产了吗?
阿里云发布Qwen2.5-Max大模型,在多个权威基准测试中表现出与全球顶级模型比肩的性能。该模型采用超大规模MoE架构,支持高达100万token的上下文窗口,并在低成本高性能方面具有潜力,引发市场对中国AI资产重估的讨论。