实测炸裂!DeepSeek-R1-0528火力全开,国产AI首次正面刚Claude 4!

DeepSeek-R1-0528模型在复杂推理任务中的表现大幅提升,准确率从70%提升至87.5%,代码生成能力增强,整体性能接近OpenAI大模型。新版模型代码生成效率高、交互体验好、长文本处理能力强。

DeepSeek更新刷榜!R1-0528改进编码性能,媲美o3 High和Claude 4

DeepSeek发布R1-0528版本模型,参数规模达到6850亿。该模型在编程、推理和交互等方面提升显著,性能接近OpenAI等旗舰模型,并且价格更为亲民。新模型表现优于上一代,在多个基准测试中表现出色。

Gemini 2.5 全系更新,Deep Think 加持碾压 OpenAI

Google 在 I/O 2025 大会发布了多项重要更新,包括 Gemini 2.5 全系更新、Gemma 3 系列的内存优化和 Imagen 4 的图像细节提升等。同时,Veo 3 支持视频与音频同时生成,Imagen 4 提升了写实和抽象风格图片处理能力,并集成至多个 Google 软件产品中。

智谱深夜开源新一代GLM模型,推理速度快DeepSeek-R1八倍,还启用了全新域名Z.ai

智谱宣布其核心技术链路完全开源,包括基座模型、推理模型和沉思模型等。新发布的GLM-4-32B-0414与GLM-Z1-32B-0414均以32亿参数量媲美更大规模的主流模型,并在工具调用、联网搜索、代码智能体任务等方面表现优异。同时,小尺寸的9B系列模型也开源了。智谱持续推动AI生态建设,为企业提供模型即服务(MaaS)解决方案。

阿里开源推理模型QwQ-32B,实测PK比他大20倍的DeepSeek-R1

阿里巴巴发布全新推理模型QwQ-32B,参数量为32亿,在多项基准测试中与DeepSeek-R1相当或优于OpenAI的模型。展示了出色的逻辑推理、数学分析和知识储备能力,但在处理复杂问题、运用物理知识和理解特定领域概念方面仍有提升空间。