DeepSeek 领跑 AI 数学,阿里重磅开源 Qwen3,小米首秀 MiMo-7B! AI Weekly 4.28-5.4
数学证明模型 Prover-V2
:MiniF2F-test 达 88.9% 通过率,刷新最高纪录,
数学证明模型 Prover-V2
:MiniF2F-test 达 88.9% 通过率,刷新最高纪录,
DeepSeek 发布了一个专注于数学证明和复杂推理的新模型 DeepSeek-Prover-V2-671B,它是目前全球最大规模的数学定理证明模型。该模型在多个数学评测数据集上表现出色,可应用于数学论文验证、教材开发及数学研究助理等场景。
DeepSeek 新模型引发热议,混合专家模型 DeepSeek-R2 集齐 1.2 万亿参数和 780 亿动态激活参数,成本比 GPT-4 低97.3%,引发广泛关注。
OpenAI 推出轻量版深度研究功能,允许所有用户(包括免费用户)使用该功能。轻量版基于 o4-mini 模型,回复较短但效果几乎与满血版一致。
OpenAI 推出了原生多模态模型 gpt-image-1,支持生成图片、图像编辑及变体功能。定价基于 token 计算,最高质量的图像生成成本约 0.2 美元。该 API 已在多个头部公司产品线中落地应用。
xAI的新功能Grok Studio结合了文档、代码编辑和IDE的特性,支持分屏预览实时协作,并能直接从Google Drive导入数据。它比前辈如ChatGPT Canvas和Claude Artifacts在多语言支持和免费使用方面更为全面。
谷歌推出学生专属教育优惠,提供15个月免费使用Gemini Advanced模型、2TB云存储和AI办公工具等福利。面向美国地区的学生,并且需要通过EDU邮箱验证身份。
OpenAI发布的新模型GPT-4.1接入公众号,提供超长记忆、多模态能力等新功能。相比之前版本,GPT-4.1在写作、分析长文档等方面表现更出色,现已免费上线体验。