OpenAI发布o3满血版+o4 mini:10倍算力堆出满分视觉推理,AI看图思考新时代

就在今天凌晨,OpenAI发布了满血版o3和o4-mini模型,实现了图像思考能力。两款新模型在数学竞赛及编程任务中表现优异,视觉推理功能增强,支持Python分析、网络搜索等工具协同工作,有望改写专业岗位角色。

DeepSeek新论文提新训练方法SPCT,R2要来了?

近日,DeepSeek和清华大学提出了一种新的训练方法SPCT(Self-Principled Critique Tuning),用于提升点式生成式奖励建模(GRM)的质量和可扩展性。该方法通过让模型学会先定原则、再写点评来改进通用RM的准确性,并实现了推理阶段的可扩展性提升。

实测百度文心大模型X1.vs.阿里Qwen2.5,文心大模型4.5.vs.Gemini 2.0

百度发布文心大模型4.5和X1,价格分别为0.004/0.016元/千tokens和0.002/0.008元/千tokens。文心4.5在多模态任务上表现优异,而文心X1能自主运用工具并具备更强的理解、规划、反思能力。