谷歌发布Gemini 2.5 Pro:思考模型、原生多模态,编码、数学能力屠榜
谷歌发布的Gemini 2.5 Pro模型在多个基准测试中达到SOTA水平,并且在Arena排行榜上排名第一。它具有强大的推理能力和代码生成能力,在视觉和编程领域表现卓越。
谷歌发布的Gemini 2.5 Pro模型在多个基准测试中达到SOTA水平,并且在Arena排行榜上排名第一。它具有强大的推理能力和代码生成能力,在视觉和编程领域表现卓越。
谷歌发布下一代AI推理模型Gemini 2.5,具备多模态能力,并在多个基准测试中表现优异。该模型通过Google AI Studio提供给开发者,并计划在未来几周公布其API定价。
OpenAI正式推出GPT-4o原生图像生成功能,Sam Altman认为这代表了赋予用户创作自由度的新高度。亮点包括上下文理解、复杂指令执行、文本与图像融合及聊天式交互能力。该功能已向ChatGPT和Sora的Plus、Pro、Team用户以及免费用户提供,并计划扩展至企业版、教育版和开发者API使用。
研究团队首次提出Video-T1方法,通过Test-Time Scaling显著提升视频生成性能,提出Tree-of-Frames方法优化搜索效率和生成质量。
谷歌发布Gemini 2.5 Pro实验版,通过显著增强的基础模型和改进的后训练技术,在多个主流基准测试中实现了大幅领先,尤其在推理和代码能力上表现惊人。