谷歌首款混合推理Gemini 2.5登场,成本暴降600%!思考模式一开,直追o4-mini
谷歌发布首个混合推理模型Gemini 2.5 Flash,引入了革命性”思考预算”功能,性能显著提升,在多个基准测试中表现优异。
谷歌发布首个混合推理模型Gemini 2.5 Flash,引入了革命性”思考预算”功能,性能显著提升,在多个基准测试中表现优异。
UCSD研究团队以经典游戏《逆转裁判》为舞台测试AI推理能力,结果显示o1和Gemini 2.5 Pro表现最佳;通过项目开源,更多经典游戏可用来测试AI模型性能。
多种工具帮助创建吉卜力风格图像和动画。涵盖Clipfly、ChatGPT、Grok、Flux等平台,其中一些能快速生成吉卜力风作品,如蒙娜丽莎主动打招呼的版本。
谷歌发布DolphinGemma大模型,基于30年海豚研究数据训练,能识别并预测海豚声音模式,参数仅400M,可在普通手机上运行。这是人类首次能够与动物进行实时交流的AI模型。
港中文和清华团队推出Video-R1模型,首次将强化学习的R1范式应用于视频推理领域。通过升级的T-GRPO算法和混合图像视频数据集,Video-R1在视频空间推理测试中超越了GPT-4o,并且全部代码和数据集均已开源。
Anthropic推出Claude两项新功能:Research可快速检索网络和内部文件,与Google Workspace集成让用户无缝调用Gmail、日历和文档信息。
ICLR 2025首次大规模引入AI参与审稿,12222条建议被采纳,提升了89%的评审质量。研究发现,AI能有效改进模糊和不具体的评论,并提高作者与审稿人的互动。