编码新王者?谷歌未发布模型 “夜语者” 现身竞技场,初测:比Gemini 2.5 Pro更强,或成下一个SOTA!

Google 继续扩大领先优势,传言其即将发布“Nightwhisper”编码模型。Gemini 2.5 Pro在多个竞技场中表现出色,尤其是在代码和推理方面表现突出。Gemini-2.5-pro在多项选择题测试中获得最高分,并在Mensa挪威测试中智商达到130。Qwen也将在4月第二周发布,能否超越Gemini-2.5-pro值得关注。

AI就是所有人疯狂竞争,最后Google赢得比赛的游戏?

2022年底ChatGPT推出后,Google被打了个措手不及。经过数月努力,Google推出了Gemini,并不断进行功能更新,使其与竞争对手OpenAI竞争。Gemini在图像编辑、开源模型、搜索融合及机器人技术方面取得进展,展示了Google在人工智能领域的潜力和决心。

速递|高中生在《我的世界》发起AI智力标准,百万建造玩家投票选出最佳模型

A high school student developed MC-Bench, a website that allows AI models to compete in Minecraft builds. The platform uses the popular game as a test of AI’s creativity and capability. Users can vote on which model created the best build, while Anthropic, Google, OpenAI, and Alibaba are among the contributors funding the project.