量子位
大模型终于通关《宝可梦蓝》!网友:Gemini 2.5 Pro酷爆了
谷歌CEO劈柴哥宣布大模型Gemini成功通关《宝可梦蓝》,成为首个登顶的大型语言模型。Gemini在游戏过程中详细思考每个步骤,展示了其理解游戏的能力和局限性。
68页论文再锤大模型竞技场!Llama4发布前私下测试27个版本,只取最佳成绩
大模型竞技场存在系统问题,包括厂商私下测试多个模型版本、数据访问不平等和排名变化快速。研究团队指出,这可能导致排行榜结果失真,并建议改进策略以提高其可信度。
Claude网页版接入MCP!10款应用一键调用,开发者30分钟可创建新集成
Claude新增了Integration功能和Research功能更新,并向Max、Team和Enterprise用户开放MCP应用。
一次示范就能终身掌握!让手机AI轻松搞定复杂操作丨浙大&vivo出品
浙大与vivo联合提出LearnAct多智能体框架和LearnGUI基准,通过少量示范学习大幅提升手机GUI智能体的性能。该方法能够有效应对多样化应用中的长尾场景挑战。
又一开源AI神器!将机器学习论文自动转为可运行代码库
PaperCoder 是一个多智能体LLM系统,能自动实现机器学习论文中的代码。它解决了顶会论文代码共享不足的问题,目前在基准测试中表现优于其他框架,并且77%的原作者对生成的代码表示认可。
上海车展见证历史:从「西为中用」到「中为西用」,行业风向标携手Momenta
上汽大众与Momenta在2025年上海车展上宣布合作,标志着中国汽车从’技术输血’到’智能造血’的历史性转变。这次合作被视为合资车企的里程碑时刻,预示着中国汽车标准将走向全球引领。