谷歌DeepMind深夜放核弹:世界模型Genie 3登场,重新定义“生成式AI”
谷歌DeepMind发布第三代通用世界模型Genie 3,可以生成实时交互式环境,实现实时导航、一致性和高分辨率。其突破包括实时性能、长时程一致性以及可提示的世界事件能力。
谷歌DeepMind发布第三代通用世界模型Genie 3,可以生成实时交互式环境,实现实时导航、一致性和高分辨率。其突破包括实时性能、长时程一致性以及可提示的世界事件能力。
OpenAI发布开源推理模型gpt-oss,采用混合专家架构和4位量化方案。gpt-oss-120b可在单个H100GPU上运行,gpt-oss-20b在16G内存笔记本上可运行。模型在Codeforces和Humanity’s Last Exam等测试中表现优于现有模型,但幻觉问题较高。
谷歌与Kaggle联合推出Game Arena平台,以战略游戏评估AI模型。8月5日将举行首次LLM象棋比赛,八大顶尖AI模型参与,包括谷歌、OpenAI等。平台开放且透明,可测试通用问题解决能力。
陶哲轩指出,美国政府暂停加州大学洛杉矶分校联邦拨款,称其未能促进无反犹主义和偏见的研究环境。这一决定对学术研究造成损害,并未遵循正当程序。个人影响有限,但IPAM等机构面临关闭风险,这将严重影响年轻学者的成长。
OpenAI面临数据瓶颈和技术难题,GPT-4.5项目因性能未达预期而降级为GPT-4.5。GPT-5将提升编程与数学能力,并引入通用验证器技术,但仍是渐进式改进而非革命性飞跃。OpenAI内部存在人才流失、路线冲突和高层矛盾等问题。
OpenAI即将发布的开源大模型详情曝光。120亿参数混合专家模型在推理时仅激活约50-60亿参数,采用Float4量化技术并使用滑动窗口注意力和注意力汇聚技术处理超长上下文窗口。
谷歌DeepMind掌门人Demis Hassabis在播客中分享了关于AGI实现的时间表和宇宙、现实与AI的大一统哲学思想,提出了信息是比能量和物质更根本的宇宙单位的观点,并认为P vs NP问题是一个物理问题。
杰弗里·辛顿在WAIC开幕式上警告称,我们正在创造比自己更聪明的AI,就像在家里养了一头老虎。他建议全球合作研究如何训练AI向善。