12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私”|谷歌DeepMind研究

Google DeepMind联合研究者发现不同模型组的智能体在游戏中表现出不同的合作倾向。Claude与Sonnet偏好合作,而GPT-4o则倾向于自私。实验通过引入惩罚机制来探索模型的合作行为影响。

GPT-4其实根本听不懂声音?港中文、斯坦福等联合打造视觉听觉评估新基准

多模态大模型在听觉任务上表现不佳,甚至无法正确分辨明显不同的声音大小。研究团队提出了DeafTest和AV-Odyssey基准测试,揭示了现有模型在音频感知上的短板,并激发了对未来AI模型的改进方向。

OpenAI 在亚洲的首届黑客松,这三个作品获奖了

上周在OpenAI的开发者活动中,他们与GovTech合作举办了一场亚洲首届黑客马拉松。活动主题为”AI for the Public Good, for Singapore and the World”,鼓励开发者将OpenAI API应用于公共利益项目。最终评选出三名优胜作品。第一名应用了一款自动化服务应用程序以提高老年人的服务效率;第二名制作了一款语言学习游戏来推广普通话;第三名为帮助老年用户服药提醒和副作用监测的应用赢得了第一名。