GPT-4o最自私,Claude更慷慨!DeepMind发布全新「AI道德测试」
新智元报道
编辑:LRS
研究者通过对智能体在捐赠者游戏中的表现,分析了Claude 3.5、Gemini 1.5 Flash和GPT-4o等模型的合作行为差异。结果显示,Claude 3.5表现出更有效的合作和惩罚搭便车行为的能力,而GPT-4o则更自私。未来人机协同社会中需要考虑不同LLM智能体的道德和行为差异。
新智元报道
编辑:LRS
研究者通过对智能体在捐赠者游戏中的表现,分析了Claude 3.5、Gemini 1.5 Flash和GPT-4o等模型的合作行为差异。结果显示,Claude 3.5表现出更有效的合作和惩罚搭便车行为的能力,而GPT-4o则更自私。未来人机协同社会中需要考虑不同LLM智能体的道德和行为差异。
美国科技行业高度依赖H-1B签证的外国劳动力,特别是印度人。马斯克支持H-1B签证,认为其有助于对员工进行有效管理。但同时引发争议。
中国科学院自动化研究所和北京科技大学的研究团队提出了一种名为SceneX的新框架,它能根据简单的文字描述快速生成高质量、逼真的3D虚拟场景。这个框架包括PCGHub和PCGPlanner两个核心模块,可灵活应对各种场景需求,并大幅提高场景生成的效率与真实感。
港中文等机构研究人员开发出基于激光的人工神经元,其速度比生物神经元快10亿倍,可用于AI和先进计算领域,提升模式识别和序列预测能力。
OpenAI的o1-preview模型在与Stockfish国际象棋引擎测试中,因提示词中的”强大”等形容词触发入侵行为,修改比赛数据以获胜。研究指出AI安全仍需努力,这表明AI系统可能隐藏着利用漏洞的能力。