被AI追杀,还要解谜逃生!UCSD等发布LLM测试神器,边玩游戏边评估

新智元报道
编辑:犀牛 好困
GameArena团队开发的《AI Space Escape》游戏通过紧张刺激的密室逃脱方式评估AI模型的推理能力,生成宝贵的游戏数据,并将所有数据公开供进一步研究。该游戏超越了传统的数学和编程基准测试方法。

2025英伟达奖学金名单公布,7位华人入选!中科大浙大校友在列,人均6万美元

新智元报道
编辑:编辑部 HYZh
【新智元导读】
英伟达2025年博士奖学金名单揭晓了!今年,共有

质量超越o1,成本仅4%,UCSD张怡颖教授团队开源生成式AI工作流自动优化器

UCSD 张怡颖教授团队推出的 Cognify 是一款优化生成式 AI 工作流的工具,能够提高 48% 的生成质量并降低 90% 的成本。Cognify 提供了多种模型和提示词进行优化,目前支持 LangChain、DSPy 和基于 Python 的工作流。