AI“压力面”,DeepSeek性能暴跌近30% 清华&上海AI Lab

给大模型来一场‘压力测试’,研究团队设计REST框架,在一个多任务并行推理场景中发现顶级模型的表现大幅缩水。通过上下文预算分配、跨问题干扰抵抗和动态认知负载管理等能力评估,揭示了当前评测方法的局限性,并提出了新的评测数据构建范式。

踩坑与经验:我在评论区,发了 1262 个激活码

上周五发布文章《Fellou:AI 的「组团打工」时代,由中国团队揭幕》,承诺留言用户将获得邀请码。通过脚本在评论区成功发放了300个邀请码,并分享了实现这一任务的方法和教训,包括如何高效利用管理员权限及JavaScript脚本来批量回复用户留言。