1.5% 归档 - 每时AI

策略改写「一战历史」！中科院开源全新博弈智能体框架DipLLM

2025年7月1日16时作者新智元

iplomacy中基于大语言模型微调的智能体框架，仅用Cicero 1.5%的训练数据就实现超越，展

2025年2月27日23时作者量子位

北大团队研究发现，在训练数据中加入随机噪音并不会严重影响语言模型的性能。即使高达20%的数据被污染，模型的预测损失仅上升约1%，并提出局部梯度匹配方法进一步提升其鲁棒性。