KL散度最小化归档 - 每时AI

策略改写「一战历史」！中科院开源全新博弈智能体框架DipLLM

2025年7月1日16时作者新智元

iplomacy中基于大语言模型微调的智能体框架，仅用Cicero 1.5%的训练数据就实现超越，展