多轮强化归档 - 每时AI

如何优化测试时计算？解决「元强化学习」问题

2025年2月10日16时作者机器之心

化大模型的
测试时计算
是提升模型部署效率和节省计算资源的关键一环。前段时间，黄仁勋在 CES 20