Llama3.1-70B-Instruct 归档 - 每时AI

中科院北大等揭示「蒸馏真相」：除Claude豆包Gemini，其他很多模型都「蒸」过头

2025年1月21日23时作者新智元

新智元报道
编辑：编辑部 HYZ
【新智元导读】
模型蒸馏也有「度」，过度蒸馏，只会导致模型性能下降