被DeepSeek带火的知识蒸馏,开山之作曾被NeurIPS拒收,Hinton坐镇都没用

《Distilling the Knowledge in a Neural Network》是一篇更偏工程性改进的文章,但它提出了知识蒸馏这一概念,并显著提高了模型的性能。论文被Hinton、Oriol Vinyals和Jeff Dean等专家合写,但因其缺乏创新性和影响力,在2014年被NeurIPS拒收。

OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek

OpenAI公开了O3-mini的推理思维链,允许免费用户和付费用户查看。模型回答了一个关于为什么今天不是星期五的问题时展示了复杂的思考过程,并使用蔡勒公式进行了计算。此外,开发者还讨论了完整思维链对AI的理解和调试影响。

三大竞赛引爆CVPR’25协作智能Workshop全方位探讨多智能体具身系统新机遇,总计1万美元奖金等你来拿

第二届协作智能Workshop将在CVPR 2025大会上举办,主题为‘生成式人工智能时代中的多智能体具身系统’。Workshop将探讨生成式AI技术对多智能体系统的机遇与挑战,并设置三大特色竞赛单元:协同与端到端自动驾驶挑战赛、双臂协作机器人竞赛和人机交互挑战赛。