被DeepSeek带火的知识蒸馏,开山之作曾被NeurIPS拒收,Hinton坐镇都没用

《Distilling the Knowledge in a Neural Network》是一篇更偏工程性改进的文章,但它提出了知识蒸馏这一概念,并显著提高了模型的性能。论文被Hinton、Oriol Vinyals和Jeff Dean等专家合写,但因其缺乏创新性和影响力,在2014年被NeurIPS拒收。

50美元复现DeepSeek R1,李飞飞团队为何也选了阿里Qwen

阿里云通过开源领先模型繁荣AI生态,推动技术创新与商业良性循环。通义千问系列模型屡获佳绩,吸引开发者和企业加入其云计算平台,实现’全尺寸、全模态、多场景’的开源布局。

中国主导身体,英伟达要做大脑,特斯拉“做整合”——大摩详解人形机器人100强公司!

大摩发布《Humanoid 100》报告,梳理全球人形机器人产业链的100家核心上市公司。中国在供应链中占据63%份额,尤其在’身体’环节优势显著。特斯拉、英伟达等科技巨头成为各环节的关键力量,人形机器人市场潜力巨大,或成未来十年科技投资最大主题之一。