ICML Spotlight 2025丨追求概率质量的帕累托最优:基于广义α-β散度引导的知识蒸馏框架ABKD
本文研究知识蒸馏中FKLD和RKLD的次优表现,提出α-β散度框架ABKD来平衡难度集中与置信集中效应。通过实验验证了ABKD的有效性,并提出了敏感性分析以进一步优化模型性能。
本文研究知识蒸馏中FKLD和RKLD的次优表现,提出α-β散度框架ABKD来平衡难度集中与置信集中效应。通过实验验证了ABKD的有效性,并提出了敏感性分析以进一步优化模型性能。
硅基流动宣布完成数亿元A轮融资,阿里云领投。该公司专注于AI Infra领域,致力于破解AI算力问题,并推出一站式异构算力纳管平台及大模型云服务平台SiliconCloud。
本文介绍了一篇被CVPR 2025接收的论文AdaCM2,该研究提出首个支持超长视频理解的跨模态记忆压缩框架。通过观察视频与文本交互过程中的帧内注意力稀疏性和层间语义冗余性,提出了逐帧回归式建模、跨模态注意力打分和分层压缩机制等关键技术点,显著提高模型性能并降低内存消耗。
2025中国AI算力大会即将在北京举办,阿里云卢晓伟将作《超大规模MoE对AI基础设施带来的挑战和机遇》报告。会议涵盖AI推理算力、智算中心等专题论坛及研讨会。
Ilya Sutskever 在多伦多大学荣誉理学博士学位颁发仪式上的演讲内容,他指出人工智能将能够完成人类所有的工作,带来巨大挑战与机遇。通过生物计算机的类比强调AI潜力,并呼吁人们积极观察和准备即将到来的变化。