学术
从DeepSeek MoE专家负载均衡谈起
上周同事分享了关于线上DeepSeek-R1推理的Expert激活数据的研究,发现专家负载不均衡现象。通过分析论文和内部请求数据,提出了一些关于MoE模型在不同场景下的应用观点,并讨论了细粒度MoE的重要性以及模型深度对Overlap的影响。
在线教程 OpenManus 与 QwQ-32B 强强联合,推理过程全透明
HyperAI超神经上线了OpenManus + QwQ-32B 实现 AI Agent教程,并为新用户提供了1小时4卡RTX A6000免费使用时长的惊喜福利。
李飞飞团队「具身智能」最新研究:机器人接手所有家务
机器之心报道
研究团队开发出BEHAVIOR Robot Suite(简称BRS),一种综合性框架,用于掌握机器人在多样化家庭任务中的移动全身操作。通过JoyLo和WB-VIMA两项关键技术创新,实现对高自由度移动机械臂的流畅控制,并进行高质量的数据收集和学习策略优化。实验结果显示,BRS支持多种日常家务任务,且能高效完成精细操作。
ICLR 2025 Spotlight|Serge Belongie组与ETH提出:「免费」多模态信息助力3D小样本分割!
创新方法:在无需额外标注成本的前提下,融合了文本,2D,3D信息,助力模型更好地适应到新类别。
>>