何恺明新身份:谷歌DeepMind杰出科学家
何恺明加入谷歌担任DeepMind杰出科学家。近期因发表《Mean Flows for One-step Generative Modeling》等论文而知名,曾获CVPR最佳论文奖和Marr Prize等奖项。毕业于清华物理系基础科学班,博士期间在微软亚洲研究院视觉计算组实习。目前为MIT副教授,研究涵盖了图像生成、残差网络等领域。
何恺明加入谷歌担任DeepMind杰出科学家。近期因发表《Mean Flows for One-step Generative Modeling》等论文而知名,曾获CVPR最佳论文奖和Marr Prize等奖项。毕业于清华物理系基础科学班,博士期间在微软亚洲研究院视觉计算组实习。目前为MIT副教授,研究涵盖了图像生成、残差网络等领域。
作者熊璟介绍其研究工作,提出ParallelComp方法解决大语言模型在处理超长文本时存在的瓶颈问题。该方法包括并行注意力分块、KV缓存智能淘汰与注意力偏差校准三项创新技术,通过减少显存消耗和优化注意力分布,使得模型能高效处理128K长度以上的上下文,显著提升推理效率。
RSS 2021 大会揭晓多个奖项,包括杰出 Demo 论文奖、杰出系统论文奖、杰出学生论文奖和杰出论文奖。其中,FEAST 系统荣获杰出论文奖,展示了其在个性化家庭用餐辅助中的优势。
谷歌DeepMind发布首个适用于机器人直接部署的GeminiRoboticsOn-Device模型,无需互联网连接即可运行,展示出强大的通用灵活性和任务泛化能力。
本文提出了一种名为ToMAP的新模型,它结合了心智理论机制以增强语言模型在说服任务中的表现。通过引入反驳预测器和态度预测器两大模块,ToMAP能够预判对方可能提出的反论点并评估其态度变化,从而实现更具个性化、灵活性和逻辑性的说服过程。
Der8auer 使用 Shunt Mod 将一块华硕 ROG Astral LC RTX 5090 改装到可承受高达 800W 功率,使其性能超越了售价 10,000 美元的 RTX Pro 6000。然而,这种改装可能对 GPU 的寿命造成风险。