AR智能革命!Satori系统读懂人类意图,科幻电影场景成现实
纽约大学与Adobe联合研究团队提出Satori系统,通过结合BDI模型、大语言模型结构认知及多模态指示生成技术,实现AR辅助系统的理解和行为判断能力升级。
纽约大学与Adobe联合研究团队提出Satori系统,通过结合BDI模型、大语言模型结构认知及多模态指示生成技术,实现AR辅助系统的理解和行为判断能力升级。
钱成博士提出了ToolRL方法,通过强化学习解决了大语言模型在使用工具时的泛化问题。该研究已在多个学术会议上发表,并由ACL Area Chair钱成领导。
MLNLP社区致力于推动国内外自然语言处理领域的学术与应用交流。最新文章探讨了大型推理模型的安全性问题及其对隐私、法律合规等多方面的影响,强调了构建动态防护体系的重要性以平衡AI能力与发展安全之间的关系。
thDial,作为可统一处理多分辨率、多光谱和多时相遥感影像的对话式 VLM,创新性地将复杂多感官地
在英伟达、Lambda Labs 及 Turing.AI 联合举办的 Data Filtering Challenge 中,参赛者需设计数据过滤技术优化数据集,并提升边缘设备上的小语言模型表现。比赛提供免费 GPU 计算资源及丰厚奖金。
本文首次系统性地研究并提出了高效建模长上下文视频生成的方法,通过重构视频生成任务为逐帧预测,并引入长短时上下文的非对称patchify策略和多层KV Cache机制,实现了高效的长视频训练与长上下文视频生成。