说句话就能飞!北航发布语言交互的无人机控制模型

北航团队提出Flying-on-a-Word(Flow)范式,通过模仿学习使无人机理解并执行基于自然语言指令的短距飞行任务。采用大规模真实数据集和协作策略,在北京航空航天大学开放场景成功部署VLA系统控制无人机。

告别刷榜内卷!清华×百度提出Feedbacker,开启LLM深度洞察新评估时代

本文提出评估范式的转变,从排名竞争转向诊断反馈。通过引入树状能力图谱、动态评估标准和可视化分析等创新组件,开发了Feedbacker框架,用于提升LLM的评估效率与准确性。