微软发布GUIAgent新范式!告别传统方式,小参数少数据,7B吊打72B模型

MLNLP社区致力于推动机器学习与自然语言处理领域的交流合作。近期微软团队提出GUI-Actor,该技术利用虚拟手指、多区块监督和验证器等方法实现无坐标交互,显著提升界面操控效率和准确性。

港科大和字节跳动:开源自然语言P图框架ComfyMind

ComfyMind 是一种协作型 AI 系统,旨在实现稳健且可扩展的通用生成。它基于 ComfyUI 平台构建,并引入语义工作流接口(SWI)和搜索树规划机制来提高复杂生成工作流的稳定性和灵活性。