微软发布GUIAgent新范式!告别传统方式,小参数少数据,7B吊打72B模型
MLNLP社区致力于推动机器学习与自然语言处理领域的交流合作。近期微软团队提出GUI-Actor,该技术利用虚拟手指、多区块监督和验证器等方法实现无坐标交互,显著提升界面操控效率和准确性。
MLNLP社区致力于推动机器学习与自然语言处理领域的交流合作。近期微软团队提出GUI-Actor,该技术利用虚拟手指、多区块监督和验证器等方法实现无坐标交互,显著提升界面操控效率和准确性。
最新ACM博士论文奖公布,Ashish Sharma的研究探讨人机协作在心理健康支持中的应用。通过AI提供有效心理指导和增强自我引导工具的使用,帮助更多人获得高质量的心理健康护理。
ComfyMind 是一种协作型 AI 系统,旨在实现稳健且可扩展的通用生成。它基于 ComfyUI 平台构建,并引入语义工作流接口(SWI)和搜索树规划机制来提高复杂生成工作流的稳定性和灵活性。
Lemon 是一款开源通用智能体,能够自动化完成市场调研、金融分析等复杂任务。它具备自主性,可根据目标独立执行任务,并实时监控进度。支持自定义模型接入和在线模型接入。
本周解读了Diffusion LLM和AI推理成本相关话题。Gemini Diffusion因其扩散架构被社区热议,其生成效率高且并行高效机制让其有潜力成为自回归模型的新挑战者;同时,AI开发者们也关注到基于扩散模型的NLP任务潜力及其与传统建模方式的关系。