OmniParser V2 归档

微软GUI智能体OmniParser二代开源！推理延迟降低60%，大模型玩手机更溜了

2025年3月7日16时作者新智元

OmniParser V2通过更大规模的数据集训练，提升了对小图标检测的准确率和推理速度。其与LLM结合后在多个基准测试中表现优异，平均准确率达到39.6%。

2025年3月3日16时作者机器之心

OmniParser V2 是通过更大规模的交互元素检测数据和图标功能描述数据训练，实现更高效的 GUI 解析，并在 ScreenSpot Pro 基准测试中取得了 39.6 的 SOTA 准确率。

2025年2月16日8时作者 NLP工程化

Microsoft发布OmniParser V2工具，可将任何LLM转变为计算机代理，如启用GPT-4等。