重磅!字节发布UI-TARS大模型,三句话搞定电脑操作!碾压GPT-4!

字节发布UI-TARS视觉语言模型,能像人一样操控电脑界面,并在多项测试中击败GPT-4等对手。它具备感知、推理及行动能力,支持点击、输入等多种操作。UI-TARS通过SFT和DPO训练,在多个GUI代理基准测试中达到最佳成绩,还开源了桌面版应用。

Perplexity发布Sonar API,提供实时信息搜索功能,一举超越所有搜索引擎和LLM!

Perplexity发布Sonar API,不仅是最便宜的搜索API,还能实现实时信息检索和引用能力。该产品提供基础版和Pro版本供选择,支持复杂任务、上下文理解及多种网络搜索。Sonar Pro在SimpleQA基准测试中超越主流搜索引擎和LLM,数据安全方面Perplexity承诺不会用用户数据训练模型。