Galileo AI 团队归档

Agent Leaderboard：为AI Agent任务打造的LLM排行榜

2025年3月3日8时作者 NLP工程化

Agent Leaderboard：评估12种私有模型和5种开源模型在复杂场景下的工具使用能力，采用TSQ量化工具选择质量，覆盖21个领域和390个API交互场景。