大模型评测体系如何真正落地?实战经验分享来了! 锁定7月31日《1 小时 AI 公开课》

在人工智能领域,大模型已成为推动各行业变革的核心力量。然而,如何准确评估其性能并确保其在实际应用中的价值成为关注焦点,《1小时AI公开课》特邀专家丁金沙老师将深入探索大模型评测体系落地的奥秘。

智谱发布自主Agent全家桶,目标:让打工人实现“光说不干”!

智谱 CEO 张鹏展示了通过 AutoGLM 实现的多任务操作和 Agent 功能进展,包括跨应用执行任务、支持无人驾驶上网等功能,并介绍了基于视觉模型实现的 GLM-PC 通用Agent。新升级的AutoGLM能够完成复杂任务,如执行超过54步的操作、跨App执行任务以及提供短口令支持等。智谱计划在未来两周内上线支持核心场景和应用的核心API,以及启动大规模内测,并期待在不久的将来推出面向C端用户的最终产品。