微软Ignite 2024:建立一个Agentic世界!
在今年的Microsoft Ignite 2024上,企业通过Copilot Studio创建了数万智能体,并且可以使用Azure目录中的1800个LLM模型。微软还宣布将在Microsoft 365中引入新的智能体,包括用于项目管理的新项目经理智能体、协作会议中的新Facilitator智能体、帮助员工理解和分享知识的Agent以及提供自助服务支持的员工自助服务智能体。
在今年的Microsoft Ignite 2024上,企业通过Copilot Studio创建了数万智能体,并且可以使用Azure目录中的1800个LLM模型。微软还宣布将在Microsoft 365中引入新的智能体,包括用于项目管理的新项目经理智能体、协作会议中的新Facilitator智能体、帮助员工理解和分享知识的Agent以及提供自助服务支持的员工自助服务智能体。
斯坦福大学李飞飞团队发布的2024年人工智能发展报告指出,AI在图像分类和语言理解等特定任务上超越人类,但面临成本上升、数据用尽等问题。美国、中国和欧洲主导AI模型研究与发展,中国在专利方面领先。
本文介绍了一项新的动态生成的测评基准DynaMath,用于评估和研究视觉语言模型在处理多模态数学问题时的推理能力。通过分析当前最强的一些视觉语言模型(如GPT-4o)在简单数学题上的表现,发现它们存在漏洞和鲁棒性不足的问题。DynaMath提供了501个高质量、多主题的种子问题及其变体,评估了14个最先进的视觉语言模型的表现,揭示了其推理稳健性的局限性。