中国信通院启动多模态智能体技术规范编制了
多模态智能体技术发展面临碎片化和伦理问题,中国信通院启动技术规范编制以解决跨领域协同难题。通过统一架构、数据融合和隐私保护标准,推动智能体从实验室创新迈向规模化应用。
多模态智能体技术发展面临碎片化和伦理问题,中国信通院启动技术规范编制以解决跨领域协同难题。通过统一架构、数据融合和隐私保护标准,推动智能体从实验室创新迈向规模化应用。
法国 AI 创企 Mistral AI 推出 OCR API,能够高效处理和理解各类文档,支持多语言、快速处理速度及灵活的输出格式。
最近MCP(模型上下文协议)引起了广泛关注。它提供了一个统一的标准,使AI应用能用同一种方式连接各种数据源和工具。MCP被视为AI界的‘万能插头’。
智元机器人发布首个通用具身基座大模型——智元启元大模型(Genie Operator-1),基于Vision-Language-Latent-Action(ViLLA)框架,由VLM和MoE组成,实现小样本快速泛化。
微软研究院开源Magma模型,首个能理解多模态输入并进行实际操作的基础模型,在CVPR会议上获得接收。该模型融合视觉、语言与动作能力,使用Set-of-Mark和Trace-of-Mark两大标注方法提高准确性。
国资委推动央企加速AI应用,45%央企已部署DeepSeek模型;能源、电力行业尤为突出。
央企正重点攻克高价值场景,并明确技术路线选择,以促进大模型在业务中的落地。
爱分析数据显示,2025年央企将在决策类和端侧场景有较大发展空间。