264页最强 Agents 发展与挑战综述,微软&谷歌&MetaGPT联合出品!
MetaGPT联合多家机构发布《Foundation Agents》报告,概述智能代理的发展与挑战,涵盖模块化架构、脑区功能映射、自我进化机制、协作与进化multi-Agent系统等多方面内容。
MetaGPT联合多家机构发布《Foundation Agents》报告,概述智能代理的发展与挑战,涵盖模块化架构、脑区功能映射、自我进化机制、协作与进化multi-Agent系统等多方面内容。
复旦&StepFun开源的OmniSVG能够生成从图标到复杂动漫人物的各种高质量SVG,支持文本转SVG、图像转SVG和字符引用SVG等多种模式,并基于Qwen-VL模型构建,包含MMSVG-2M数据集。
谷歌发布开源协议A2A,允许AI Agent互通互信;补充MCP以提供工具上下文,支持跨平台和云环境管理代理,实现灵活、安全的Agent协作。
ChatWiki 是一款国产开源的知识库 AI 问答系统,结合 GraphRAG 知识图谱技术增强查询效率和答案准确性。支持接入多种大模型,并提供多部署方式、文档发布、格式导入等功能,可嵌入业务系统并与第三方数据打通,支持企业级权限管理与生态对接。
Llama4发布并重回开源榜Top1,实测显示其表现不佳;本地部署只需3台512GB M3 Ultra即可拥有一个2T参数的多模态模型;免费体验链接可供用户在线试用;文章还介绍了大模型部署、交互和相关技术进展。
Llama 4家族成员发布,Llama 4 Maverick直接登上lmarena.ai评测Top2;Llama 4 Behemoth拥有288B活跃参数量;Llama 4 Maverick和Llama 4 Scout分别拥有17B和7B活跃参数量。这些模型支持多模态智能,并采用了最新的技术如MetaP、后训练策略和MoE架构。
DeepSeek联合清华发布研究成果,提出DeepSeek-GRM模型通过点式生成奖励建模提高通用查询的性能,利用自我原则批评调整等方法实现推理时扩展。该模型在多个基准测试中表现出色,在推理时的性能随着采样数量增加而显著提升。
加州大学圣迭戈分校的研究学者首次提供了人工系统通过标准三方图灵测试的实证证据。GPT-4.5和LLaMa-3.1在相同提示下被判断为人类的比例分别为73%和56%,显著高于真实人类参与者被选中的比例,表明这些系统已经非常接近人类智能水平。