日期: 2025 年 7 月 25 日
Meta和NYU联合出品MetaQuery:融合 MLLM 深度理解与 Diffusion,开启图像生成的新跃迁
标即可训练,既保持了 MLLM 的理解实力,又在图像生成任务上达到了强劲表现,包括图像编辑和主体驱动
ICCV 2025|DiT 架构下的全新训练范式!中科大开源DualReal:打开视频定制“身份+运动”新次元
T 架构中用双域感知适配模块与阶段融合控制器,实现身份与运动的自适应联合训练,仅需短时微调即可在保持
媲美Claude 4,支持100万上下文!阿里开源超强代码AI Agent模型
阿里巴巴开源超强AI Agent模型Qwen3-Coder,在OpenAI基准测试中得分69.6%,参数量4800亿。它在代码领域表现突出,并且支持256K上下文窗口和大规模强化学习,还提供命令行工具方便使用。
这家公司盯上了微软 office,但用的是Agent
微软Office Copilot未获广泛采用。新公司Agnes AI在三周内成为Lovart竞争对手,并已吸引大量用户。Agnes通过自研模型和多智能体框架实现高效协作,支持多人实时编辑、知识库构建等,目标是重构真实工作流程。