带图推理碾压同类开源模型!港中文微软等开源OpenThinkIMG框架,教AI学会使用视觉工具
港中文和微软联合团队推出OpenThinkIMG开源框架,旨在提升AI视觉工具使用和推理能力。该框架包含模块化视觉工具部署、高效的智能体训练框架及高质量数据生成技术,支持自主学习的V-ToolRL算法显著提升了AI在图表推理任务上的表现。
港中文和微软联合团队推出OpenThinkIMG开源框架,旨在提升AI视觉工具使用和推理能力。该框架包含模块化视觉工具部署、高效的智能体训练框架及高质量数据生成技术,支持自主学习的V-ToolRL算法显著提升了AI在图表推理任务上的表现。
阿里通义实验室开源ZeroSearch,无需真实搜索引擎即可训练大模型检索-推理能力。通过模拟搜索引擎和课程式学习策略,仅需3B参数的LLM即可有效提升搜索性能,节省API成本,并兼容多种强化学习算法。
通过深度学习模型和多模态生成技术,豆包 AI 可以理解和实现模糊的指令需求,实现大量并行生成高质量图片。该服务已应用于创意设计、故事生成等多个领域。
更多时间思考
时,其推理表现会显著提升,这打破了业界普遍依赖预训练算力的传统认知。
如果我们向
19
OpenAI Codex团队在Reddit AMA活动中分享了Codex的最新消息和未来计划,包括整合多种模型、提高编程效率等。Codex CLI工具使用TypeScript编写,并可在云上运行代码。未来可能推出Pro版本。GPT-5作为新基础模型将提升现有模型的能力。
最近,Windsurf发布了其v1.9.0版本,并推出了一系列自研AI模型。其中包括SWE-1、SWE-1-Lite和SWE-1-Mini三个新成员。这些模型旨在提升开发者在软件工程任务中的表现,并展示Windsurf在人工智能技术上的实力。