分享归档 - 第262页共398页

2025首篇关于多模态大模型在富文本图像理解上的全面研究综述

2025年3月3日19时作者 PaperAgent

文本丰富的图像理解（TIU）涉及感知和理解两个核心能力。MLLMs通过模态对齐、指令对齐和偏好对齐等方法进行训练，并使用多样化的数据集和基准测试评估性能。

2025年3月3日19时作者 Datawhale

AAAI 2025 在美国费城举行，共有12957篇论文投稿，录取率为23.4%。南京大学团队的‘神经符号推理不一致性的高效修正’获杰出论文奖。此外还有一篇AI对社会影响特别奖得主论文入选。

2025年3月3日16时作者 AI科技大本营

大模型竞争白热化，DeepSeek开源多项工具；阿里发布QwQ-Max-Preview；腾讯混元发布新一代Turbo S；OpenAI推出GPT-4.5。各模型展示技术优势和挑战，开发者需在有限资源下利用开源工具。

2025年3月3日16时作者特工宇宙

特工小鹏和特工小天介绍字节在国内上线的AI IDE Trae，它以动态协作为核心，提供原生AI体验，并内置免费模型用于项目定制化修改和开发辅助，适用于开发者及非技术背景用户。

2025年3月3日14时作者 AI进修生

本期文章介绍了如何在Windows系统上安装并运行MCP (Model Context Protocol) 服务，并提供了详细的步骤说明和优化方法。通过使用Cursor Agent和配置文件等形式简化了MCP的设置过程。

2025年3月3日14时作者子非AI

施。
• V3/R1 推理系统通过跨节点 EP、计算通信重叠和负载均衡，实现 73.7k/14.8k

2025年3月3日14时作者数字生命卡兹克

讲，在内测了两个月后，我想说，这个画布还是有点东西的。
他可能是我目前用过的最独特的一个创作产品，有

2025年3月3日14时作者 Datawhale

Andrej Karpathy 在 YouTube 上发布了一段长达 2 小时的学习视频，详细介绍了如何使用大型语言模型（LLM），涵盖模型生态系统、交互示例和多种应用场景。

2025年3月3日14时作者 PaperAgent

通过构建企业员工AI助理，实现规章制度咨询服务、办公效率提升及与OA系统的对接等功能。

2025年3月3日14时作者 PaperAgent

LangGraph预构建Agents生态新增5个开源项目：多智能体Swarm、记忆管理库LangMem、工具调用库trustcall以及层次化多智能体系统langgraph-supervisor，支持流式处理、长期记忆管理和复杂JSON结构操作。

较早文章

较新文章