2025首篇关于多模态大模型在富文本图像理解上的全面研究综述
文本丰富的图像理解(TIU)涉及感知和理解两个核心能力。MLLMs通过模态对齐、指令对齐和偏好对齐等方法进行训练,并使用多样化的数据集和基准测试评估性能。
南大周志华团队获奖,AAAI 2025杰出论文奖出炉!
AAAI 2025 在美国费城举行,共有12957篇论文投稿,录取率为23.4%。南京大学团队的‘神经符号推理不一致性的高效修正’获杰出论文奖。此外还有一篇AI对社会影响特别奖得主论文入选。
DeepSeek开源连击、Claude编码升级、GPT性能迷局,系统解读大模型诸神之战 | 万有引力
大模型竞争白热化,DeepSeek开源多项工具;阿里发布QwQ-Max-Preview;腾讯混元发布新一代Turbo S;OpenAI推出GPT-4.5。各模型展示技术优势和挑战,开发者需在有限资源下利用开源工具。
单月业绩破亿,10 亿热钱再狂砸智谱 AI!DeepSeek 掀起“AI 免费”风暴?唐杰:怎么想的呢!
10 亿元人民币的战略融资。这笔资金将主要用于智谱国产基座 GLM 大模型的技术创新和生态发展,同
国内首个 AI IDE,今日上线
特工小鹏和特工小天介绍字节在国内上线的AI IDE Trae,它以动态协作为核心,提供原生AI体验,并内置免费模型用于项目定制化修改和开发辅助,适用于开发者及非技术背景用户。
阿里PC-Agent重构人机交互,精准拆解跨应用指令,自动化办公更进一步
阿里通义实验室提出PC-Agent框架,实现复杂PC任务自动化。该框架通过主动感知模块和层次化多智能体协作结构处理跨应用工作流指令。实验表明其在复杂任务上表现优于现有方法。
AI 教父手撕马斯克!3400+ 科学家联名抗议,他或成英国皇家学会 150 年首位被除名会士
马斯克与Hinton因皇家学会会士资格问题再次引发争议,马斯克指责Hinton怯懦不自信,而Hinton则称其破坏了美国科学机构。目前英国皇家学会正考虑是否应除名马斯克。