资讯
国际
分享
大模型
学术
开源
机器人
关于我们

PaperAgent

一篇100种多模态CoT推理技术最新综述

2025年3月26日19时作者 PaperAgent

新加坡国立大学和香港中文大学发布了一份关于多模态链式思考(MCoT)推理的系统性综述，介绍并分析了该领域的发展及其应用。

分类分享标签 3D场景、图像领域、多模态链式思考、新加坡国立大学、视频领域、香港中文大学发表评论

DeepSeek与Qwen组团开源了模型，冲!

2025年3月26日14时作者 PaperAgent

阿里通义千问和DeepSeek分别开源了Qwen2.5-VL-32B-Instruct和DeepSeek-V3-0324两个模型，前者主要提升了数学推理、细粒度图像理解与推理能力，并且调整输出样式以提供更符合人类偏好的答案；后者则强调编程能力和前端开发功能。

分类分享标签 32B规模、 Qwen、图像理解、大语言模型、数学推理、阿里云发表评论

第一篇100种多模态CoT推理技术最新综述

2025年3月26日14时作者 PaperAgent

多模态链式思考(MCoT)推理的系统性综述介绍了其基本概念、应用和方法，并探讨了不同模态下的挑战与进展。

分类分享标签 AVQA-CoT、 MCoT推理、新加坡国立大学、视觉问答、语音翻译、香港中文大学发表评论

0.35秒OCR整页文档，比Qwen2.5 VL高出10%的文档转换多模态模型！

2025年3月24日14时作者 PaperAgent

SmolDocling 是一种高效文档转换的多模态图文到文本模型，由IBM Research联合推出，在A100 GPU上每页仅需0.35秒完成处理，并使用256M参数比Qwen2.5 VL更高效。其功能特性包括高效的文档表示、光学字符识别、布局和定位保留、代码识别、公式识别、图表识别及表格识别等。

分类分享标签 256M参数、 Docling团队与IBM Research、 SmolDocling、光学字符识别（OCR）、多模态图文到文本模型、每页0.35秒发表评论

被放养的博士能靠自己毕业嘛？

2025年3月24日14时作者 PaperAgent

写论文对于很多人来说是一大挑战。沃恩智慧作为21年老牌辅导机构提供一站式科研服务，包括选题、调研、实验、润色和投稿等，并与QS前50名导师合作，为学员提供保姆级SCI写作课程及申研申博攻略。

分类分享标签 4个月、 SCI写作系列课、上海王宇光、中科院二区、沃恩智慧、申研申博发表评论

智能体人设与编排：导演

2025年3月23日19时作者 PaperAgent

文章介绍了工作流和智能体的概念，并强调了规划在复杂任务处理中的重要性。规划通过分解任务减轻LLM的认知负担，提高推理能力，减少不准确性，尤其适用于方法不明且需要适应性的场景。

分类分享标签 LLM、任务分解、反馈循环、工作流、智能体、智能系统发表评论

硬核，AI Agents全栈技术框架综述与未来

2025年3月23日19时作者 PaperAgent

张图解
，探索
LLM Agents
的
主要组件
、
Multi-Agent框架、
以及
MCP

分类分享标签 AI Agents、 Customer360、 Duplex、 Mole、 Salesforce、自动驾驶汽车发表评论

超越o1&QwQ-32B，中科院SolutionRAG大幅提升复杂工程方案设计能力

2025年3月23日14时作者 PaperAgent

中科院&通义实验室提出并开源了基于树状探索和双点思维的系统SolutionRAG，用于评估多约束复杂工程问题上的解决方案生成能力。该系统在SolutionBench上取得了最先进的性能，并显著优于现有方法，有望提升实际应用中的工程方案设计自动化和可靠性。

分类分享标签 SolutionBench、中科院&通义实验室、复杂工程方案设计、深度思考模型、解决方案生成能力、采矿领域发表评论

R1圈的新王者，腾讯混元-T1发布，首个混合Mamba推理模型~

2025年3月22日14时作者 PaperAgent

腾讯发布混元-T1深度思考模型，在长文捕捉、优化长序列处理及强化学习训练等方面取得突破，已在公开benchmark和内部人工体验集上表现出色。

分类分享标签 DeepSeek-R1、人工体验集、强化学习、深度学习模型、混元-T1、腾讯发表评论

Manus 引爆 AI 热潮，你的技术知识已 “过期”？

2025年3月20日14时作者 PaperAgent

最近朋友圈被 Manus 刷爆，它能快速生成电影级 CG、训练数字人、筛选简历及24小时带货等。但技术突破引发焦虑，开发者感叹转型困难。为此，DeepSeek 推出系列课程帮助从零开始学习 AI 大模型，涵盖新手装备站和实战经验等内容。

分类分享标签 AI 新物种、 DeepSeek、 Manus、招聘人员、数字人、虚拟主播发表评论

较早文章

较新文章

← 上一页页面1 … 页面13 页面14 页面15 … 页面29 下一页 →

搜索

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能人形机器人具身智能大型语言模型大模型大语言模型字节跳动工业机器人开源强化学习微软扩散模型技术创新智能体木易机器学习深度学习清华大学生成式AI 用户体验百度腾讯自然语言处理英伟达谷歌阿里云阿里巴巴马斯克黄仁勋

分类

分享
国际
大模型
学术
开源
机器人
资讯

马斯克旗下Neuralink加入AI仿生眼研究
Meta任命赵晟佳为超级智能实验室首席科学家
AI时代下集成电路有哪些机遇？
李强出席2025世界人工智能大会
阿里加入“百镜大战”，首款AI眼镜带显示、支持导航和淘宝比价｜WAIC2025①

2025 年 7 月
一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

« 6 月

归档

2025 年 7 月
2025 年 6 月
2025 年 5 月
2025 年 4 月
2025 年 3 月
2025 年 2 月
2025 年 1 月
2024 年 12 月
2024 年 11 月

AI新闻 | X平台｜ APK反编译｜京ICP备2024096144号｜

© 2025 每时AI • Built with GeneratePress

下载我们的APP，AI秒送达！立即下载

×