大模型归档 - 第76页共147页

视觉多模态RAG技术总结及Vision-R1用于目标检测任务的奖励函数设计

2025年3月26日14时作者老刘说NLP

2025年3月26日，北京天气阴。文章讨论了多模态RAG技术在视觉领域和目标检测中的应用，并介绍了GPT-4发布的新功能及OpenAI承认的技术风险。同时，文章还提到了Vision-R1方案及其强化学习奖励函数设计。

AI Workflow&Agent全解析：架构、模式与最佳实践指南！

2025年3月26日14时作者 AI技术研习社

与了多个行业的Agent研发，发现一个关键经验：
成功的 Agent，并不依赖复杂的框架或库，而是通

关于智能体Agent的实现技术之思维链和函数调用(function call)的思考

2025年3月26日14时作者 AI探索时代

智能体、思维链和函数调用是实现人工智能的一个重要方向。本文深入解释了这三个概念的区别与联系，并讨论了它们在大模型中的应用和挑战。

藏在你微信里的神秘AI好友，竟然是披着’羊皮’的腾讯元宝！

2025年3月26日14时作者 AI信息Gap

腾讯上线微信好友 ‘腾讯元宝’，能生成红包封面、翻译及搜索信息。支持一对一聊天，但多数问题需调用腾讯元宝生成答案。

国产AI王炸！新版DeepSeek-V3惊艳亮相，数学94%碾压Claude，剑指GPT-4.5！

2025年3月26日14时作者 AI信息Gap

DeepSeek-V3-0324 新模型发布，参数量6850亿。相比前代，在基准测试中表现卓越，尤其在推理能力、编程能力和中文写作方面有显著提升，并且修复了一些问题。

造梦师手记：最接近真实的意大利风情

2025年3月26日11时作者路过银河AI

今天推荐意大利人创作的Pony模型，与Shakker.ai合作推出。免费个人使用，商用需授权；模型特点为半写实风格融合动漫与真实感；提供多个参数配置和提示词建议。

世界首个！性能超扩散模型256%，推理快21.8倍，Uni-3DAR用自回归统一微观与宏观的3D世界

2025年3月25日16时作者 PaperWeekly

e、具身智能三大 AI 热门领域共同关注的焦点。而随着 AI 技术的发展，大型语言模型（LLM）与大

大模型在简单物理现象理解任务上的认知困境：联想能力将是AGI之路上的下一个关键？

2025年3月25日16时作者 PaperWeekly

率攻克 ARC-AGI 挑战、DeepSeek 在数学推理中展现惊人效率时，一个根本问题始终悬而未决

埃默里大学、UT Austin联合提出Spatial-RAG：开启空间智能问答的新时代

2025年3月25日16时作者 PaperWeekly

然而，当涉及到
空间推理
任务时，LLMs 的表现却显得力不从心。空间推理不仅要求模型理解复杂的空间

也看基于版式分析的PDF文档翻译项目及文档版式分析模型PP-DocLayout

2025年3月25日14时作者老刘说NLP

今天是2025年3月25日，星期二。文章介绍了两个文档相关的项目，一个是基于版式分析的PDF文档翻译项目Fast_pdf_trans和PDFMathTranslate，另一个是文档版式分析模型PP-DocLayout。PP-DocLayout能够检测多种类型的文档，并且其三种不同比例的模型在处理复杂布局方面表现良好。而PDFMathTranslate则使用Pdfminer.six等库解析PDF文档，保留了排版信息进行翻译。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31