PaperAgent

2025年，是时候要拥抱Agent了

2025年4月17日14时作者 PaperAgent

2025年，Agent从概念走向商业主流。它是一种自主智能体，具备感知、决策和执行能力，并提供工具调用能力和记忆进化机制。文章推荐开发者参加相关课程，快速了解Agent核心技术原理。

分类分享标签 2小时精品视频课、 Agent 开发方法论、彭靖田、感知-决策-执行、自主智能体、谷歌开发者专家发表评论

终于等到了，微信聊天记录MCP：Chatlog

2025年4月16日19时作者 PaperAgent

Chatlog 是一款聊天记录工具，支持从本地数据库文件获取微信等平台的聊天数据，并提供终端界面、命令行工具及HTTP API服务，用于查询聊天记录、联系人、群聊和最近会话信息，同时也支持与支持MCP协议的AI助手集成。

分类分享标签 3.x / 4.0 版本、 ChatWise 工具、 MCP 协议、微信、未提及发表评论

一篇80页多模态RAG技术最新综述：MRAG3.0

2025年4月16日19时作者 PaperAgent

多模态检索增强型生成(MRAG)通过整合文本、图像和视频等多模态数据显著提升了大型语言模型的生成质量，并系统回顾了其进展与关键技术组件。

分类分享标签 MRAG、图像、搜索规划、文本、文档解析、视频发表评论

比R1快8倍，智谱开源GLM-Z1系列，实测 Agentic AI 也能极速深度推理！

2025年4月15日14时作者 PaperAgent

智谱发布GLM-4-32B-0414系列模型，包含基座、推理和沉思模型，支持MIT License，并上线MaaS开放平台。其中推理模型GLM-Z1-32B为国内最快的模型之一，适用于不同场景。通过实测及示例展示了其在问答和功能调用应用中的优势。

分类分享标签 GLM-4-32B-0414、 GLM-Z1-AirX、大语言模型、推理模型、智谱、深度学习发表评论

Meta&谢赛宁版GPT-4o：通过MetaQueries实现统一多模态模型！

2025年4月14日14时作者 PaperAgent

统一多模态模型的目标是整合深度理解与丰富的生成能力，MetaQueries采用‘token → [transformer] → [diffusion] → pixels’范式，通过可学习查询和冻结MLLM在保持性能的同时实现图像生成。

分类分享标签 MetaQueries、图像生成、扩散模型、指令调整、统一多模态、预训练发表评论

开源推理大模型全面开花的一周：多模态、RAG、Agent、编码

2025年4月12日19时作者 PaperAgent

热门模型排行榜Top10中出现多款推理大模型，包括代码推理、混合专家视觉-语言模型等。DeepCoder-14B-Preview在LiveCodeBench v5上的准确率提升了8%，仅用140亿参数实现相似性能；Llama-3.1-Nemotron-Ultra-253B-v1基于Meta Llama-3.1-405B-Instruct训练，支持长达128K标记上下文长度。OpenCodeReasoning是最大推理编程合成数据集，用于监督式微调；Kimi-VL-A3B-Thinking在多模态推理和视觉理解方面表现出色；Seed-Thinking-v1.5采用强化学习算法提升模型训练效率。