7 月 2025 - 第143页共230页

【CUDA编程】关于矩阵乘加操作的四个指令（ldmatrix、mma、stmatrix、movmatrix）详解

2025年7月11日16时作者极市干货

rix）详解
写在前面‌
：在 GPU Tensor Core 的编程实践中，笔者此前通过矩阵乘法优

2025年7月11日16时作者 AI寒武纪

这两年Java工程师们开始卷大模型，文章介绍了如何结合现有技术学习大模型以提升职业竞争力，并推荐了陈旸老师的课程。

2025年7月11日16时作者机器之心

Meta 挖角大牛组建 AI 研究部门 Meta Superintelligence Labs (MSL)，涉及高层变动及内部整合。Yann LeCun 向新领导汇报，但 MLX 不改变研究方向。Meta 未来可能裁员以支持 MSL，并面临技术争议和文化冲击。

2025年7月11日16时作者 AIGC开放社区

专注AIGC领域的专业社区报道了英伟达首席执行官黄仁勋即将与美国总统特朗普会面的消息，背景是英伟达市值突破4万亿美元。

2025年7月11日14时作者老刘说NLP

近期开源了4个大模型：SmolLM3小模型、T5Gemma模型、NextCoder-32B模型和DeepSeek-TNG-R1T2-Chimera专家组合模型，文章介绍了这些模型的特点及模型合并方案，并推荐MergeKit库来执行模型合并。

2025年7月11日14时作者小兵的AI视界

包含文本、图像、表格和公式的复杂文档，提供从文档摄取到智能查询的端到端解决方案。
系统基于多模态知识

2025年7月11日14时作者 GiantPandaCV

2067252909434076
编辑丨GiantPandaLLM
背景
最近，我和几位小伙伴
@a

2025年7月11日14时作者 AI探索时代

企业级智能体架构存在单智能体和多智能体两种模式。单智能体开发主要面临工具调用链路长、提示词过长及工具响应错误等问题，而多智能体开发则需解决不同智能体之间数据格式不一致及调度问题。总体而言，智能体开发理论简单但实现复杂。

本文介绍了一种名为 Deliberate-to-Intuitive (D2I) 的推理框架，旨在提升多模态大型语言模型（MLLMs）在复杂推理任务中的表现。通过在训练阶段采用深度推理策略，并在测试阶段允许模型自由生成答案，显著提升了多模态模型的推理能力，同时保持了训练的高效性和可扩展性。