大模型归档 - 第74页共147页

当 Gemini 写古龙，结果惊艳了整个江湖：冷雨，残月，孤星。

2025年3月29日14时作者 AI信息Gap

的眼。
灯笼下，是一家小酒馆。
酒馆里，只有一个人。
一个黑衣人。
他坐在靠窗的角落，桌上只有一壶酒

关于大模型智能体意图识别不准确问题——function call的缺陷

2025年3月29日14时作者 AI探索时代

最近在研究大模型智能体过程中遇到的问题之一是意图识别不准确，影响了Agent的质量和效果。解决方法包括明确描述函数功能、使用多轮对话增强理解能力、利用分类模型进行意图识别及设置规则引擎兜底等。

谷歌免费王炸！Gemini 2.5 Pro 推理实测：正确率 100%，零幻觉！

2025年3月29日14时作者 AI信息Gap

谷歌最新发布的推理模型Gemini 2.5 Pro在多项基准测试中表现出色，尤其在数学、推理、多模态和长上下文方面。其性能领先于其他同类模型，并且具有自我验证的能力。实测结果显示，Gemini 2.5 Pro在一系列复杂的逻辑运算题目上均能正确解答，无一错误。

7倍推理加速！清华团队发布稀疏Attention，无需训练加速一切模型

2025年3月28日16时作者 PaperWeekly

清华大学陈键飞团队提出的SpargeAttn无需训练且通用，实现了任意模型在4-32K上下文长度上的4-7倍推理加速，并保持了端到端精度。该方法通过选择性地压缩Q, K矩阵并预测P矩阵来节省计算，同时使用稀疏在线softmax算法进一步优化。

CVPR 2025 南大提出DUCT方法：用双重知识巩固抵抗持续学习中的灾难性遗忘

2025年3月28日16时作者 PaperWeekly

是一个重要的研究方向。它要求模型能够逐步适应不同领域的新概念，同时避免遗忘之前学到的知识。
然而，现

从深度学习到科学模拟，A5000显卡成算法工程师新宠，这背后有何技术乾坤？

2025年3月28日16时作者 PaperWeekly

A5000 显卡凭借强大图形核心与多流处理器，在深度学习神经网络反向传播计算中大幅缩短训练时间。它在性能上虽稍逊 NVIDIA RTX 3090，但性价比极高，CUDA、Tensor和RT 核心数占比均达78%，FP32等性能接近。现正进行破价活动，A5000 24G GPU 最低 0.88 元/小时，新用户注册可获10元代金券，学生用户更有额外奖励。