大模型归档 - 第14页共40页

当AI开始“赋能”黑产｜

下午11时 2025/03/17 作者甲子光年

nus的难度比我预期简单100倍。”
3月9日，在Manus火爆全网之后的第3天，一位用户向Manu

下午11时 2025/03/17 作者智东西

克发布了“AI超级框”，通过超级Agent提供
AI对话、深度思考、深度搜索、深度研究及深度执行
等

下午4时 2025/03/17 作者量子位

前苹果ASIC架构师Nils Graef与UC伯克利本科生Andrew Wasielewski提出Slim Attention，通过只存储K而不直接存储V实现更少的内存占用和更高精度。

上午8时 2025/03/17 作者机器之心

，百度一口气官宣了两款大模型，分别是
文心大模型 X1 和文心大模型 4.5
。
那么，这两款大模型

下午7时 2025/03/16 作者老刘说NLP

2025年3月17日的文章介绍了RAG相关进展的三方面内容：推理模型在机器翻译中的应用、量化文本分块的有效性方法，以及通过引入层级结构解决局部信息与全局信息间的差距问题。

下午12时 2025/03/15 作者极市干货

本文提出了一种轻量化多模态语言模型LLaVA-MoD，通过稀疏专家混合架构和渐进式蒸馏策略，在2B规模下使其性能超过7B大模型8.8%，并在幻觉检测任务中超越教师模型。

下午4时 2025/03/14 作者 AI前线

政府工作报告提出开展“人工智能 +”行动以来，2025 年政府工作报告继续指出，要持续推进“人工智能