大模型
大语言模型
Manus横空出世,阿里开源QwQ-32B,豆包深度思考,字节发布Trae国内版! AI Weekly 3.3-3.9
t,多代理协作架构,可自主完成 PPT 制作等复杂任务,但面临技术创新性质疑。
2️⃣
🧠 阿里开源
CVPR 2025 零训练成本!中科大创新扩散模型概念擦除方法,先验保护较SOTA提升10倍
中国科学技术大学的研究团队提出了一种名为自适应值分解器(AdaVD)的概念擦除方法,该方法无需额外训练即可实现对目标概念的精准快速擦除,并最大限度地保护了先验知识。
ICLR 2025 英伟达提出FP8训练新范式:减少40%显存占用,训练加速1.43倍
近期伯克利等机构提出COAT方法,通过动态范围扩展和混合粒度FP8精度流技术,在保持模型精度的同时显著减少FP8量化误差及激活值占用,实现了端到端内存占用减少1.54倍、训练速度提高1.43倍。
最近大模型技术落地观察及RAG的针对性优化思路SAGE
2025年3月8日星期六,北京天气晴朗。本文继续探讨RAG的优化工作SAGE,并观察了技术落地的新现象。介绍了三个主要问题及解决思路。同时讨论了技术规范和MCP协议的发展趋势及其对通用Agent的认知影响。