豆包推出全新稀疏模型架构 UltraMem了 下午11时 2025/02/12 作者 陳寳 字节跳动豆包团队提出UltraMem架构,通过分层动态内存结构、Tucker分解检索和隐式参数扩展三项创新突破MoE架构的瓶颈,推理成本降幅最高83%,速度提升6倍,入选ICLR 2025。
李建忠:DeepSeek 关键技术创新及对 AI 生态的影响 下午4时 2025/02/06 作者 AI科技大本营 【导读】 全球 AI 竞赛正酣,DeepSeek 的出现,宛如一石激水,打破了原有的平静。作为资深技
SGLang的Expert Parallel特性解读 下午2时 2025/01/12 作者 GiantPandaCV 0x0. 前言 最近在SGlang仓库下做了一段时间的开发和学习,对SGLang的一些比较新的Fea