豆包推出全新稀疏模型架构 UltraMem了
字节跳动豆包团队提出UltraMem架构,通过分层动态内存结构、Tucker分解检索和隐式参数扩展三项创新突破MoE架构的瓶颈,推理成本降幅最高83%,速度提升6倍,入选ICLR 2025。
字节跳动豆包团队提出UltraMem架构,通过分层动态内存结构、Tucker分解检索和隐式参数扩展三项创新突破MoE架构的瓶颈,推理成本降幅最高83%,速度提升6倍,入选ICLR 2025。
文章介绍了三星 Galaxy S25 手机搭载的 Agentic GLM 技术及其带来的新功能,如 AI 音视频通话体验、智能文案生成和系统级智能体等,展示了人机交互范式的重构,并讨论了这一技术对智能手机定义的影响。
百度CEO李彦宏表示,为了开发更智能的模型需要更多计算资源,但对数据中心和云基础设施的投资仍然非常重要。尽管DeepSeek提高了AI模型效率,成本每年降低90%以上。
Nvidia发布的新版NVIDIA Broadcast应用程序增加了‘Studio Voice’和‘虚拟主光’功能,使得RTX 3070显卡上的Logitech C922网络摄像头麦克风效果提升显著,但同时存在隐私和伦理争议。
Datawhale团队成立六年成长历程回顾。从12人发展到200+成员,发布《Datawhale人工智能培养方案》2.0,涵盖多个领域知识学习教程。GitHub组织排名上升至全球第67位。团队成员来自高校、科研院所及企业。