刚刚!DeepSeek开源FlashMLA,推理加速核心技术
DeepSeek本周开源了一款用于Hopper GPU的高效MLA解码内核FlashMLA,主要用于减少推理过程中的KV Cache成本。该项目上线45分钟后收获超过400星,并且得到了广泛好评。
DeepSeek本周开源了一款用于Hopper GPU的高效MLA解码内核FlashMLA,主要用于减少推理过程中的KV Cache成本。该项目上线45分钟后收获超过400星,并且得到了广泛好评。
系的研究人员提出了一种名为 Retrieval-Retro 的无机逆合成规划方法,
通过结合热力学关
DeepSeek通过Janus-Pro和DeepSeek-VL等多模态模型在GenEval基准测试中表现出色,并提出解决细粒度视觉识别能力缺失的解决方案。它采用了数据原子化、知识蒸馏、动态注意力机制以及可控生成引擎等技术手段,推动了多模态学习范式的系统性变革。
阶跃星辰在生态开放日上展示了其多模态大模型的发展,并展望了智能终端Agent的应用前景,包括多模态生成能力、自主任务执行、情感陪伴等功能,强调了智能汽车、手机、具身智能及IoT等关键应用场景。
DeepSeek将逐日开源五个项目,共享透明进展与创新;Open Deep Research是一款支持用户自定义研究模型和报告结构的Web研究助手;Openator是一个开源浏览器代理工具,能够执行自然语言制定的操作;Magma是一种多模态人工智能代理的基础模型;AI 多人聊天室提供支持多人同时对话、可自定义角色的实时聊天应用。
一键同步内容到多个社交媒体平台的浏览器扩展,支持知乎、微博等十多个主流平台。免登录注册,免费使用,可自动抓取并发布网页内容,提供定时发布和联动AI生成内容功能。