DeepSeek 开源周首日:开源 FlashMLA,AI 推理速度再进化!
DeepSeek推出FlashMLA开源项目,专为Hopper架构GPU设计的超高效MLA解码内核现已正式开源。它优化了变长序列场景下的效率,并已在生产环境中使用。亮点包括BF16精度支持、Paged KV Cache以及极高的性能表现。
DeepSeek推出FlashMLA开源项目,专为Hopper架构GPU设计的超高效MLA解码内核现已正式开源。它优化了变长序列场景下的效率,并已在生产环境中使用。亮点包括BF16精度支持、Paged KV Cache以及极高的性能表现。
Nvidia掌门人黄仁勋表示,市场对AI的理解存在误区。他认为预训练、推理只是AI发展的开始,并强调后训练才是智慧的关键阶段。他还指出企业需构建数据智慧层,利用元数据和压缩比高的语义层来管理海量原始数据。
谷歌发布AI co-scientist系统,可处理科研选题、文献检索、实验设计等任务。特点包括理解研究目标、生成创新假设和研究方案、加速科研进程等。它采用多智能体架构模拟科学研究全流程,并通过‘测试时间计算’提升输出质量。实验证明其在药物重定向、靶点发现和抗生素耐药性机制解释等方面超越人类专家。
微软发布了Majorana 1芯片,这是一款基于拓扑量子比特架构的全新量子处理器。它标志着量子计算领域迈出了划时代一步,有望在未来几年内实现百万量子比特处理器,并可能改变新材料研发、气候变化应对及药物研发等领域。
OpenAI联合一众大佬发布SWE-Lancer,一个评估前沿LLM在真实软件工程任务中的基准测试。它从Upwork精选了超过1400个真实的软件工程任务,总价值高达100万美元。SWE-Lancer包含个人贡献者和技术领导者的两种类型的任务,采用端到端测试模拟真实环境。研究结果显示模型表现仍有提升空间,OpenAI开源了数据集以促进更多研究。
OpenAI前CTO Mira宣布成立新公司Thinking Machines Lab,目标是让每个人都能用上最前沿的AI技术。团队成员来自知名AI产品与开源项目。核心方向包括以人为本的多模态协作、灵活定制和坚实基础等。