子非AI
DeepSeek开源周[1]:FlashMLA,Hopper GPU推理性能狂飙
DeepSeek AI 团队发布了 FlashMLA,针对 Hopper GPU 优化的 MLA 解码内核,支持 BF16 和分页 KV 缓存,实现高达 3000 GB/s 内存带宽和 580 TFLOPS 计算性能。
Claude 3.7 Sonnet:AI推理与编程的新纪元
Anthropic发布Claude 3.7 Sonnet和配套工具Claude Code,首个集成混合推理能力的AI模型提升了编码效率。Claude Code让开发者能直接在终端完成复杂的编码任务,提升开发速度。
Grok 3:马斯克用20万块GPU砸出的AI革命,OpenAI迎来最危险对手
埃隆·马斯克旗下xAI公司发布Grok 3大模型,性能超越GPT-4。该模型依托20万块H100 GPU数据中心构建,具备DeepSearch信息检索功能、太空轨道计算系统及AI自主开发游戏等能力,引发市场轰动。
DeepSeek重磅发布NSA原生稀疏注意力:梁文峰团队核心突破Transformer瓶颈!效率飙升10倍!
一举突破
Transformer 注意力机制瓶颈!
梁文峰团队领衔研发
的 NSA 采用
原生稀疏