智东西
DeepSeek开源周第四弹!3大猛料一口气发完,梁文锋亲自贡献
DeepSeek开源三大优化策略:DualPipe、EPLB和profile-data。DualPipe实现并行算法减少训练空闲时间;EPLB平衡负载避免GPU闲置。
量子计算创企融资12亿!中美量子突破高潮迭起
以色列量子技术创企Quantum Machines宣布获得1.7亿美元C轮融资,累计融资2.8亿美元。此次投资正值量子领域里程碑式的一年,谷歌、IBM等公司发布重大突破。Qwen认为这是一场没有输家的游戏,为实现实用量子计算机提供核心基础设施。
微软开源多模态AI基础模型!13位作者12位华人,丝滑操控电脑和机器人
微软研究院发布首个多模态AI agents基础模型Magma,能够理解环境、规划行动并在数字及物理空间中执行任务。它以视觉语言(VL)模型为基础,能完成从UI导航到机器人操作等各种agent任务。
传DeepSeek R2提速!字节豆包灰测深度思考,微软Copilot已免费开放
科技巨头纷纷推出深度推理模型。微软面向所有Copilot用户免费提供语音和深度思考功能,并宣布由OpenAI的o1模型支持。近期多家AI企业如OpenAI、谷歌等也发布了新的深度推理/深度思考模型。
谷歌宣布AI编程助手全球免费!每月18万次代码补全,爽翻程序员
谷歌发布免费AI编程工具Gemini Code Assist,支持超过180K代码补全、所有公共语言和128K上下文窗口,预计2028年全球开发者将达5780万。
DeepSeek开源第三弹!极致榨干GPU,FP8训推秘籍公开
DeepGEMM是DeepSeek开源的一款支持FP8 GEMM的库,为V3/R1训练和推理提供动力,在Hopper GPU上性能高达1350+ FP8 TFLOPS。该库采用JIT即时编译技术,核心逻辑约为300行,仅支持英伟达Hopper Tensor Core架构,设计简单高效,且在某些形状上的表现优异。
全球首个混合推理模型降世!程序员集体过年,最强AI编程秒全场,多平台火速接入
首个混合推理模型Claude 3.7 Sonnet支持实时和扩展思考模式;Anthropic推出编码工具Claude Code简化开发流程;用户可选择不同模式控制思考预算。