月度归档: 2024 年 12 月
英伟达B300曝光,性能提升50%、专为o1推理大模型打造
AI芯片系列B300和GB300发布,算力相比前代提升50%,显存从192GB增加到288GB,并且包含多个GB300的计算单元被评价为解决推理大模型内存限制的问题。
Deepseek新模型意外曝光!编程跑分一举超越Claude 3.5 Sonnet
DeepSeek-v3在Aider多语言编程测试排行榜中超越Claude 3.5 Sonnet至第一,同时被评为当前最强开源LLM。模型参数提升显著,结构变化包括使用sigmoid作为门控函数、引入新的Top-k选择方法和调整专家评分等。
Andrej Karpathy:软件开发中认知负荷才是关键
Andrej Karpathy 推荐的文章指出,认知负荷才是软件开发的关键问题。文章强调了减少外在认知负担的重要性,通过简化代码、使用组合而非继承等方式来降低理解成本。
钛动科技陈德品:Scaling Law在营销应用中也适用,AIGC内容正在催生爆款 MEET2025
营销应用赛道也有Scaling Law。通过效率提升可以提高爆款发现概率。Tec Creative产品集成通用模型原子能力与场景Know how,快速生成高ROI素材。未来将打造智能剪辑工具和Agent系统,提升交互效率。
o3挑战ARC-AGI,遇见大网格就懵圈?英国工程师:ARC-AGI不适合大模型
研究发现,题目中网格规模越大,大模型的表现越差。ML工程师米哥对ARC数据集进行观察后发现,o3、o1和Claude等模型的性能下降与网格数量有关,提示大模型在应对大规模网格问题时可能存在问题。