Kimi 16B胜GPT-4o!开源视觉推理模型:MoE架构,推理时仅激活2.8B

Kimi团队发布开源轻量级视觉语言模型Kimi-VL及其推理版Kimi-VL-Thinking,参数为16B但推理时仅激活2.8B。具备强大的多模态推理能力和Agent能力。支持128K上下文窗口,采用宽松的MIT许可证。

谷歌最新AI芯片打平英伟达B200,专为推理模型打造,最高配每秒42500000000000000000次浮点运算

谷歌发布新款TPU v7芯片,峰值算力达4614TFlops,支持大规模并行处理和高效的内存访问。TPU v7在高带宽内存、低延迟ICN网络方面都有显著提升,并配备增强版SparseCore以支持高级排序和推荐工作负载。

剪枝60%不损性能!上海AI Lab提出高斯剪枝新方法,入选CVPR 2025

MaskGaussian团队提出了一种新的掩码技术,将掩码融合进光栅化过程,通过学习每个高斯点的掩码分布来优化渲染质量。在Mip-NeRF360、Tanks & Temples和Deep Blending三个数据集上分别剪枝了62.4%、67.7%和75.3%的高斯点,且性能损失可以忽略不计。

用梯度下降求解整数规划,中科大等提出无监督训练整数规划求解器新范式 ICLR 2025 Spotlight

中国科学技术大学王杰教授团队提出DiffILO方法,将整数线性规划转化为连续、可微且无约束的问题,并通过深度学习直接预测高质量解。该方法显著加快了训练速度,并生成更高质量的可行解。