绝对零监督Absolute Zero:类AlphaZero自博弈赋能大模型推理,全新零数据训练范式问世
rning with Verifiable Rewards(RLVR)范式下涌现出一批
「Zero
rning with Verifiable Rewards(RLVR)范式下涌现出一批
「Zero
Sparse VideoGen 提出了一种无需重新训练模型的方法来加速视频生成过程。通过挖掘注意力机制中的空间与时间稀疏性,该方法成功将推理时间减半,并保持了接近原模型的视觉质量。
清华大学叉院与星动纪元联合研发的VPP视频预测政策大模型,实现了从文本指令到机器人动作生成。该模型利用大量互联网视频数据训练,实现视频预测和实时执行,大幅提升机器人的操作策略泛化能力,并且已经全部开源。
微软团队发布业内首个深度集成 Windows 操作系统的桌面智能平台UFO² AgentOS,其创新性地引入多智能体架构、混合控件感知、动态知识集成和推测式多步执行等技术,显著提升了任务执行效率与稳定性。
Mixture-of-Experts(MoE)架构尽管稀疏激活减少了计算量,但显存资源受限的端侧部署仍面临挑战。研究提出Mixture-of-Lookup-Experts(MoLE),通过将专家输入改为嵌入(token) token,利用查找表代替矩阵运算,有效降低推理开销,减少数千倍传输延迟。