每秒生成超30帧视频,支持实时交互!自回归视频生成新框架刷新生成效率

近日,微软研究院与北京大学联合发布的新框架Next-Frame Diffusion(NFD)实现了每秒超过30帧的视频生成速度,并保持高质量画面。相比现有自回归视频生成模型,NFD采用帧内双向注意力和帧间因果依赖机制建模视频,并通过多步迭代和并行采样提高效率。

医学领域也有世界模型了:精准模拟肿瘤演化,还能规划治疗方案

香港科技大学(广州)等机构提出医学世界模型MeWM,能够基于临床治疗决策模拟肿瘤演变过程,并支持个性化治疗方案选择。其核心功能包括肿瘤演变模拟、生存风险预测和临床决策闭环优化。在真实肝癌场景下验证了其有效性,通过生成逼真的术后影像提高了医生的识别准确率。

“甲方快乐模型”诞生,拿下平面设计新SOTA!多条件一键生成,还能独立调整元素 复旦&字节

复旦大学和字节跳动团队联合提出CreatiDesign新模型,可实现高精度、多模态、可编辑的AI图形设计生成。该模型解决了扩散Transformer架构在处理图形设计时面临的统一建模、精细解耦控制及大规模高质量标注数据缺失等问题。