视频一键拆分PS层!DeepMind新模型效果碾压同级,物体、背景完美分离,还能脑补

Google DeepMind等机构提出的新视频分层模型无需假设静态背景或精确相机姿态,可分离前景对象和背景,并生成高质量分解结果。该方法利用视频扩散模型及三元掩码技术,增强了遮挡区域补全能力,提升了视频编辑效率和直观性。

世界模型进入4D时代!单视角视频构建的自由视角4D世界来了

极佳科技团队通过ReconDreamer实现自动驾驶场景的自由视角重建与生成。该模型仅需单视角输入视频,即可通过世界模型训练减少伪影并进行渐进式修复,显著提升大范围相机运动下的渲染质量,媲美专业三维重建技术。

AI病理助手来了!浙大OmniPT上岗,3秒锁定癌症病灶,准确率超95%

浙江大学开发的人机交互AI病理万能助手OmniPT已在浙大一院进行临床验证,有效解决了病理人才匮乏的问题。OmniPT结合视觉和语言模型,提高了诊断效率和准确性,并在癌症分类、分割等多任务上实现全覆盖。