无问芯穹推出大模型 Megrez-3B-Omni了

端侧智能模型Megrez-3B-Omni发布,支持图像、音频和文本理解,适用于智能家居、媒体、自动驾驶、医疗健康等多个领域,预计推动AI技术普及及产业发展,增强我国在全球AI领域的竞争力,并带来商业机会与挑战。

视频一键拆分PS层!DeepMind新模型效果碾压同级,物体、背景完美分离,还能脑补

Google DeepMind等机构提出的新视频分层模型无需假设静态背景或精确相机姿态,可分离前景对象和背景,并生成高质量分解结果。该方法利用视频扩散模型及三元掩码技术,增强了遮挡区域补全能力,提升了视频编辑效率和直观性。