机器之心
OpenAI被偷家,谷歌Veo 2反超Sora
谷歌发布了两款视觉生成模型Veo 2和Imagen 3,以及一个工具Whisk。Veo 2可生成高质量的4K分辨率视频,并理解提示词中的相机控制指令。其表现优于现有最佳模型Sora。
USENIX Sec’25 LLM提示词注入攻击如何防?UC伯克利、Meta最新研究来了
本文介绍了一种通用的防御框架,用于对抗LLM提示词注入攻击。该框架包括安全前端、结构化指令微调和安全对齐三种策略,并已在USENIX Security 2025接受的第一篇论文中验证。
世界模型进入4D时代!单视角视频构建的自由视角4D世界来了
极佳科技团队通过ReconDreamer实现自动驾驶场景的自由视角重建与生成。该模型仅需单视角输入视频,即可通过世界模型训练减少伪影并进行渐进式修复,显著提升大范围相机运动下的渲染质量,媲美专业三维重建技术。