OpenAI被偷家,谷歌Veo 2反超Sora
谷歌发布了两款视觉生成模型Veo 2和Imagen 3,以及一个工具Whisk。Veo 2可生成高质量的4K分辨率视频,并理解提示词中的相机控制指令。其表现优于现有最佳模型Sora。
谷歌发布了两款视觉生成模型Veo 2和Imagen 3,以及一个工具Whisk。Veo 2可生成高质量的4K分辨率视频,并理解提示词中的相机控制指令。其表现优于现有最佳模型Sora。
本文介绍了一种通用的防御框架,用于对抗LLM提示词注入攻击。该框架包括安全前端、结构化指令微调和安全对齐三种策略,并已在USENIX Security 2025接受的第一篇论文中验证。
极佳科技团队通过ReconDreamer实现自动驾驶场景的自由视角重建与生成。该模型仅需单视角输入视频,即可通过世界模型训练减少伪影并进行渐进式修复,显著提升大范围相机运动下的渲染质量,媲美专业三维重建技术。
浙江大学开发的人机交互AI病理万能助手OmniPT已在浙大一院进行临床验证,有效解决了病理人才匮乏的问题。OmniPT结合视觉和语言模型,提高了诊断效率和准确性,并在癌症分类、分割等多任务上实现全覆盖。