小兵的AI视界
FilmAgent:哈工大深圳×清华,AI多智能体框架引领虚拟3D电影制作新纪元
FilmAgent是由哈尔滨工业大学(深圳)与清华大学联合开发的一款基于大型语言模型的多智能体协作框架,用于实现虚拟3D空间中的端到端电影制作自动化。它通过批评-修正-验证和辩论-评判策略优化剧本内容并确定镜头设置。
2.6B 参数量逆袭!Lumina – Image 2.0 文生图模型,DPG 87.2 高分,高分辨率生成吊打同行
、设计等众多行业带来了前所未有的变革与发展机遇。前些天,
Alpha-VLLM
团队开源的文生图模型
DeepSeek为啥这么火?技术内幕+应用场景大揭秘
2025年开年,国产大模型DeepSeek凭借低成本、高性能和全开源特性震撼全球。从数学竞赛到汽车智能座舱,DeepSeek重塑了多个行业应用,并在技术突破和实际落地方面展现了巨大潜力。
必看!VividTalk:阿里、南大等联合打造,一张照片+音频秒变说话头像视频黑科技
VividTalk是南京大学、阿里巴巴、字节跳动和南开大学联合开发的人工智能技术项目,通过音频驱动生成逼真的说话头像视频。该项目采用先进的3D混合先验技术和双分支运动-VAE(变分自编码器)来实现高质量的视觉效果和自然同步对话。
太惊艳!字节跳动 INFP,让虚拟对话 “活” 起来啦
INFP是字节跳动研发的一种全新的音频驱动交互式头部生成框架,它能根据双轨对话音频实时生成动态虚拟人物头像,支持多语言、唱歌模式和多种场景。研究显示其在音频-唇同步性、身份保留和动作多样性等方面表现优异。