细粒度对齐无需仔细标注了!淘天提出视觉锚定奖励,自我校准实现多模态对齐
AIxiv专栏介绍及论文《Token Preference Optimization with Self-Calibrated Visual-Anchored Rewards》内容。该研究提出一种创新方法缓解视觉大模型幻觉现象,提升多模态偏好对齐效率和自动化水平。
AIxiv专栏介绍及论文《Token Preference Optimization with Self-Calibrated Visual-Anchored Rewards》内容。该研究提出一种创新方法缓解视觉大模型幻觉现象,提升多模态偏好对齐效率和自动化水平。
音频驱动的层次化视觉合成工具Hallo通过分层音频驱动视觉合成模块和端到端扩散范式实现了高质量的肖像图像动画生成。其精细的区域划分与同步建模、端到端的特点以及多种预训练模型支持,使其在多媒体内容创作、虚拟人物互动和智能客服等领域具有广泛应用前景。
木易在公众号’AI信息Gap’分享最新AI进展,包括阶跃星辰的Step R-mini推理模型、面壁智能的MiniCPM-o 2.6全模态模型等,涵盖了AI科普、工具测评、效率提升等多个方面。
木易,互联网技术产品经理,创建了专注于分享AI知识的公众号。2024年1月17日,OpenAI发布了一款名为o3-mini的新推理模型,该模型比现有的o1快但性能稍逊。Sam Altman表示o3系列将替代GPT-4,并考虑在2025年合并GPT和o系列模型。
就在TikTok宣布暂停服务之际,Perplexity AI提出收购建议,但估值悬殊引发质疑。特朗普可能给予90天缓冲期,拜登政府静默无言,这一事件被视作针对中国科技企业的政治操作。
AI工程师Devin在Answer AI团队为期一个月的测试中失败14次,成功3次。它无法处理复杂任务、过度警惕且缺乏创新性。最终,Cursor的表现优于Devin,显示工具再强大也需要人机协作。
Codeium Windsurf Wave 2发布多项更新,包括Web搜索、自动化记忆和代码执行优化等功能,旨在提升开发者效率并为2025年的AI开发工具竞争做好准备。