2025年1月19日16时 - 第3页共5页

细粒度对齐无需仔细标注了！淘天提出视觉锚定奖励，自我校准实现多模态对齐

2025年1月19日16时作者机器之心

AIxiv专栏介绍及论文《Token Preference Optimization with Self-Calibrated Visual-Anchored Rewards》内容。该研究提出一种创新方法缓解视觉大模型幻觉现象，提升多模态偏好对齐效率和自动化水平。

2025年1月19日14时作者小兵的AI视界

音频驱动的层次化视觉合成工具Hallo通过分层音频驱动视觉合成模块和端到端扩散范式实现了高质量的肖像图像动画生成。其精细的区域划分与同步建模、端到端的特点以及多种预训练模型支持，使其在多媒体内容创作、虚拟人物互动和智能客服等领域具有广泛应用前景。

2025年1月19日14时作者 AI信息Gap

木易在公众号’AI信息Gap’分享最新AI进展，包括阶跃星辰的Step R-mini推理模型、面壁智能的MiniCPM-o 2.6全模态模型等，涵盖了AI科普、工具测评、效率提升等多个方面。

2025年1月19日14时作者 AI信息Gap

木易，互联网技术产品经理，创建了专注于分享AI知识的公众号。2024年1月17日，OpenAI发布了一款名为o3-mini的新推理模型，该模型比现有的o1快但性能稍逊。Sam Altman表示o3系列将替代GPT-4，并考虑在2025年合并GPT和o系列模型。