ACL 2025 大模型“以讹传讹”?DRAG双阶段「多代理辩论」破解幻觉叠加问题
论文提出DRAG框架,通过引入多智能体辩论机制缓解RAG中的幻觉问题。DRAG在检索和生成阶段引入正反方辩论,以提高答案的真实性和可靠性。研究显示,在多个数据集上DRAG取得了强劲表现。
论文提出DRAG框架,通过引入多智能体辩论机制缓解RAG中的幻觉问题。DRAG在检索和生成阶段引入正反方辩论,以提高答案的真实性和可靠性。研究显示,在多个数据集上DRAG取得了强劲表现。
GPT-4o、Claude 等 AI 模型在猜测 1-100 数字时,选择了概率较低的数字 42 和 73。然而,在使用汉语时,多数模型选择了 27,这一现象引起了广泛讨论和研究。
近日MiniMax开启#MiniMaxWeek技术周,发布全新M1模型。M1模型在训练与推理效率上显著提升,支持超长文本输入和输出(最大100万个token)。特别擅长Agent工具调用任务。核心技术包括混合注意力架构和CISPO算法。
MLNLP社区是国内知名的人工智能与自然语言处理学术社群,旨在促进跨学科交流合作。近期,该团队揭穿了大模型在编程比赛中表现不佳的事实,并提出了改进方法以提升AI能力。
FVDM & Pusa 提出了一种新的视频扩散模型 (FVDM),通过引入向量化时间步变量 (VTV) 解决了传统视频生成的局限性。Pusa 项目利用非破坏性微调方法将预训练模型成本降低了数倍,展示了低成本、高灵活视频生成的新时代。
Reddit上爆火的吉卜力风游戏视频制作教程,国产AI即梦3.0 Pro、可灵2.1和Hailuo 02模型对比测试,展示了AI在游戏开发中的潜力。
本文提出了一种双专家一致性模型DCM来解决视频生成中的一致性蒸馏问题,通过解耦语义合成与细节精修,显著减少采样步数的同时保持了较高的视觉质量。