ACL 2025 大模型“以讹传讹”?DRAG双阶段「多代理辩论」破解幻觉叠加问题

论文提出DRAG框架,通过引入多智能体辩论机制缓解RAG中的幻觉问题。DRAG在检索和生成阶段引入正反方辩论,以提高答案的真实性和可靠性。研究显示,在多个数据集上DRAG取得了强劲表现。

碾压DeepSeek推理4倍!MiniMax M1百万token长文屠榜,开源登顶全球前二

近日MiniMax开启#MiniMaxWeek技术周,发布全新M1模型。M1模型在训练与推理效率上显著提升,支持超长文本输入和输出(最大100万个token)。特别擅长Agent工具调用任务。核心技术包括混合注意力架构和CISPO算法。

0%通过率!Code神话泡沫!LiveCodeBenchPro发布!

MLNLP社区是国内知名的人工智能与自然语言处理学术社群,旨在促进跨学科交流合作。近期,该团队揭穿了大模型在编程比赛中表现不佳的事实,并提出了改进方法以提升AI能力。

数据减少超千倍,500 美金就可训练一流视频模型,港城、华为Pusa来了

FVDM & Pusa 提出了一种新的视频扩散模型 (FVDM),通过引入向量化时间步变量 (VTV) 解决了传统视频生成的局限性。Pusa 项目利用非破坏性微调方法将预训练模型成本降低了数倍,展示了低成本、高灵活视频生成的新时代。

10×加速!DCM显著提升视频扩散模型推理效率!HunyuanVideo13B推理时间从1500秒缩短至120秒!

本文提出了一种双专家一致性模型DCM来解决视频生成中的一致性蒸馏问题,通过解耦语义合成与细节精修,显著减少采样步数的同时保持了较高的视觉质量。