Harmon:协调视觉表征,统一多模态理解和生成(模型已开源)

吴思泽博士生提出Harmon模型,通过统一多模态表征促进图像理解和生成。其框架包括共享MAR编码器和三阶段训练策略,在理解与生成任务中均取得显著效果,并优于现有统一模型。

9年实现爱因斯坦级AGI?OpenAI科学家Dan Roberts谈强化学习扩展的未来

OpenAI 研究科学家 Dan Roberts 在 AI Ascent 上介绍了强化学习和预训练的进步,预测未来 AI 模型将在测试时间扩展方面发挥更大作用,并希望模型能在科学前沿做出重大贡献。他强调需要大规模扩展计算和科学,目标是在 2034 年使 AI 能够进行长达 8 小时的计算与思考。

清华提出ConCISE:简单有效,Reasoning过程砍掉一半,准确率不降!

MLNLP社区是国内外知名的机器学习与自然语言处理社区。该社区致力于促进学术界、产业界和爱好者的交流与进步,特别是初学者的成长。最新研究表明,通过信心注入和早停机制,可以显著减少模型的冗余推理步骤,提高准确性而不影响性能。