学术
浙大×小红书发布MT-R1-Zero:强化学习重塑机器翻译,7B小模型媲美GPT-4o
MT-R1-Zero首次将R1-Zero范式扩展到机器翻译领域,通过规则-度量混合奖励机制实现无需监督微调的端到端强化学习优化。该方法在多项指标上超越了现有模型。
JHU提出最强ToM方法,AutoToM横扫五大基准
本文介绍了一种名为AutoToM的方法,它是一种全自动、开放式的心智推理方法。该方法在五个基准测试中均表现出最佳性能,并且具有良好的可扩展性和鲁棒性。
2025长三角(芜湖)算力算法创新应用大赛赛题征集公告
为促进长三角数字经济高质量发展,2025长三角(芜湖)算力算法创新应用大赛面向全国征集赛题。赛事设数据、算力和算法三大方向,要求提供具有实际价值和技术挑战的优质题目,并在4月23日前提交。
CVPR 2025|腾讯优图实验室22篇论文入选,含深度伪造检测、自回归视觉生成、多模态大语言模型等研究方向
录用结果揭晓,腾讯优图实验室共有22篇论文入选,内容涵盖深度伪造检测、自回归视觉生成、多模态大语言模