学术
ICML 2025 细粒度奖励建模:判别式策略优化下的Q-RM方法
近日,中山大学计算机学院与腾讯微信搜索团队联合提出 Q-RM(Q-function Reward Model),在 ICML 2025 正式发表。这一方法专注于构建更精确的 token-level 奖励信号,显著提升了大语言模型的训练效率和效果。
CVPR’25 workshop冠军方案!中科院&字节Seed提出BridgeVLA:视觉干扰、任务组合等泛化场景轻松拿捏
中科院自动化所与字节跳动联合提出BridgeVLA,通过将预训练和微调的输入输出对齐到统一的2D空间来改进3D VLA模型设计,大幅提高了数据效率和任务成功率。
外国小哥徒手改装消费级5090,一举击败巨无霸RTX Pro 6000
Der8auer 使用 Shunt Mod 将一块华硕 ROG Astral LC RTX 5090 改装到可承受高达 800W 功率,使其性能超越了售价 10,000 美元的 RTX Pro 6000。然而,这种改装可能对 GPU 的寿命造成风险。
3D VLA新范式!中科院&字节Seed提出BridgeVLA,斩获CVPR 2025 workshop冠军!
中科院自动化所谭铁牛团队提出BridgeVLA,通过将预训练和微调的输入输出对齐到统一2D空间来提升3D VLA模型的数据效率与操作效果。
TIP 2025 从噪声图像到精准报告:CMCRL两阶段因果框架重构医疗多模态学习
论文提出CMCRL框架解决放射学报告生成任务中的挑战,包括长序列文本生成、病灶定位和视觉-语言偏倚问题。通过两阶段设计有效捕捉并校正跨模态数据中的偏倚,显著提高准确率和临床可信度。