GRPO=高级版拒绝采样?强化学习祛魅时刻:负样本“去芜存菁”才是关键! 2025年5月20日16时 作者 PaperWeekly PO 这样的算法虽然主流,但它需要额外的网络(critic network),搞得比较复杂和麻烦。
动态视觉Backbone!港大团队开源TransXNet,入选顶刊TNNLS 2025 2025年4月19日23时 作者 PaperWeekly 一种 新型的通用视觉 backbone—TransXNet ,该模型同时融合了全局和动态性。其创新之
顶刊TPAMI 2025!南大、南洋理工联合提出PROOF:基于视觉语言模型的持续学习新范式 2025年3月27日8时 作者 PaperWeekly 保持原有知识的完整性。传统 CIL 方法主要依赖视觉信息进行特征提取,而近年来兴起的视觉-语言模型(
CVPR 2025高分论文!单图1秒变3D真人,全新方法IDOL解决数字人重建问题 2025年3月24日23时 作者 PaperWeekly 览 在虚拟现实、游戏和 3D 内容创作领域,从单张图像高保真重建可动画的 3D 人体一直是一项极具挑
WWW 2025 TAMU、UIUC等提出全新因素链框架,用于论文-评审人匹配 2025年3月5日23时 作者 PaperWeekly 提交数量的迅速增加,我们越来越依赖有效的论文-评审人匹配模型。此前在这一领域的研究考虑了多种因素来评
货拉拉等发布LalaEval:面向领域大模型的端到端人工评测框架 2025年1月14日23时 作者 PaperWeekly ©PaperWeekly 原创 · 作者 | 孙崇衍 单位 | 香港中文大学博士生 研究方向 | 大
在线运行 Llama 3.3 唯一开源 70B 模型,性能堪比 405B!LaTeX OCR 数据集上线,助力数学公式识别 2024年12月30日12时 作者 HyperAI超神经 就在本月,Meta 发布了 Llama 3.3 唯一开源模型 Llama-3.3-70B-Instr