学术
多模态大模型文心4.5后训练详解
MLNLP社区致力于促进国内外机器学习与自然语言处理的交流与发展,涵盖硕博生、高校老师及企业研究人员。文心4.5开源10个多模态大模型,并介绍其后训练阶段的技术细节。
任务级奖励提升AppAgent思考力,淘天提出Mobile-R1,3B模型可超32B
MLNLP社区介绍了采用多回合、任务导向的交互式强化学习框架Mobile-R1,旨在提高移动代理在复杂环境中的适应性和探索能力,并提出三阶段训练流程提升模型表现。团队通过高质量轨迹数据集进行格式微调、动作级和任务级训练,最终显著提升了模型在多种基准上的性能。
训练性能显著提升,字节跳动郑思泽详解 Triton-distributed 框架,实现大模型高效分布式通信与计算融合
ted:原生 Python 编程实现高性能通信」主题演讲中,来自字节跳动的 Seed Researc
ICCV2025破解安防行为识别困局:从“找谁”到“在干嘛”,带来智能守护新可能
MLNLP社区发布ICCV 2025论文《Beyond Walking》:提出大规模图像-文本行人异常检索基准集,融合AI生成图像、大模型描述与专家修正,解决行为数据稀缺问题,提升识别精度至84.93%。
ACM MM 2025 EventVAD:7B参数免训练,视频异常检测新SOTA
北京大学、清华大学与京东联合提出EventVAD框架,无需训练即可实现高效精准的视频异常检测。通过事件感知动态图构建、图注意力传播等技术,显著提升了检测精度和效率。
先别急着给OpenAI加冕!陶哲轩:这种「金牌」,含金量取决于「赛制」
OpenAI 模型在国际数学奥林匹克竞赛中取得佳绩,得分为35分(满分42分),引发广泛讨论。陶哲轩认为需谨慎看待此类结果,强调测试条件的重要性。