学术
多模态大模型文心4.5后训练详解
MLNLP社区致力于促进国内外机器学习与自然语言处理的交流与发展,涵盖硕博生、高校老师及企业研究人员。文心4.5开源10个多模态大模型,并介绍其后训练阶段的技术细节。
任务级奖励提升AppAgent思考力,淘天提出Mobile-R1,3B模型可超32B
MLNLP社区介绍了采用多回合、任务导向的交互式强化学习框架Mobile-R1,旨在提高移动代理在复杂环境中的适应性和探索能力,并提出三阶段训练流程提升模型表现。团队通过高质量轨迹数据集进行格式微调、动作级和任务级训练,最终显著提升了模型在多种基准上的性能。
训练性能显著提升,字节跳动郑思泽详解 Triton-distributed 框架,实现大模型高效分布式通信与计算融合
ted:原生 Python 编程实现高性能通信」主题演讲中,来自字节跳动的 Seed Researc
ICCV2025破解安防行为识别困局:从“找谁”到“在干嘛”,带来智能守护新可能
MLNLP社区发布ICCV 2025论文《Beyond Walking》:提出大规模图像-文本行人异常检索基准集,融合AI生成图像、大模型描述与专家修正,解决行为数据稀缺问题,提升识别精度至84.93%。