学术归档 - 第162页共283页

字节首次公开图像生成基模技术细节！数据处理到RLHF全流程披露

2025年3月12日16时作者机器之心

公开了文生图模型技术细节，涵盖数据处理、预训练、RLHF 在内的后训练等全流程模型构建方法，也详细披

从DeepSeek MoE专家负载均衡谈起

2025年3月12日14时作者 GiantPandaCV

上周同事分享了关于线上DeepSeek-R1推理的Expert激活数据的研究，发现专家负载不均衡现象。通过分析论文和内部请求数据，提出了一些关于MoE模型在不同场景下的应用观点，并讨论了细粒度MoE的重要性以及模型深度对Overlap的影响。

长链推理相关论文速览

2025年3月12日14时作者机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

刚刚！微调 DeepSeek 满血版正式开源。。。

2025年3月12日14时作者机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

在线教程 OpenManus 与 QwQ-32B 强强联合，推理过程全透明

2025年3月12日12时作者 HyperAI超神经

HyperAI超神经上线了OpenManus + QwQ-32B 实现 AI Agent教程，并为新用户提供了1小时4卡RTX A6000免费使用时长的惊喜福利。

OpenAI突然发布智能体API！支持网络和文件搜索以及computer use

2025年3月12日12时作者机器之心

晨，OpenAI 发布了一系列可让开发者通过 API 构建智能体的新工具，其中最大的看点便是
Res

在长文本上比Flash Attention快10倍！清华等提出APB序列并行推理框架

2025年3月12日12时作者机器之心

线被拉升，以此为基础所构建的长 CoT 推理、多 Agent 协作等类型的高级应用也逐渐增多。
随之

李飞飞团队「具身智能」最新研究：机器人接手所有家务

2025年3月11日23时作者机器之心

机器之心报道
研究团队开发出BEHAVIOR Robot Suite（简称BRS），一种综合性框架，用于掌握机器人在多样化家庭任务中的移动全身操作。通过JoyLo和WB-VIMA两项关键技术创新，实现对高自由度移动机械臂的流畅控制，并进行高质量的数据收集和学习策略优化。实验结果显示，BRS支持多种日常家务任务，且能高效完成精细操作。

ICLR 2025 Spotlight｜Serge Belongie组与ETH提出：「免费」多模态信息助力3D小样本分割！

2025年3月11日23时作者极市干货

创新方法：在无需额外标注成本的前提下，融合了文本，2D，3D信息，助力模型更好地适应到新类别。
>>

揭示显式CoT训练机制：思维链如何增强推理泛化能力

2025年3月11日23时作者机器之心

的主流方法之一。
例如，OpenAI 在其「12 Days of OpenAI」直播系列的第二日推出

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31