学术
开源Agent新标杆:通义WebSailor多榜夺魁,挑战OpenAI高难度Agent基准BrowseComp
用户对深层次、多步骤信息获取的需求。从医学研究到科技创新,从商业决策到学术探索,许多复杂问题的解决都
WAIC特别企划视频栏目《AI面对面》,讲出你的「热AI」故事
2025世界人工智能大会WAIC将于上海举行。机器之心推出【AI面对面】栏目,帮助企业通过企业专访、展馆探展等方式展示技术能力与愿景,实现品牌传播和影响力提升。
ACL2025 解谜训练=推理良药?达摩院提出FineReason,教AI学会“三思而后行”
MLNLP社区推出FineReason基准,评估大模型的审慎推理能力。通过逻辑谜题训练,提升模型在数学和通用推理任务上的表现,并揭示其反思与纠错能力的瓶颈。
从 0 手撕 LLM 分布式训练:DP, ZeRO, TP, PP, CP, EP
小冬瓜AIGC发布的X-R1开源框架课程,手撕PyTorch的五大并行算法DP、TP、PP、CP、EP,并实现分布式训练中的关键算法如Backward和MoE。该课程包含实操项目及多个测评工具,适合对LLM技术有兴趣的学员。
ICCV25|单层干预足以减轻LLM的幻觉
MLNLP社区致力于促进国内外机器学习与自然语言处理的交流与进步。近日,论文提出一种无需训练、在线推理中即可部署的轻量干预机制’ONLY’,显著降低大型视觉-语言模型生成幻觉的能力。