阿里巴巴:裁减 24940 人!

MLNLP社区是国内外知名的机器学习与自然语言处理社区,致力于促进学术界、产业界和爱好者的交流合作。近期阿里巴巴裁员引起广泛关注,反映了企业需优化运营和集中资源于核心业务。MLNLP社区为相关从业者提供交流平台,并邀请加入技术交流群。

港理工提出TokenSkip:让大模型在CoT中“跳”过冗余token,压缩40%,性能几乎不降!

MLNLP社区致力于促进国内外机器学习与自然语言处理领域的交流合作。近日,一篇关于LLM的论文提出TokenSkip方法,通过跳过不重要token来压缩思维链,提高推理速度和用户体验。

DeepSeek-R1 解读及技术报告中文版

MLNLP社区致力于促进国内外机器学习与自然语言处理领域的交流合作。最新研究成果《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》通过纯强化学习实现了模型推理能力的自主进化,并结合蒸馏技术实现高效迁移,显著提升了多项任务表现。