可视化图解MOE大模型的7个核心问题:专家、路由、负载均衡及其用于视觉模态 下午7时 2025/03/02 作者 老刘说NLP ,可视化图解moe讲的挺不错,转载过来并做翻译,当作记录,值得收藏慢慢看。 原文在:https://
Kimi思考模型k1.5是怎么练成的?细节曝光 下午2时 2025/01/22 作者 PaperAgent Kimi发布新一代多模态思考模型k1.5,其在数学、代码、视觉和通用能力测试中达到或超越了GPT-4等领先水平。训练过程包括预训练、监督微调以及强化学习三个阶段,重点展示了数据构建、长上下文扩展及策略优化技术。