Llama4模型四点核心总结及大模型推理数据合成工具Project Loong 下午2时 2025/04/06 作者 老刘说NLP 经有了 很多标题党开始说RAG原地失业以及引领多模态的论调了,这并不好 ,需要公正的看待这个模型本身
LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯 上午11时 2025/04/06 作者 量子位 Llama家族上新,一群LIama 4就这么突然发布了。 这是Meta首个基于MoE架构模型系列,目
Meta推出Llama 4:MoE构架、原生多模态、10M上下文,没有发布推理模型 上午11时 2025/04/06 作者 Founder Park 4 系列模型,其中两款——参数高达 400B 亿的 Llama 4 Maverick 和 109B
2025年Next Token Prediction范式会统一多模态吗? 下午12时 2025/01/16 作者 PaperWeekly 本文将介绍最近和来自北大,北航,港大,国科大等学校的同学以及阿里,Microsoft,Humanif