Llama 归档 - 第2页共3页

1000万上下文！新开源多模态大模型，单个GPU就能运行

2025年4月7日8时作者 AIGC开放社区

Meta 最新开源模型 Llama 4 Scout 达到千万级上下文，拥有 1090 亿参数。其使用 NoPE 架构解决长度泛化问题，并通过优化训练流程和强化学习框架提升性能。

2025年4月2日16时作者 Z Potentials

Meta人工智能研究主管Joelle Pineau宣布将于5月离职，正值Meta在AI领域加大投资之际。

2025年3月25日11时作者新智元

本文介绍了当前科研人员青睐的AI模型：o3-mini、DeepSeek-R1、Llama、Claude 3.5 Sonnet和Olmo 2。它们各有优劣，但为科研人员提供了多样选择。

2025年3月16日8时作者机器之心

Sesame 发布逼真语音助手 Maya，通过情感智能、上下文记忆和高保真语音生成技术成功跨越了语音恐怖谷效应。CSM-1B 基础模型公开，拥有 10 亿参数规模，并允许商业用途。

2025年3月13日16时作者 PaperWeekly

上下文建模
研究简介
当前大语言模型（LLMs）在处理长上下文任务时面临核心挑战：如何在超长输入中有

2025年3月5日23时作者开源AI项目落地

AI医疗方向介绍，推荐开源项目OpenHealth用于个人健康管理。

2025年2月23日16时作者量子位

OpenAI团队的优化算法Muon在更大模型和数据集上的应用效果被月之暗面团队验证，改进后的Muon对1.5B参数量Llama架构模型的算力需求仅为AdamW的52%，同时基于DeepSeek架构训练出一个16B的MoE模型并开源。

2025年1月24日16时作者 NLP工程化

DeepSeek R1开源模型发布，包括Llama和Qwen蒸馏版本，支持GGUF格式和4位量化，7B模型压缩至4.68G。