Meta 归档 - 第14页共26页

罕见合著！谷歌、Meta、英伟达团队联手发文，揭秘语言模型 “记忆” 能力

2025年6月5日8时作者头部科技

一篇新论文揭示了语言模型的记忆能力，并提出了新的量化指标用于衡量这种能力。研究表明，Transformer模型每个参数大约可存储3.5到4比特信息，模型的“记忆”与其泛化能力有关，理解这一点有助于开发更安全、可靠的大规模AI系统。

2025年5月27日16时作者机器之心

帮助该公司制定了 AI 战略，某种程度上也改变了全世界的大模型格局。然而，令人意想不到的是，短短几年

2025年5月27日16时作者新智元

Meta发布KernelLLM，一个基于Llama 3.1微调的8B模型，能够在PyTorch代码基础上生成高效的Triton GPU内核，单次推理性能超越GPT-4o和DeepSeek V3。

2025年5月27日11时作者 Z Potentials

Meta AI团队面临人才流失，多位Llama模型核心创作者离职引发对其AI战略的关注。Meta内部研究动荡加剧了外界对该公司能否留住顶尖AI人才的质疑。

2025年5月23日16时作者新智元

ell单用户每秒突破了1000个token，在Llama 4 Maverick模型上，再次创下了AI

2025年5月22日11时作者新智元

最新研究发现，超过20%的AI生成代码依赖不存在的软件包。扎克伯格和微软首席技术官都预估未来大部分AI代码将由智能体生成，但实际使用中可能引发安全问题，如供应链攻击。研究人员利用16种主流大型语言模型生成57.6万个样本发现有44万个依赖项是幻觉产物，对软件供应链构成威胁。

2025年5月11日16时作者 AI前线

LlamaCon。现场，该公司宣布推出一款面向消费者的独立 Meta AI 聊天机器人应用程序，这款