上下文窗口归档

OpenAI 开源模型泄露：六大技术细节

2025年8月2日12时作者 AI寒武纪

OpenAI即将发布的开源大模型详情曝光。120亿参数混合专家模型在推理时仅激活约50-60亿参数，采用Float4量化技术并使用滑动窗口注意力和注意力汇聚技术处理超长上下文窗口。

2025年6月21日11时作者路过银河AI

特斯拉前人工智能主管Karpathy探讨了LLM的发展历程及应用前景，将其比喻为’软件3.0′:提示词时代，并提出了构建’部分自治’产品和为智能体服务的基础设施的创业机会。

2025年5月1日11时作者新智元

M上下文长度从128K扩展至惊人的400万token SOTA纪录！基于Llama3.1-Instr

2025年4月11日23时作者头部科技

OpenAI近期发布更新，ChatGPT现在可以参考用户的所有对话。然而，数据安全和隐私问题引发了争议。新版本的推出可能带来更高级别的上下文窗口和音乐生成模型。

2025年3月26日16时作者 Z Potentials

谷歌发布下一代AI推理模型Gemini 2.5，具备多模态能力，并在多个基准测试中表现优异。该模型通过Google AI Studio提供给开发者，并计划在未来几周公布其API定价。

2025年2月25日8时作者 AIGC开放社区

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言等大语言模型发展和应用落地。谷歌发布新研究Titans，通过神经长期记忆模块扩展大模型上下文窗口至200万token，超越现有Transformer模型。