模型规模归档

GPT-5研发困局曝光：2大核心技术失效，Meta挖到大动脉，能力未达代际飞跃

2025年8月4日12时作者智东西

全网首份GPT-5聊天记录曝光了！
智东西8月4日报道，今天，OpenAI首席执行官Sam Alt

2025年8月4日12时作者 AIGC开放社区

、推断复杂问题、创造新的思想，一直是人工智能领域最具挑战性的问题之一。
世界上所有语言存在通用语法吗

2025年7月9日23时作者机器之心

研究团队发布SFE科学评估基准，并构建了SciPrismaX科学评测平台，展示不同大小模型在科学领域的表现。结果显示，最新的MLLMs在高阶推理任务上进步显著，但知识广度变化不大；闭源模型普遍优于开源模型，在可扩展性方面表现出色。研究团队希望构建更严谨、动态且与科研实践深度契合的评估生态。

2025年5月15日16时作者量子位

字节Seed团队提出AttentionInfluence方法，利用小型预训练模型选择对大语言模型推理能力有显著提升的数据。通过屏蔽关键头部并计算损失差异来评估数据重要性，最终在多个基准测试中提高了模型性能。

2025年5月7日16时作者机器之心

系统，工具学习以及大语言模型智能体等，英国爱丁堡大学和美国伊利诺伊大学香槟分校(UIUC)访问学者，

2025年4月17日14时作者 Hugging Face

参数优化至关重要。为了探究最佳超参数的规律，我们开展了大规模的实证研究，通过在不同配置上进行网格搜索

2025年2月10日23时作者新智元

前的论文直击大模型死穴——Transformer触及天花板，却引来OpenAI研究科学家的紧急回应。