大模型归档 - 第46页共58页

仅8个月就把GPT-4o带到了端侧，面壁智能拿到了什么秘籍？｜

2025年1月16日23时作者甲子光年

端侧GPT-4o水平模型，成色如何？
作者｜王艺
‍
‍
编辑｜王博
“今年年初我们让GPT-3水平

2025年1月16日12时作者 PaperWeekly

MiniMax-01系列模型开源，支持400W token长文本处理。该系列通过线性注意力机制大幅降低计算成本和提高效率。MiniMax-Text-01在文本任务与多模态任务上表现优异，展示了强大的超长文本理解和处理能力。

2025年1月16日8时作者 AIGC开放社区

专注AIGC领域的专业社区报道了大模型平台Cohere发布的AI协作平台North，其支持多种语言和智能搜索功能，允许用户快速创建和定制AI助手提升工作效能。

2025年1月15日23时作者钛媒体AGI

美国
公布
新一轮全球AI算力出口管制的不到48小时内，五家中国 AI 企业不约而同都发布大模型新品

2025年1月15日16时作者硅星人Pro

“如果把参数规模扩大x倍，模型能力就会得到y倍的提升” ——这条支撑着AI领域几年狂飙突进的Scal

2025年1月14日14时作者 AI探索时代

开发大模型包括数据集处理、模型设计与训练等步骤，以Transformer为例详解其结构；主要包含输入嵌入、编码器解码器架构和多头注意力机制等内容。

2025年1月13日23时作者钛媒体AGI

2025年开年，张一鸣和王兴要在 AI 领域“大干一场”。
1月13日消息，00后团队创立的3D生成

2025年1月13日16时作者 AI前线

作者 | AICon 全球人工智能开发与应用大会
策划 | 李忠良
随着大模型技术的不断发展，它已广

2025年1月13日16时作者新智元

一项针对全球医学相关研究者的调查显示，了解大模型的受访者发表的文章数量更多。尽管大多数受访者表示从未在项目或论文中使用过大模型，但大模型已在纠正语法和格式错误等方面得到广泛应用。研究还显示，受访者对AI工具未来影响持有乐观态度，认为大模型将促进学术产出效率。