性能提升归档 - 第2页共4页

GPT4规模大模型落地，Meta提ExFM框架：万亿参数基础大模型的工业级落地成为可能

下午4时 2025/03/12 作者机器之心

ling）而得到持续的性能增长？这一直是众多企业困扰良久的难题。
在线广告推荐系统是互联网平台的核心

Manus没有壁垒：国内多团队极速复刻，开源狂揽7000星，免费可用，思维链公开透明

下午11时 2025/03/07 作者智东西

替出现！
智东西3月7日报道，今天，MetaGPT团队用
3小时复刻
的开源AI Agent产品Op

从手机PC到汽车AIoT，DeepSeek卷爆端侧AI

下午11时 2025/03/05 作者智东西

以说引爆了整个科技产业，在科技赛道的各个领域掀起波澜。
成本更低、性能更高、规模更小，
“不可能三角

为什么Qwen能自我改进推理，Llama却不行？斯坦福找到了原理

下午4时 2025/03/05 作者机器之心

我们也能让 Llama 学会自我改进。
给到额外的计算资源和「思考」时间，为什么有的模型能好好利用，

中科院、百度提出新架构：突破参数限制，实现高效推理

上午8时 2025/03/04 作者 AIGC开放社区

专注于AIGC领域，讨论微软&OpenAI、百度文心一言等大语言模型的发展与应用。提出Inner Thinking Transformer架构（ITT），通过动态分配计算资源和思考步骤提升模型性能而不增加参数，显著优于基线模型。

4499元16G显存，AMD端掉英伟达？RX 9070系显卡出世，4K狂飙直追旗舰

下午4时 2025/03/02 作者新智元

AMD发布了RDNA 4架构和Radeon RX 9000系列新显卡，对标英伟达产品。RDNA 4加速器支持更多游戏，并与FSR 4技术结合提升性能。苏姿丰表示，AMD将专注于AI推理和高性能计算。

DeepSeek开源第三弹！极致榨干GPU，FP8训推秘籍公开

下午12时 2025/02/26 作者智东西

DeepGEMM是DeepSeek开源的一款支持FP8 GEMM的库，为V3/R1训练和推理提供动力，在Hopper GPU上性能高达1350+ FP8 TFLOPS。该库采用JIT即时编译技术，核心逻辑约为300行，仅支持英伟达Hopper Tensor Core架构，设计简单高效，且在某些形状上的表现优异。

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

下午4时 2025/02/20 作者量子位

-R1美国数学邀请赛AIME分数再提高。
上海交大、港中文、上海AI实验室等带来最新成果
Boost

全球AI算力报告出炉，LLM最爱A100！谷歌坐拥超100万H100等效算力

下午4时 2025/02/15 作者新智元

全球AI算力快速增长，2008至2024年增长超7倍。顶级硬件能效提升显著，低精度计算成为主流。英伟达、Meta等公司主导高性能GPU市场。训练大型模型所需处理器数量大幅增加。

小红书&上交多模态大模型新基准，Gemini 1.5 Pro准确率仅48%

下午11时 2025/02/12 作者量子位

如何？
有新基准来衡量了。
就在最近，小红书和上海交通大学联合提出
WorldSense
，一个全新

2025 年 4 月
一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30