性能提升归档 - 第2页共4页

转录工具SoftWhisper

上午8时 2025/03/16 作者 GitHubStore

该项目使用Whisper.cpp将音频/视频中的音频转为文字，兼容多种平台且性能优越。相较于传统方法，使用Whisper.cpp可以在大约2-3分钟内转录2小时的音频。

GPT4规模大模型落地，Meta提ExFM框架：万亿参数基础大模型的工业级落地成为可能

下午4时 2025/03/12 作者机器之心

ling）而得到持续的性能增长？这一直是众多企业困扰良久的难题。
在线广告推荐系统是互联网平台的核心

Manus没有壁垒：国内多团队极速复刻，开源狂揽7000星，免费可用，思维链公开透明

下午11时 2025/03/07 作者智东西

替出现！
智东西3月7日报道，今天，MetaGPT团队用
3小时复刻
的开源AI Agent产品Op

从手机PC到汽车AIoT，DeepSeek卷爆端侧AI

下午11时 2025/03/05 作者智东西

以说引爆了整个科技产业，在科技赛道的各个领域掀起波澜。
成本更低、性能更高、规模更小，
“不可能三角

为什么Qwen能自我改进推理，Llama却不行？斯坦福找到了原理

下午4时 2025/03/05 作者机器之心

我们也能让 Llama 学会自我改进。
给到额外的计算资源和「思考」时间，为什么有的模型能好好利用，

中科院、百度提出新架构：突破参数限制，实现高效推理

上午8时 2025/03/04 作者 AIGC开放社区

专注于AIGC领域，讨论微软&OpenAI、百度文心一言等大语言模型的发展与应用。提出Inner Thinking Transformer架构（ITT），通过动态分配计算资源和思考步骤提升模型性能而不增加参数，显著优于基线模型。

4499元16G显存，AMD端掉英伟达？RX 9070系显卡出世，4K狂飙直追旗舰

下午4时 2025/03/02 作者新智元

AMD发布了RDNA 4架构和Radeon RX 9000系列新显卡，对标英伟达产品。RDNA 4加速器支持更多游戏，并与FSR 4技术结合提升性能。苏姿丰表示，AMD将专注于AI推理和高性能计算。

DeepSeek开源第三弹！极致榨干GPU，FP8训推秘籍公开

下午12时 2025/02/26 作者智东西

DeepGEMM是DeepSeek开源的一款支持FP8 GEMM的库，为V3/R1训练和推理提供动力，在Hopper GPU上性能高达1350+ FP8 TFLOPS。该库采用JIT即时编译技术，核心逻辑约为300行，仅支持英伟达Hopper Tensor Core架构，设计简单高效，且在某些形状上的表现优异。

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

下午4时 2025/02/20 作者量子位

-R1美国数学邀请赛AIME分数再提高。
上海交大、港中文、上海AI实验室等带来最新成果
Boost

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31