推理归档 - 每时AI

LLaMA-Factory Day0 支持了 GLM-4.1V-Thinking 模型的微调和推理

2025年7月3日8时作者 NLP工程化

LLaMA-Factory Day0发布支持GLM-4.1V-Thinking模型微调和推理的代码更新及视频教程

OpenAI底层AGI技术被曝光！前研究主管豪言：从此再无新范式

2025年6月21日23时作者新智元

OpenAI前研究主管Bob McGrew指出，预训练、推理和多模态能力是实现AGI的关键，而2025年将是推理之年。他强调预训练仍然重要但收益递减，而推理则面临技术潜力逐渐被「消耗殆尽」的挑战。

小米开源MiMo模型，称性能超阿里QwQ-32B-Preview及OpenAI o1-mini

2025年5月6日19时作者 AI先锋官

小米发布首个为推理而生的大模型MiMo，仅7B参数规模超越OpenAI和阿里Qwen。技术团队强调预训练与后训练协同优化的重要性，通过特定数据合成及创新算法提升推理能力。

在企业场景中应该怎么部署大模型——大模型企业级部署框架介绍

2025年4月9日14时作者 AI探索时代

随着大语言模型（LLM）应用增加，企业级部署和推理模型成为焦点。多种前端框架如Transformers、ModelScope等被对比分析，帮助选择最适合的解决方案。

刚刚，DeepSeek公布推理时Scaling新论文，R2要来了？

2025年4月4日16时作者机器之心

，DeepSeek 提交到 arXiv 上的最新论文正在 AI 社区逐渐升温。
当前，强化学习（RL

谷歌Gemini频繁更新，这次能逆袭吗？

2025年3月15日14时作者 AI信息Gap

谷歌 Gemini AI 最近动作频频。发布了参数量仅为 DeepSeek-V3 1/25 的 Gemma 3，以及支持生图功能的 Gemini 2.0 Flash-Exp 模型，并开放了 Gemini 的 Deep Research 使用权限，升级为自家推理模型 Gemini 2.0 Flash Thinking。新增个性化模式和 Gems 智能体平台等功能。

刚刚！老黄亲自下场灭火：市场误读 Deepseek，数字孪生将爆发，AI 发展远未结束

2025年2月22日16时作者 AI寒武纪

Nvidia掌门人黄仁勋表示，市场对AI的理解存在误区。他认为预训练、推理只是AI发展的开始，并强调后训练才是智慧的关键阶段。他还指出企业需构建数据智慧层，利用元数据和压缩比高的语义层来管理海量原始数据。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31