预训练归档 - 每时AI

从大模型到机器人，走进WAIC现场：这届AI真能干活了！

2025年7月27日23时作者乌鸦智能说

AIC不仅卷技术，更卷“落地能力”——从自动驾驶、具身智能，到产业AI、国产算力，各大展区比拼的不是

2025年7月5日8时作者新智元

fuCoder，用扩散模型+强化学习策略，直接性能飙升4.4%。自回归，真的要落幕了吗？
文本扩散

2025年6月26日23时作者极市干货

zhihu.com/p/1920616505151845374
编辑丨极市平台
极市导读
从
los

2025年6月21日23时作者新智元

OpenAI前研究主管Bob McGrew指出，预训练、推理和多模态能力是实现AGI的关键，而2025年将是推理之年。他强调预训练仍然重要但收益递减，而推理则面临技术潜力逐渐被「消耗殆尽」的挑战。

2025年6月19日8时作者机器之心

LLM
仅出现不到十年，就已将曾经遥不可及的人工智能能力普及给大众，让全球数亿人能够通过自然语言进

2025年5月30日16时作者量子位

K，短短2秒钟时间，一个
准万亿MoE大模型
就已经吃透如何解一道
高等数学大题
了！
而且啊，这个

2025年5月28日14时作者智能涌现

AI行业，这是最大的“罗生门”事件。
2023年，模型预训练，还是第一性原理。然而，从OpenAI前

2025年5月17日16时作者机器之心

GPT-3 到 GPT-4o，「next-token prediction」以简单粗暴的因果建模横扫

2025年5月3日14时作者老刘说NLP

题。
最近看到一句话，很有感触，
真正的技术护城河是：十年如一日的苦活、脏活、累活，说不清、道不明的

2025年4月29日11时作者开源AI项目落地

Qwen3今日发布，参数量2350亿的旗舰模型Qwen3-235B-A22B超越多个模型。亮点包括混合思维模式、多语言支持和增强代理能力；预训练数据集涵盖119种语言，计算成本更低；链接见原文。