训练成本归档

辛顿、闫俊杰WAIC完整演讲：一个预警，一个拥抱

2025年7月26日19时作者智能涌现

幕主论坛上，多位AI行业的顶级大咖出席并发表演讲，为与会者烹饪了一道学术大餐。
“深度学习教父”、图

2025年4月8日16时作者新智元

AI领域的最新趋势：中美顶级模型性能差距缩至0.3%，以DeepSeek为代表的模型强势崛起，逼近闭

2025年3月1日16时作者新智元

：预训练Scaling
L
aw不是OpenAI的护城河。将来95%的算力将用在推理，而不是现在的训

2025年2月3日23时作者 NLP工程化

DeepSeek-V2 采用 DeepSeekMoE 架构优化训练成本和推理效率，引入稀疏激活的专家网络。