分享
AI重磅!Open AI超级代理发布在即?
硬AI关注FOCI锁定FAU供应商、日月光获英伟达CEO访问。OpenAI预计推出能够执行复杂人类任务的超级代理,扎克伯格透露Meta将在2025年拥有能代替中层工程师的AI。
2025 年 Next Token Prediction 范式会统一多模态吗?
本文介绍了多模态领域基于Next Token Prediction的最新进展,包括Tokenization技术、模型架构设计、训练方法与推理策略等,并提出了四个亟待解决的挑战。
DeepSeek-R1技术突破:基础模型强化学习+蒸馏小模型超越o1-mini
DeepSeek-R1正式发布,API上线、技术报告公开、开源8个模型,涵盖从小至32B的多种规模。报告亮点包括后训练RL和流水线开发技术,并证明了小模型也能达到强大性能。
OpenAI 陷造假风波!o3 提前看过了FrontierMath数据?
OpenAI再次陷入信任危机,被揭发从一开始就可访问FrontierMath全部数据,引发业界哗然。事件揭示了数据使用、透明度及诚信问题,引发了广泛讨论与质疑。
<200元的o1复现,尽管对比
我是小冬瓜AIGC,原创超长文知识分享。手撕o1实现课程已帮助多名同学上岸,低成本完成o1类模型复现,环境4×4090训练7天内完成,成本低于200元。课程内容包括实操项目、RL/RLHF、LLM加速等专题,涵盖多种算法和模型训练实践。