开源
清华大学开源高效的网页爬虫工具,开源的AI创作工作流引擎Refly,手绘示意图详解DeepSeek R1
本文介绍了五个开源项目:Refly用于AI创作,Crawl4LLM用于大规模语言模型预训练的网页爬虫工具,Open Reasoner Zero用于提升大规模推理导向的强化学习训练,SongGen用于文本生成歌曲,Train-DeepSeek-R1通过强化学习提升模型推理能力。
NeuraPress 是一个现代化的 Markdown 编辑器,专注于提供优质的微信公众号排版体验
NeuraPress 是一个现代化的 Markdown 编辑器,专注于微信公众号排版体验,支持移动设备并提供响应式设计。
Transformer教学项目:fun-transformer
Transformer教学项目:fun-transformer课程涵盖编码器和解码器实现,并在无深度学习框架环境下使用基础库实践,最后应用于机器翻译任务。
Hugging Face 发布并开源大模型训练书籍《Ultra-Scale Playbook》
Hugging Face发布了《Ultra-Scale Playbook》一书,介绍大模型训练中的5D并行性、ZeRO等技术,并分享了相关实验和工具的使用经验。
OpenAI官方博客发了篇推理类模型的最佳实践,指导大家如何更好的使用o1、o3这类推理模型
OpenAI发布了推理模型的最佳实践,包括何时使用这些模型(如模糊任务、大海捞针)、如何有效利用以及一些基本原则和技巧。