开源
音乐检索进入“多模态对齐”时代:清华 CLaMP-3 的三大极限突破
清华大学朱文武教授团队推出的CLaMP 3是一款多模态、多语言的音乐信息检索框架,实现了跨模态检索和零样本分类等功能。它支持27种语言,并基于对比学习训练模型,使用XLM-R预训练模型实现强大的多语言文本嵌入。
清华大学开源高效的网页爬虫工具,开源的AI创作工作流引擎Refly,手绘示意图详解DeepSeek R1
本文介绍了五个开源项目:Refly用于AI创作,Crawl4LLM用于大规模语言模型预训练的网页爬虫工具,Open Reasoner Zero用于提升大规模推理导向的强化学习训练,SongGen用于文本生成歌曲,Train-DeepSeek-R1通过强化学习提升模型推理能力。
NeuraPress 是一个现代化的 Markdown 编辑器,专注于提供优质的微信公众号排版体验
NeuraPress 是一个现代化的 Markdown 编辑器,专注于微信公众号排版体验,支持移动设备并提供响应式设计。
Transformer教学项目:fun-transformer
Transformer教学项目:fun-transformer课程涵盖编码器和解码器实现,并在无深度学习框架环境下使用基础库实践,最后应用于机器翻译任务。
Hugging Face 发布并开源大模型训练书籍《Ultra-Scale Playbook》
Hugging Face发布了《Ultra-Scale Playbook》一书,介绍大模型训练中的5D并行性、ZeRO等技术,并分享了相关实验和工具的使用经验。