Hugging Face 发布并开源大模型训练书籍《Ultra-Scale Playbook》
Hugging Face发布了《Ultra-Scale Playbook》一书,介绍大模型训练中的5D并行性、ZeRO等技术,并分享了相关实验和工具的使用经验。
Hugging Face发布了《Ultra-Scale Playbook》一书,介绍大模型训练中的5D并行性、ZeRO等技术,并分享了相关实验和工具的使用经验。
清华大学博士生木易介绍如何使用KTransformers库在RTX 4090 GPU上运行DeepSeek-R1/V3模型,包括环境搭建、模型加载及推理参数设置等步骤。
近期发现一款名为Zonos的新型高保真TTS模型,它能在快速生成特定情绪语音及精准模拟特定人声音效方面表现出色。支持多种语言,并提供包括情感调节、语音定制等功能。
文章探讨了人工智能中的记忆议题,包括SOAR架构、长短期记忆类型、生成式智能体的记忆应用以及AI对人类记忆的影响等,并指出当前在技术实现上仍存在局限性。
用代码表示Agent行动显著提升OpenAI Deep Research系统性能,Hugging Face团队复现时采用代码Agent框架,使验证集准确率从46%提升至55.15%,未来可扩展更多文件格式和处理建议。