Hugging Face
LG发布NEXUS框架,用AI确保训练数据合规性
专注于AIGC领域的专业社区,关注大语言模型(LLM)的发展和应用。文章介绍了数据合规的重要性,并提出了一种新的框架NEXUS来评估数据集的法律风险,显著提高了准确性并降低了成本。
GPT-4o举步维艰、Claude 3.7险胜,《超级马里奥》成为了检验大模型的新试金石?
GamingAgent 项目使用《超级马里奥兄弟》等平台游戏测试 AI 性能,通过模拟器和基本指令控制马里奥。结果显示 Claude 3.7 和 GPT-4o 在不同游戏中表现差异显著,GPT-4o 表现较差。专家认为当前评估 AI 智能的方法存在局限性,需要改进衡量标准来评估创造性思维和大胆反常规思考能力。
Autiobooks:一键将电子书转换为有声读物,让阅读更轻松
一键将电子书转换为有声读物的Autiobooks应用介绍:采用高质量语音合成技术,支持多种语言和风格,生成的.m4b文件可直接在播放器上使用。
从文件到块: 提高 Hugging Face 存储效率
Hugging Face 使用基于 Git LFS 的存储方案在 GitHub Hub 上存储模型、数据集和 Spaces。Xet 团队提出了一个创新的解决方案——基于内容的分块 (CDC),通过只传输变化的数据块来提升存储效率和迭代速度,目前该技术已应用于多个仓库,并实现了数据去重。
让 LLM 来评判 | 设计你自己的评估 prompt
第三篇《让LLM来评判》系列文章总结了评估模型的通用设计原则,包括清晰的任务描述、精细的评分标准、加入推理步骤和明确输出格式等。同时,也提到使用成对比较、引用参考内容及思维链等方式提升评估准确性,并探讨了奖励机制和社区机制的作用。
Hugging Face 发布并开源大模型训练书籍《Ultra-Scale Playbook》
Hugging Face发布了《Ultra-Scale Playbook》一书,介绍大模型训练中的5D并行性、ZeRO等技术,并分享了相关实验和工具的使用经验。
RTX 4090单卡跑满血版DeepSeek-R1?清华&趋境科技联合推出KTransformers方案!
清华大学博士生木易介绍如何使用KTransformers库在RTX 4090 GPU上运行DeepSeek-R1/V3模型,包括环境搭建、模型加载及推理参数设置等步骤。