如何估算大模型推理及微调的GPU显存需求?影响因素、计算规则及注意事项 下午2时 2025/05/04 作者 老刘说NLP 有介绍过,这次再温习一遍,讲的再细致些 计算LLM的显存需要考虑多个因素, 了解核心组件(参数、优化
xet-core:为Hugging Face Hub提供高效存储和数据管理的底层技术 上午8时 2025/04/22 作者 NLP工程化 Hugging Face Hub底层技术xet-core提供高效存储和数据管理功能,包括基于chunk的去重、Python绑定集成和本地磁盘缓存提升性能。
暴击GPT-4.5,DeepSeek-V3-0324官方报告出炉!系统提示、最佳温度全放出 上午8时 2025/03/26 作者 新智元 PT-4.5和Claude 3.7。DeepSeek-V3-0324新版本的发布让全球网友为之疯狂,