《超大规模操作手册:在 GPU 集群上训练 》Part1(基础概念,DP,TP) 下午2时 2025/02/22 作者 GiantPandaCV cale-playbook 作者:nanotron 校正:pprp 我们在最多 512 个 GPU
被玩疯的小红书 AI 翻译,用了哪家大模型? 下午11时 2025/01/20 作者 特工宇宙 小红书在五天内全量更新了笔记和评论的多语言翻译功能。此功能利用大语言模型技术,处理文字的歧义和缩写等情况时更加精准,并且有时会出现意料之外的结果。