清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目
清华大学KVCache.AI团队联合趋境科技发布KTransformers开源项目,支持24G显存在本地运行DeepSeek-R1、V3的671B满血版,预处理和推理速度提升。
清华大学KVCache.AI团队联合趋境科技发布KTransformers开源项目,支持24G显存在本地运行DeepSeek-R1、V3的671B满血版,预处理和推理速度提升。
UC伯克利团队通过RL微调改进Deepseek-R1-Distilled-Qwen-1.5B,使其在AIME基准上Pass@1准确率高达43.1%,参数量仅为1.5B且超越OpenAI o1-preview。
Microsoft开源数据Formulator工具,通过AI简化数据分析和可视化过程,支持本地运行与GitHub部署,提供数据挑战激发创意。
AxBench:斯坦福NLP团队开发的Python库用于评估大型语言模型可解释性方法,提供多种方法支持LLM-in-the-loop训练。