GiantPandaCV，作者每时AI

一键式训练端到端Agent，Qwen3+MCP工具集高效集成！

2025年5月27日14时作者 GiantPandaCV

本文介绍了一种名为RLFactory的开源框架，旨在通过简单且高效的端到端训练方法解决现有深度学习框架在奖励设计和工具配置上的复杂问题。

2025年5月26日14时作者 GiantPandaCV

表到本公众号。原始地址为：https://veitner.bearblog.dev/load-and

2025年5月24日14时作者 GiantPandaCV

表到本公众号。原始地址为：https://veitner.bearblog.dev/a-short-

2025年5月24日14时作者 GiantPandaCV

778199261291694
编辑丨GiantPandaLLM
0x00 前言
后续会陆续更新一些

2025年5月23日19时作者 GiantPandaCV

表到本公众号。原始地址为：https://veitner.bearblog.dev/tma-intr

2025年5月21日14时作者 GiantPandaCV

082781461207006
编辑丨GiantPandaLLM
写在前面
基于上述的两篇文章，我们

2025年5月19日14时作者 GiantPandaCV

5771025
编辑丨GiantPandaLLM
前言
书接上回，Bruce 仗剑走天涯：sglan

2025年5月16日14时作者 GiantPandaCV

本文讨论了通过分析GPU Assembly来优化CUDA程序性能的方法，特别是向量化版本可以减少指令数量并提高效率。

2025年5月15日19时作者 GiantPandaCV

optim-algorithm-in-cuda/blob/master/large-language

2025年5月14日19时作者 GiantPandaCV

41
前言
笔者一直想找个开源的推理引擎框架学习一下源代码，机缘巧合认识了 sglang 社区的朋友