FlashInfer集成TensorRT-LLM cubin kernel技术分析 2025年7月19日14时 作者 GiantPandaCV LLM的优化kernel无缝集成到自己的生态系统中,而不用把超大的TensorRT-LLM源码放进来
AI 取代人类的第一步,就是剥夺我们“慢思考”的能力 2025年4月28日23时 作者 AI科技大本营 大模型已成为推动科技进步与社会变革的核心力量。回顾 AI 大模型的发展史,不难发现,AI 正逐渐从
MoE之年的总结和MoE 推理优化的一些认识 2025年2月4日19时 作者 GiantPandaCV 0x0. 前言 祝大家新年快乐! 希望大家天天开心,学业有成,工作顺利。 我是在2025农历新年的大