FlashInfer集成TensorRT-LLM cubin kernel技术分析 2025年7月19日14时 作者 GiantPandaCV LLM的优化kernel无缝集成到自己的生态系统中,而不用把超大的TensorRT-LLM源码放进来
在浏览器里跑 linux 虚拟机 2025年6月24日8时 作者 NLP工程化 WebVM在浏览器中运行Linux虚拟机,支持Linux ABI,默认为原生Debian,核心runtime采用x86到WASM的JIT编译器。