llama.cpp 归档 - 每时AI

小红书上周发布的大模型 dots.llm1 已经被 llama.cpp 支持

2025年6月17日8时作者 NLP工程化

小红书大模型 dots.llm1 已经被 llama.cpp 支持，本地用户可以使用 llama.cpp 作为推理引擎生成小红书风格内容。

llama.cpp 支持音频输入

2025年5月25日8时作者 NLP工程化

llama.cpp 支持音频输入，并展示了通过接口上传录音并由模型总结的功能。

爆！三大热门大型模型服务方案实测：VLLM、LLaMA.cpp、SGLang 谁才是你的最强生产力引擎？

2025年5月19日14时作者 AI技术研习社

文章介绍了三种当前流行的大型语言模型（LLM）和服务方案：VLLM、LLaMA.cpp HTTP Server 和 SGLang。VLLM 以其高性能和快速响应著称；LLaMA.cpp 是一个轻量级的本地部署选项，适合没有高端 GPU 的用户；SGLang 则是一个智能框架，支持多步骤推理和函数调用，适合需要自定义 DSL 的场景。文章详细比较了每种方案的特点、优点及适用场景，并提醒了各自可能遇到的问题。