推理引擎归档 - 每时AI

小红书上周发布的大模型 dots.llm1 已经被 llama.cpp 支持

2025年6月17日8时作者 NLP工程化

小红书大模型 dots.llm1 已经被 llama.cpp 支持，本地用户可以使用 llama.cpp 作为推理引擎生成小红书风格内容。

技术总结：25个大模型推理引擎对比及多模态推理大模型实现梳理

2025年5月12日14时作者老刘说NLP

2025年5月12日，北京晴天。文章介绍了两篇技术总结，一是对25个大模型推理引擎的对比分析；二是多模态领域的推理进展总结，涵盖评测数据、实现路径及未来发展设想等内容。

15分钟零代码完成Deepseek全参版本的集群服务部署，开源工具OpenStation实践教程

2025年4月8日23时作者开源AI项目落地

款快速集群化部署各种大模型的轻量级平台工具，具备零代码、易管理、高性能，易扩展的优势特点，15分钟即

Kimi开源底层推理框架，1小时GitHub揽星1.2k

2024年11月28日20时作者量子位

月之暗面Kimi联合清华大学等机构开源大模型推理架构Mooncake，采用分阶段方式逐步实现高性能KVCache多级缓存的开源。该架构提升了Kimi用户体验，降低了成本，并为处理长文本和高并发需求提供了解决方案。