NLP工程化
llmware 项目是一个开源框架,旨在帮助企业构建基于 LLM 的应用程序
llmware 是一个开源框架,集成多种优化后的企业级模型,用于构建基于LLM的应用程序(如RAG和Agent),支持私有部署。
中国科学技术大学和通义实验室出的一款可以在消费级设备上实时动画生成的系统:RAIN
中国科学技术大学和通义实验室联合开发的RAIN系统可以在消费级设备上实时生成动画,支持表情及头部动作转换,视频流畅稳定。
在浏览器里运行DeepSeek-R1
在浏览器中运行DeepSeek-R1项目,使用Transformers.js和ONNX Runtime Web技术,演示1.5B参数量的DeepSeek-R1-Distill-Qwen模型。
豆包模型上新:Doubao-1.5-pro
Doubao-1.5-pro 模型针对MoE模型的四个计算象限提出异构硬件结合低精度优化策略,提升吞吐量和降低总成本。通过定制化的RPC后端、灵活配比的Prefill和Decode集群以及GPU与CPU的异步化处理,实现高效稳定的推理系统。
LM Studio自带CUDA llama.cpp (Windows) 支持DeepSeek R1
LM Studio支持CUDA llama.cpp (Windows)与DeepSeek R1的结合,欢迎关注知识星球获取更多资源。
phidata 是一个开源框架,用于构建具有记忆、知识、工具和推理能力的多模态智能体(Agents)
phidata 是一个开源框架,用于构建多模态智能体,并提供美观的用户界面进行交流,参考更多文档及资源。