NLP工程化
电子书《统计计算》,北京大学统计科学中心李东风老师的作品
统计学是一门研究数据搜集、整理和分析的学科,并涉及编程实现相关算法。本书涵盖传统统计计算概念与算法,如误差分析、矩阵计算等,以及现代计算机技术在统计推断中的应用方法,如自助法、MCMC方法等。
R1-V项目:将DeepSeek R1的训练方法用在视觉语言模型上
R1-V项目展示了DeepSeek RRP在视觉语言模型上的效果,仅需30分钟和不到3美元的训练成本,在100个步骤内超越了72B模型的OOD测试表现。
Deep Research的开源实现版:node-DeepResearch
Jina AI发布Node.js版DeepResearch实现,使用Gemini、Brave和Jina Reader进行搜索、阅读和推理。
NVIDIA将全量版DeepSeek-R1打包成NIM微服务
NVIDIA将DeepSeek-R1打包成NIM微服务,在配备8张H200 GPU的服务器上实现每秒近4000个Token处理速度,支持在本地部署以保障数据安全。
本地部署 DeepSeek-R1 支持 ToolCall 了
DeepSeek-R1 支持 ToolCall 功能完成本地部署,支持多个Agent和ToolCall的工作流,建议使用 OpenWebUI+llama.cpp 运行。相关 PR 已合并。
IntelllAgent 是一款基于多智能体协作的对话智能体评估与优化框架
IntelllAgent 是一款基于多智能体协作的对话智能体评估与优化框架,通过模拟多种交互场景对智能体进行压力测试,以提升其性能、可靠性和用户体验。