跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

推理引擎

小红书上周发布的大模型 dots.llm1 已经被 llama.cpp 支持

2025年6月17日8时 作者 NLP工程化

小红书大模型 dots.llm1 已经被 llama.cpp 支持,本地用户可以使用 llama.cpp 作为推理引擎生成小红书风格内容。

分类 开源 标签 dots.llm1、 llama.cpp、 NLP、 参考文献3、 小红书、 推理引擎 发表评论

技术总结:25个大模型推理引擎对比及多模态推理大模型实现梳理

2025年5月12日14时 作者 老刘说NLP

2025年5月12日,北京晴天。文章介绍了两篇技术总结,一是对25个大模型推理引擎的对比分析;二是多模态领域的推理进展总结,涵盖评测数据、实现路径及未来发展设想等内容。

分类 大模型 标签 25、 优化方案、 大模型、 工程设计、 推理引擎、 老刘 发表评论

15分钟零代码完成Deepseek全参版本的集群服务部署,开源工具OpenStation实践教程

2025年4月8日23时 作者 开源AI项目落地

款快速集群化部署各种大模型的轻量级平台工具,具备零代码、易管理、高性能,易扩展的优势特点,15分钟即

分类 开源 标签 DeepSeek-R1、 OpenStation、 分布式部署、 多节点配置、 推理引擎、 模型服务 发表评论

RAG+DeepSeek R1的正确打开方式~

2025年3月9日14时 作者 PaperAgent

本文分享了如何使用DeepSeek R1构建法律文件的RAG系统,并指出不应直接使用其进行检索,而应侧重于利用其生成能力来解决问题。

分类 分享 标签 DeepSeek R1、 Qwen2、 RAG、 嵌入模型、 推理引擎、 阿里巴巴 发表评论

Kimi开源底层推理框架,1小时GitHub揽星1.2k

2024年11月28日20时 作者 量子位

月之暗面Kimi联合清华大学等机构开源大模型推理架构Mooncake,采用分阶段方式逐步实现高性能KVCache多级缓存的开源。该架构提升了Kimi用户体验,降低了成本,并为处理长文本和高并发需求提供了解决方案。

分类 资讯 标签 kimi、 Mooncake、 大模型、 推理引擎、 清华大学、 高性能KVCache 发表评论

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×