跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

推理引擎

小红书上周发布的大模型 dots.llm1 已经被 llama.cpp 支持

2025年6月17日8时 作者 NLP工程化

小红书大模型 dots.llm1 已经被 llama.cpp 支持,本地用户可以使用 llama.cpp 作为推理引擎生成小红书风格内容。

分类 开源 标签 dots.llm1、 llama.cpp、 NLP、 参考文献3、 小红书、 推理引擎 发表评论

技术总结:25个大模型推理引擎对比及多模态推理大模型实现梳理

2025年5月12日14时 作者 老刘说NLP

2025年5月12日,北京晴天。文章介绍了两篇技术总结,一是对25个大模型推理引擎的对比分析;二是多模态领域的推理进展总结,涵盖评测数据、实现路径及未来发展设想等内容。

分类 大模型 标签 25、 优化方案、 大模型、 工程设计、 推理引擎、 老刘 发表评论

15分钟零代码完成Deepseek全参版本的集群服务部署,开源工具OpenStation实践教程

2025年4月8日23时 作者 开源AI项目落地

款快速集群化部署各种大模型的轻量级平台工具,具备零代码、易管理、高性能,易扩展的优势特点,15分钟即

分类 开源 标签 DeepSeek-R1、 OpenStation、 分布式部署、 多节点配置、 推理引擎、 模型服务 发表评论

RAG+DeepSeek R1的正确打开方式~

2025年3月9日14时 作者 PaperAgent

本文分享了如何使用DeepSeek R1构建法律文件的RAG系统,并指出不应直接使用其进行检索,而应侧重于利用其生成能力来解决问题。

分类 分享 标签 DeepSeek R1、 Qwen2、 RAG、 嵌入模型、 推理引擎、 阿里巴巴 发表评论

Kimi开源底层推理框架,1小时GitHub揽星1.2k

2024年11月28日20时 作者 量子位

月之暗面Kimi联合清华大学等机构开源大模型推理架构Mooncake,采用分阶段方式逐步实现高性能KVCache多级缓存的开源。该架构提升了Kimi用户体验,降低了成本,并为处理长文本和高并发需求提供了解决方案。

分类 资讯 标签 kimi、 Mooncake、 大模型、 推理引擎、 清华大学、 高性能KVCache 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 模型即 Agent 的含金量:Kimi深度研究功能详评
  • 对标Cursor!百度也下场做AI IDE,AI编程赛道太火爆!
  • RAG的2025趋势重点及RAG+抽取场景的来源定位问题思考
  • 马斯克的下一个万亿赛道?瑞银详解Robotaxi商业模式
  • InftyThink:浙大联合北大打造的无限深度推理范式,突破大模型长推理瓶颈

2025 年 6 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« 5 月    

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×