跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

NLP工程化

本地运行量化版本的大模型

2025年1月22日23时 作者 NLP工程化

本篇内容教大家如何本地运行 GGUF 格式的 LLM 模型,以最新 DeepSeek-R1-Distill-Qwen-32B-GGUF 模型为例。

分类 开源 标签 DeepSeek-R1-Distill-Qwen-32B、 GGUF格式、 GitHub、 karminski、 LLM模型、 本地运行 2 条评论

unsloth团队已经放出量化版本的DeepSeek-R1-Distill了

2025年1月22日8时 作者 NLP工程化

unsloth团队发布量化版本的DeepSeek-R1-Distill,Qwen-32B-Q4_K_M版压缩至20GB,在单卡上运行。欢迎支持知识星球获取更多资源。

分类 开源 标签 20GB、 Hugging Face、 Qwen-32B-Q4_K_M、 unsloth、 消费级单卡、 量化版本的DeepSeek-R1-Distill 发表评论

VITA-1.5: 迈向GPT-4o级实时视频-语音交互

2025年1月22日8时 作者 NLP工程化

VITA-1.5 提升视频-语音交互速度,端到端语音交互时延从约4秒降低至1.5秒。

分类 开源 标签 1.5秒、 VITA-ML、 显著降低、 机器学习模型、 自然语言处理、 语音交互 发表评论

阿里通义等提出Chronos:慢思考RAG技术助力新闻时间线总结

2025年1月22日8时 作者 NLP工程化

论文:https://arxiv.org/abs/2501.00888
Github: https:

分类 开源 标签 CHRONOS、 封闭域数据集、 开放域TLS实验、 时间线摘要、 检索增强生成、 迭代自我提问 发表评论

PyTorch Forecasting:基于PyTorch的时间序列预测工具

2025年1月22日8时 作者 NLP工程化

PyTorch Forecasting:一个基于PyTorch的时间序列预测工具,支持用户实现高精度预测,适用于专业人士和初学者。

分类 开源 标签 Forecasting、 PyTorch、 专业人士、 快速上手、 时间序列预测、 高精度 2 条评论

AI Engineering Academy 是一个专注于实用人工智能应用的学习平台

2025年1月21日8时 作者 NLP工程化

AI Engineering Academy is a learning platform focusing on practical AI applications, offering structured learning paths from basics to advanced levels, practice projects, and community support.

分类 开源 标签 AI Engineering Academy、 GitHub、 NLP、 文本分类、 深度学习、 知识星球 1 条评论

斯坦福大学的并行计算课程

2025年1月21日8时 作者 NLP工程化

斯坦福大学CS149课程《并行计算》介绍,由Kayvon Fatahalian和Kunle Olukotun授课,旨在让学生理解并行计算系统设计原理、掌握编程技巧。

分类 开源 标签 CS149、 GPU架构、 分布数据、 多核处理器、 并行计算、 斯坦福大学 发表评论

yek:用于读取仓库或目录中的文本文件,将其分块,并序列化以供大语言模型(LLM)使用

2025年1月21日8时 作者 NLP工程化

一个快速工具用于读取仓库或目录文本文件并分块序列化供大语言模型使用,参考GitHub项目yek。

分类 开源 标签 bodo-run、 GitHub API、 Python、 yek工具、 大语言模型、 文本文件处理 发表评论

WebWalker:大语言模型在网页遍历中的基准测试

2025年1月21日8时 作者 NLP工程化

WebWalkerQA评估大型语言模型执行网页导航能力的基准,结合WebWalker的RAG在实际场景中有效集成横向搜索和纵向页面挖掘。

分类 开源 标签 Alibaba Cloud、 Hu、 liu、 Shi、 Wang、 Zhang 发表评论

实现 LLM 记忆系统的五种方式

2025年1月20日23时 作者 NLP工程化

五种实现LLM记忆系统的方案:向量记忆、摘要记忆、时间窗记忆、关键词记忆和层级记忆,每种方式都有其独特优势。

分类 开源 标签 关键词记忆、 向量记忆、 大语言模型、 层级记忆、 摘要记忆、 时间窗记忆 2 条评论
较早文章
较新文章
← 上一页 页面1 … 页面78 页面79 页面80 … 页面92 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 12 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
293031  
« 9 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×