跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

NLP工程化

使用 LoRA 和QLoRA 微调大模型的教程

2025年6月17日8时 作者 NLP工程化

一个适合新手的教程指南,通过直接提问和使用联网功能获得帮助。

分类 开源 标签 LLM、 LORA、 QLORA、 教程操作、 新手学习、 理解技术 发表评论

Keller Jordan的一篇博文,介绍了自己写的一种名为Muon的优化器

2025年6月17日8时 作者 NLP工程化

Keller Jordan介绍其优化器Muon,用于神经网络隐藏层参数优化,在NanoGPT和CIFAR-10应用中显著提高训练速度,并与原文献链接。

分类 开源 标签 CIFAR-10、 Keller Jordan、 Muon、 NanoGPT、 神经网络、 隐藏层参数 发表评论

小红书上周发布的大模型 dots.llm1 已经被 llama.cpp 支持

2025年6月17日8时 作者 NLP工程化

小红书大模型 dots.llm1 已经被 llama.cpp 支持,本地用户可以使用 llama.cpp 作为推理引擎生成小红书风格内容。

分类 开源 标签 dots.llm1、 llama.cpp、 NLP、 参考文献3、 小红书、 推理引擎 发表评论

新的OCR模型 MonkeyOCR-3B

2025年6月17日8时 作者 NLP工程化

新发布的MonkeyOCR-3B OCR模型性能强劲,文档识别需求者可免费试用,大小仅3B。

分类 开源 标签 3B大小、 Echo840、 HuggingFace、 OCR模型、 比MinerU高、 知识星球 发表评论

nx-cugraph:为NetworkX提供零代码更改的GPU加速后端

2025年6月16日8时 作者 NLP工程化

nx-cugraph为NetworkX提供GPU加速后端,支持7.0+架构,兼容Python3.10以上,涵盖多种图算法

分类 开源 标签 CUDA、 GPU加速、 nx-cugraph、 Python、 Rapids.ai、 提升运行效率 发表评论

just-prompt:为多语言模型提供统一接口的轻量级MCP服务器

2025年6月16日8时 作者 NLP工程化

一个轻量级MCP服务器,支持OpenAI、Anthropic、Google Gemini等六大主流LLM提供商,提供多种交互方式并自动纠正模型名称。

分类 开源 标签 Anthropic、 Disler、 MCP服务器、 OpenAI、 六、 六大主流LLM提供商 发表评论

TableRAG:为复杂表格问答任务提供高效解决方案

2025年6月16日8时 作者 NLP工程化

TableRAG解决复杂表格问答任务,支持多表查询、精准筛选数据,并集成ColBERT提升检索精度。

分类 开源 标签 ColBERT模型、 TableRAG系统、 吴宇杭、 复杂表格问答、 精准数据筛选、 跨表查询 发表评论

Chrome MCP Server:将你的Chrome浏览器变成智能助手

2025年6月16日8时 作者 NLP工程化

Chrome MCP Server使浏览器智能化,无需重新登录,支持20+工具,确保用户隐私。

分类 开源 标签 20多种、 Chrome浏览器自动化工具、 Hang Win、 MCP服务器、 无需重新登录、 隐私安全 发表评论

FileBrowser Quantum:知名文件管理器 FileBrowser

2025年6月15日8时 作者 NLP工程化

知名文件管理器 FileBrowser Quantum 改进功能介绍:实时搜索、多文件源支持、Office 文件预览等实用功能,兼容 Windows、macOS 和 Linux 系统。

分类 开源 标签 FileBrowser Quantum、 GitHub、 Office 文件预览、 多文件源、 实时搜索、 实用功能 发表评论

探讨如何构建可靠AI Agent

2025年6月15日8时 作者 NLP工程化

探讨如何构建可靠AI Agent,提出‘上下文工程’概念,并强调其在开发中的重要性;分析多Agent架构的脆弱性,指出单线程线性Agent的优势;提供实用设计原则帮助开发者避免常见陷阱。

分类 开源 标签 AI Agent、 上下文工程、 单线程线性Agent、 多Agent架构、 开发陷阱 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面19 页面20 页面21 … 页面92 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 12 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
293031  
« 9 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×