跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

NLP工程化

PIKE-RAG:微软推出的专注于提取和应用专业领域知识,以及构建连贯推理逻辑的增强生成系统

2025年2月18日8时 作者 NLP工程化

微软推出的PIKE-RAG旨在提高大型语言模型在复杂工业应用中的性能,其亮点包括在HotpotQA上的高准确率、多领域知识支持及灵活的模块化设计。

分类 开源 标签 ArXiv、 HotpotQA、 PIKE-RAG、 微软、 模块化设计、 跨领域知识处理 发表评论

分享一款国内团队开源的 AI 训练跟踪与可视化平台:SwanLab

2025年2月18日8时 作者 NLP工程化

SwanLab 是一款开源 AI 模型训练跟踪与可视化工具,帮助研究者优化训练过程并提升团队协作效率。

分类 开源 标签 30多个主流框架、 PythonAPI、 SwanHubX/SwanLab、 UI界面、 多人协作、 训练可视化 发表评论

电子书《深度学习:基础与概念》

2025年2月18日8时 作者 NLP工程化

《深度学习:基础与概念》是一本Springer Nature畅销书,全面介绍深度学习的核心思想,涵盖当代架构和技术关键概念。本书适合本科生和研究生阅读,强调实际应用价值而非抽象理论,并包含一个概率论入门部分。

分类 开源 标签 2、 Chris Bishop、 Springer Nature's、 新手指南、 深度学习、 经受考验 发表评论

深度强化学习的现状与挑战

2025年2月17日8时 作者 NLP工程化

深度强化学习在样本效率、奖励设计和稳定性等方面存在问题,未来可能通过更好的模型基础学习、迁移学习等方向解决。

分类 开源 标签 Alex Irpan、 个人博客文章、 奖励函数设计、 样本效率、 深度强化学习、 稳定性 发表评论

LLM Debugger:展示了大型语言模型在程序调试中的应用

2025年2月17日8时 作者 NLP工程化

LLM Debugger 是一个 VSCode 扩展项目,利用大型语言模型进行程序调试,提供更快、更准确的调试方式。它通过自动设置断点、监控运行时事件和执行 LLM 指导的调试操作简化了调试流程。

分类 开源 标签 GitHub项目、 LLM Debugger、 vscode扩展、 试验性、 调试方式、 运行时变量 发表评论

一个将 PDF 文档转为 AI 播客的开源项目:PDF to Podcast

2025年2月17日8时 作者 NLP工程化

GitHub 上的开源项目 PDF to Podcast 转换 PDF 为 AI 播客,使用 Llama 3.1 模型和 ElevenLabs 的文本转语音技术。可通过 Docker 快速部署。

分类 开源 标签 Docker部署、 Llama 3.1 模型、 开源项目、 文本转语音的 ElevenLabs、 来自英伟达团队、 生动的两人对话式 AI 播客 发表评论

结合Deepseek V3 api +Obsidian 无缝构建个人知识库

2025年2月17日8时 作者 NLP工程化

本教程介绍如何使用 DeepSeek V3 模型 + Obsidian 建立个人知识库,通过 AI 实现笔记问答和信息整理。

分类 开源 标签 DeepSeek V3 模型、 Obsidian、 信息整理、 智能问答、 知识管理、 硅基流动(SiliconFlow) 发表评论

从零开始的GRPO实现

2025年2月17日8时 作者 NLP工程化

从零开始实现GRPO机制的文章参考了aburkov的LMbook并提供了支持资源链接。

分类 开源 标签 aburkov、 GRPO.py、 GRPO机制、 http://github.com/aburkov/theLMbook、 Python、 可靠性和效率 发表评论

DeepLearning AI 吴恩达这门课程《Transformer 大语言模型的工作原理》

2025年2月17日8时 作者 NLP工程化

这门课程用新手能理解的话术讲解大模型关键概念和信息,适合新手入门。

分类 开源 标签 Transformer模型、 互联网资源、 信息、 外部资源、 新手入门、 讲师未提及姓名 发表评论

COMPSCI 687: 强化学习讲义(2022秋季学期)

2025年2月16日8时 作者 NLP工程化

COMPSCI 687强化学习讲义由马萨诸塞大学阿默斯特分校教授编写,介绍RL基础知识和概念

分类 开源 标签 Bruno C. da Silva、 关键概念、 基础知识、 强化学习、 计算机科学系、 马萨诸塞大学阿默斯特分校 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面66 页面67 页面68 … 页面92 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 12 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
293031  
« 9 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×