跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

Datawhale

DeepSeek接入个人知识库,保姆级教程来了!

2025年2月26日14时 作者 Datawhale

通过 RagFlow 框架,介绍如何将 DeepSeek 接入个人知识库中。RagFlow 是一款基于深度文档理解的开源检索增强生成引擎,适用于多种场景如智能客服、文档生成等。

分类 分享 标签 15、 Datawhale、 DeepSeek、 RAGFlow、 张龙斐、 智能客服 发表评论

零基础入门:DeepSeek微调教程来了!

2025年2月25日14时 作者 Datawhale

的效果。
微调前:
微调后:
在此处可以看到很明显大模型进行微调后口吻已经发生了更改。据笔者使用下来

分类 分享 标签 交叉熵损失、 因果语言建模、 困惑度分析、 多任务学习、 微调模型、 混淆矩阵 发表评论

刚刚!DeepSeek开源DeepEP,GPU通信加速器,专为MoE设计!

2025年2月25日14时 作者 Datawhale

DeepSeek发布第二款开源软件库DeepEP,专为MoE模型训练与推理设计,提供高效的全对全通信计算核,支持FP8精度运算。

分类 分享 标签 DeepEP、 DeepSeek、 GitHub、 MoE模型、 全对全通信、 高效通信库 发表评论

Perplexity CEO最新访谈:用AI重做搜索,我们学到了什么

2025年2月25日14时 作者 Datawhale

需求,却深深嵌入了我们的日常生活。无论是查资料、买东西,还是了解新闻,搜索引擎早已成为我们获取信息的

分类 分享 标签 AI 搜索、 Aravind Srinivas、 Google、 全球化布局、 垂直领域整合、 用户导向 发表评论

全球首个混合推理模型:Claude 3.7 Sonnet来袭,主打编程能力

2025年2月25日14时 作者 Datawhale

模型的消息开始在 AI 社区广泛发酵,不过并不是期待中的 Claude 4.0,而是 3.7 Son

分类 分享 标签 Anthropic、 Claude、 Claude 3.7 Sonnet、 智能编码工具、 编程任务、 负责任扩展策略 发表评论

最全考研指南!全阶段实用经验,半个月的深度整理!

2025年2月24日14时 作者 Datawhale

此文章,送给每一位想了解考研的同学
零、 前言
本次交流会旨在为同学们提供一些通用性的考研知识。我

分类 分享 标签 MoE架构、 大模型、 天气预报、 结构化数据处理、 自然语言处理、 虚拟助手 发表评论

刚刚!DeepSeek开源FlashMLA,推理加速核心技术

2025年2月24日14时 作者 Datawhale

DeepSeek本周开源了一款用于Hopper GPU的高效MLA解码内核FlashMLA,主要用于减少推理过程中的KV Cache成本。该项目上线45分钟后收获超过400星,并且得到了广泛好评。

分类 分享 标签 3000GB/s、 580TFLOPS、 DeepSeek、 FlashMLA、 HopperGPU、 PyTorch 发表评论

谷歌Fellow级大佬出走!17年老将吴永辉加盟字节,亲自负责大模型研发

2025年2月23日14时 作者 Datawhale

吴永辉博士从谷歌离职加入字节跳动,担任大模型团队Seed基础研究负责人。他在谷歌深耕AI研究多年,曾是Google Fellow级别的高级工程师,并在多个重要项目中贡献核心力量。

分类 分享 标签 吴永辉、 大模型基础研究、 字节跳动、 离职、 科研工作、 谷歌Fellow 发表评论

最全梳理:一文搞懂RAG技术的5种范式!

2025年2月23日14时 作者 Datawhale

第一部分梳理了综述和关键论文,第二部分梳理了工程实践工具。
RAG检索增强生成技术自从出现以来经过了

分类 分享 发表评论

分块的艺术:提升 RAG 效果的关键!

2025年2月22日19时 作者 Datawhale

得最大的成果。
在RAG系统中,这种高效的实现往往是通过“分块”来实现的。你可以把它想象成把一本厚书

分类 分享 标签 上下文关联性、 代理分割器、 准度提升、 分块策略、 响应速度、 大语言模型 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面21 页面22 页面23 … 页面35 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×