KG+LLM+RAG+文档智能技术及落地:老刘说NLP技术社区对外纳新
老刘说NLP技术社区自建立以来围绕大模型、知识图谱、RAG和文档智能等主题发布每日早报、线上交流活动分享、专题报告等内容,欢迎加入。
大语言模型
老刘说NLP技术社区自建立以来围绕大模型、知识图谱、RAG和文档智能等主题发布每日早报、线上交流活动分享、专题报告等内容,欢迎加入。
DeepSeek 是一款在 AI 领域表现卓越的语言模型,它不仅性能超越 OpenAI 的 ChatGPT,在 App Store 下载排行榜中位居第一。其训练过程包括预训练和后训练两阶段,通过预测互联网文本数据中的下一个 Token 来学习语言规律,并采用指令微调和基于人类反馈的强化学习进行后训练优化。
通过盲派八字算命法分析,该用户出生于1995年6月1日13时。命盘显示其八字命盘偏弱,需金水相助。运势预测为身弱杀旺,中年后需借助智慧化解压力;财运方面建议积累技能和抓住贵人资源。学业与婚姻关键节点明确,未来生活总体富足但需注意健康问题。总体评价指出优势与不足,并解释了命理逻辑及模型。
同事推荐DeepSeek后节约她两天工作量,Qwen分享如何利用DeepSeek和Kimi替代传统工作方法,并设计了一整套工作流以实现反推提示词及自动输出图片到自媒体平台的功能。
今天是2025年02月07日,星期五。老刘说NLP技术社区第27讲线上交流围绕Deepseek R1类推理大模型的习得过程、认知误区展开讨论,分享场景机会及技术风险。
在2025年,AI助手普及率已达70%,DeepSeek作为职场得力助手快速走红。文章指出当前职场存在信息过载、任务繁杂等问题,DeepSeek通过零门槛设计和结构化内容生成矩阵等特性解决了这些问题,助力用户提升工作效率并从繁琐工作中解脱出来。
GitHub Copilot 通过大规模升级引入代理模式(Agent),增强其代码生成能力及自动完成任务的功能,与竞争对手 Cursor 竞争优势。新增功能包括 VS Code 中的 Agent 模式、多模型选择工具 GitHub Copilot Edits 和 Project Padawan 等。
文章介绍了通过16块H100 GPU在26分钟内训练出低成本语言模型S1K的方法,该模型与OpenAI的o1系列和DeepSeek R1系列性能相当。但实际研究发现,论文核心是基于开源Qwen2.5-32B模型,进行小数据集监督微调,并非直接复制了DeepSeek R1。