大模型归档 - 第109页共147页

KG+LLM+RAG+文档智能技术及落地：老刘说NLP技术社区对外纳新

2025年2月8日14时作者老刘说NLP

老刘说NLP技术社区自建立以来围绕大模型、知识图谱、RAG和文档智能等主题发布每日早报、线上交流活动分享、专题报告等内容，欢迎加入。

通俗易懂地说说DeepSeek的原理

2025年2月8日14时作者 AI大模型实验室

DeepSeek 是一款在 AI 领域表现卓越的语言模型，它不仅性能超越 OpenAI 的 ChatGPT，在 App Store 下载排行榜中位居第一。其训练过程包括预训练和后训练两阶段，通过预测互联网文本数据中的下一个 Token 来学习语言规律，并采用指令微调和基于人类反馈的强化学习进行后训练优化。

DeepSeek赛博算命版已上线，速来领取提示词！

2025年2月8日14时作者 AI信息Gap

通过盲派八字算命法分析，该用户出生于1995年6月1日13时。命盘显示其八字命盘偏弱，需金水相助。运势预测为身弱杀旺，中年后需借助智慧化解压力；财运方面建议积累技能和抓住贵人资源。学业与婚姻关键节点明确，未来生活总体富足但需注意健康问题。总体评价指出优势与不足，并解释了命理逻辑及模型。

AI替身：一个工作流，两个DeepSeek

2025年2月8日12时作者路过银河AI

同事推荐DeepSeek后节约她两天工作量，Qwen分享如何利用DeepSeek和Kimi替代传统工作方法，并设计了一整套工作流以实现反推提示词及自动输出图片到自媒体平台的功能。

图像生成迎来CoT时刻！港中文首次提出文生图的o1推理和inference scaling新范式

2025年2月7日16时作者 PaperWeekly

理能力的强大提升，各种基于强化学习 RL 和提升 test-time 推理成本的方案
已经在大模型理

多模态，杀疯了！

2025年2月7日16时作者 PaperWeekly

多模态大模型是实现AGI的必经之路。通过模拟人类的多模态感知能力，多模态大语言模型（MLLM）引领变革，并成功展示了实时交互的VITA-1.5模型。

推理类大模型的习得过程、认知误区、场景机会及技术风险

2025年2月7日14时作者老刘说NLP

今天是2025年02月07日，星期五。老刘说NLP技术社区第27讲线上交流围绕Deepseek R1类推理大模型的习得过程、认知误区展开讨论，分享场景机会及技术风险。

颠覆职场效率！DeepSeek：你的AI全能助手，3步解决90%工作难题

2025年2月7日14时作者 AI技术研习社

在2025年，AI助手普及率已达70%，DeepSeek作为职场得力助手快速走红。文章指出当前职场存在信息过载、任务繁杂等问题，DeepSeek通过零门槛设计和结构化内容生成矩阵等特性解决了这些问题，助力用户提升工作效率并从繁琐工作中解脱出来。

GitHub Copilot开始绝地反击

2025年2月7日14时作者 AI大模型实验室

GitHub Copilot 通过大规模升级引入代理模式（Agent），增强其代码生成能力及自动完成任务的功能，与竞争对手 Cursor 竞争优势。新增功能包括 VS Code 中的 Agent 模式、多模型选择工具 GitHub Copilot Edits 和 Project Padawan 等。

李飞飞团队50美元训练出DeepSeek R1?

2025年2月7日14时作者 AI大模型实验室

文章介绍了通过16块H100 GPU在26分钟内训练出低成本语言模型S1K的方法，该模型与OpenAI的o1系列和DeepSeek R1系列性能相当。但实际研究发现，论文核心是基于开源Qwen2.5-32B模型，进行小数据集监督微调，并非直接复制了DeepSeek R1。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31