日期: 2025 年 6 月 22 日
跟进前沿+聚焦落地—围绕RAG&KG&LLM&文档解析:老刘说NLP技术社区对外纳新
老刘说NLP技术社区致力于以公正、客观的角度围绕大模型&RAG&文档智能&知识图谱四个方向展开多形式的技术分享,内容涵盖每日早报、线上主题分享及专题课程等。
大模型终于能预测未来了?伊利诺伊黑科技让AI化身“时间预言家”
伊利诺伊大学香槟分校开发的Time-R1模型通过三阶段强化学习训练提升了语言模型的时间推理能力,包括时间戳推断、事件排序和生成合理未来场景等任务。该模型在多个时间推理任务中表现优异,并开源了代码和数据集以促进研究和技术发展。
Agent 前沿速递:生态、协作与上下文的关键演进
AI Agent领域在2025年6月经历显著进展,包括新一代基础设施、融合真实工作流的新技术以及多智能体协作架构的发展。核心焦点是构建可靠的基础设施、丰富的上下文和协作智能生态,而非单一模型能力。这一周的技术突破涵盖了从后端服务到多智能体系统,预示着一个全新的AI时代即将开启。
MiniMax-M1开源,Kimi深度研究内测,GPT-5今夏发布,Gemini稳定上线! AI Weekly 6.16-22
ax-M1
发布,MoE 架构,总参数 4560 亿,支持百万 tokens 上下文,是
DeepS
通俗易懂的总结:对RL for LLM本质的理解
文章总结了强化学习(RL)在大型语言模型(LLM)中的应用,指出传统监督学习的局限性,并阐述了RL作为一种新的扩展方法如何通过弱监督信号和正/负权重机制,解决数据生成性和训练效率问题。