R1-GRPO强化范式用在KG抽取的粗暴实现:兼看RAG、推理加速等相关进展

今日文章介绍了R1和知识图谱结合的粗暴实现以及强化学习在知识图谱信息抽取中的进展。具体包括开源复现DeepSeek R1的文本到图谱抽取训练方案,并回顾了昨日技术社区的进展,涉及RAG webui、推理框架KTransformers等。

ICLR 2025 性能与效率的更优平衡!哈工深等提出极性感知线性自注意力机制

哈工大深圳、鹏城实验室和昆士兰大学合作提出了一种极性感知线性自注意力机制(Polarity-aware Linear Attention),解决了现有方法在保证注意力分数正值性时会忽视掉 Q,K 矩阵中的负值元素的问题,并在多个视觉任务上取得了精度与效率的平衡。

ICML 2025杀疯了!

ICML投稿创纪录,咕泡科技提供一站式论文辅导服务。随着学术竞争加剧,高质量论文成为保研、申博和就业的重要凭证。咕泡科技汇聚顶尖导师资源,覆盖AI全方向和交叉学科,从选题到发表全程指导,助力学员克服挑战,提升论文质量与发表成功率。

再看增强大模型推理能力的四种范式及蒸馏微调范式具体实现

文章介绍了增强大模型推理能力的四种范式,并探讨了使用蒸馏微调方式进行数据集和工具的选择。强调了监督微调(SFT)加上强化学习(RL)的重要性,同时提到了不同蒸馏方法及其应用。