大模型归档 - 第107页共147页

R1-GRPO强化范式用在KG抽取的粗暴实现：兼看RAG、推理加速等相关进展

2025年2月11日14时作者老刘说NLP

今日文章介绍了R1和知识图谱结合的粗暴实现以及强化学习在知识图谱信息抽取中的进展。具体包括开源复现DeepSeek R1的文本到图谱抽取训练方案，并回顾了昨日技术社区的进展，涉及RAG webui、推理框架KTransformers等。

2025年2月11日14时作者 AI技术研习社

据的主导地位。
最令人兴奋的是，这些革命性的模型完全免费使用，没有任何限制，任何人都可以随时访问并利

2025年2月11日14时作者 AI信息Gap

laude.ai 上的大量真实用户对话，首次量化展现了 AI
在现实世界中的应用情况
及其
对劳动力

2025年2月11日14时作者 AI信息Gap

今天继续分享如何本地部署DeepSeek-R1，仅需3步：安装Ollama、下载指定参数量的模型（如1.5B）、将模型集成到Chatbox中使用。过程简单易懂，适合小白学习。

2025年2月11日14时作者 AI信息Gap

埃隆·马斯克提议以974亿美元收购OpenAI，引发与创始人萨姆·奥特曼之间的冲突和争议。

2025年2月11日12时作者路过银河AI

在AI绘画的世界里，DEMON CORE与Colossus Project XL的完美融合带来了更强的艺术创作潜力。这款模型不仅继承了DEMON CORE的细节表现力，还提高了稳定性，并且能够理解并执行复杂的艺术指令。

2025年2月10日16时作者 PaperWeekly

哈工大深圳、鹏城实验室和昆士兰大学合作提出了一种极性感知线性自注意力机制（Polarity-aware Linear Attention），解决了现有方法在保证注意力分数正值性时会忽视掉 Q,K 矩阵中的负值元素的问题，并在多个视觉任务上取得了精度与效率的平衡。

2025年2月10日16时作者 PaperWeekly

ICML投稿创纪录，咕泡科技提供一站式论文辅导服务。随着学术竞争加剧，高质量论文成为保研、申博和就业的重要凭证。咕泡科技汇聚顶尖导师资源，覆盖AI全方向和交叉学科，从选题到发表全程指导，助力学员克服挑战，提升论文质量与发表成功率。

2025年2月10日19时2025年2月10日16时作者 PaperWeekly

k：技术原理与未来方向“的线上研讨会。清华大学长聘副教授、面壁智能首席科学家刘知远老师作为主讲嘉宾之

2025年2月10日14时作者老刘说NLP

文章介绍了增强大模型推理能力的四种范式，并探讨了使用蒸馏微调方式进行数据集和工具的选择。强调了监督微调（SFT）加上强化学习（RL）的重要性，同时提到了不同蒸馏方法及其应用。