开源归档 - 第143页共201页

DeepSeekRL-Extended：从零实现DeepSeek R1的强化学习项目

2025年2月18日8时作者 NLP工程化

从零实现DeepSeek R1的强化学习项目，探索GRPO算法的应用，仅用单个H100 GPU400步训练提升模型性能，完全自研且提供多脚本结构。

2025年2月18日8时作者 NLP工程化

微软推出的PIKE-RAG旨在提高大型语言模型在复杂工业应用中的性能，其亮点包括在HotpotQA上的高准确率、多领域知识支持及灵活的模块化设计。

2025年2月18日8时作者 NLP工程化

SwanLab 是一款开源 AI 模型训练跟踪与可视化工具，帮助研究者优化训练过程并提升团队协作效率。

2025年2月18日8时作者 NLP工程化

《深度学习：基础与概念》是一本Springer Nature畅销书，全面介绍深度学习的核心思想，涵盖当代架构和技术关键概念。本书适合本科生和研究生阅读，强调实际应用价值而非抽象理论，并包含一个概率论入门部分。

2025年2月18日8时作者开源星探

微软发布OmniParser V2版本，能将屏幕截图转化为LLM可读懂的结构化元素，提高多模态大模型的视觉识别准确度。适用于自动化测试、操作等场景任务。通过像素级屏幕理解能力，支持多种大型语言模型。

2025年2月17日23时作者开源AI项目落地

DeepSeek与美间AI创意商拍合作，提升电商设计效率。借助智能灵感和素材生成功能，设计师能迅速完成从构思到成品的流程，节省大量时间。

2025年2月17日14时作者小兵的AI视界

VisionAgent开源项目通过智能代理框架和先进大语言模型简化了计算机视觉任务处理。用户只需用自然语言描述需求，就能轻松实现各类视觉任务，大幅降低技术门槛，适用于安防监控、工业检测及医疗影像分析等领域。

2025年2月17日8时作者 NLP工程化

深度强化学习在样本效率、奖励设计和稳定性等方面存在问题，未来可能通过更好的模型基础学习、迁移学习等方向解决。

2025年2月17日8时作者 NLP工程化

LLM Debugger 是一个 VSCode 扩展项目，利用大型语言模型进行程序调试，提供更快、更准确的调试方式。它通过自动设置断点、监控运行时事件和执行 LLM 指导的调试操作简化了调试流程。

2025年2月17日8时作者 NLP工程化

GitHub 上的开源项目 PDF to Podcast 转换 PDF 为 AI 播客，使用 Llama 3.1 模型和 ElevenLabs 的文本转语音技术。可通过 Docker 快速部署。