R1-Computer-Use:将Deepseek R1的强化学习技术应用于计算机使用场景
R1-Computer-Use利用Deepseek R1的强化学习技术优化计算机使用场景中的AI行为,支持文件操作、命令行交互等多种任务。
R1-Computer-Use利用Deepseek R1的强化学习技术优化计算机使用场景中的AI行为,支持文件操作、命令行交互等多种任务。
ScrapeServ:一个自托管的API,能通过输入网址获取网页数据及浏览器截图,支持滚动页面并截取不同区域。它运行在Docker容器中,部署简单,并自动处理302重定向以保证内容完整性。
论文介绍了DeepSeek-R1-Zero和DeepSeek-R1两种推理模型,前者通过大规模强化学习训练,在没有监督微调下展现卓越推理能力,后者结合多阶段训练和冷启动数据优化其性能。
Logic-RL成功复现DeepSeek R1 Zero项目,支持多语言逻辑推理,准确率高达100%,平均模型输出长度降低30%。
GitHub 上发布了一款开源工具Pintree,能够将浏览器书签以直观方式展示,并方便查找和使用。操作简单:通过插件导出书签、转换成JSON格式、利用GitHub Pages生成静态导航网站。
NextChat是一款支持多种AI模型的轻量级助手,兼容网页、桌面和手机端,并提供Markdown支持、自定义能力及提示词模板等功能。