12.8K标星见证跨平台翻译自由!开源神器Pot引爆GitHub:截图OCR+多引擎对比
推荐跨平台划词翻译和OCR软件Pot,支持Windows/macOS/Linux系统,包含多项核心功能如划词翻译、截图OCR等,并可集成多种翻译接口。
推荐跨平台划词翻译和OCR软件Pot,支持Windows/macOS/Linux系统,包含多项核心功能如划词翻译、截图OCR等,并可集成多种翻译接口。
一个名为MultiAgentPPT的开源AI PPT生成系统,通过多智能体协作实现从主题输入到完整PPT生成的自动化流程,支持用户自定义幻灯片和内容,适合快速生成专业演示文稿。
基于GLM-4.1V-9B-Thinking模型,引入强化学习技术提升视觉语言模型能力,在18个任务中与8倍参数量的Qwen-2.5-VL-72B相当或超越
LLaMA-Factory Day0发布支持GLM-4.1V-Thinking模型微调和推理的代码更新及视频教程
Osmosis-Structure-0.6B 是一个参数量为 0.6B 的小型语言模型,在结构化输出生成方面表现出色,特别是在数学推理和问题解决任务中。
WaterCrawl 是一款基于 Python 和 Scrapy 的开源网页爬虫工具,专为大规模数据提取和LLM优化设计。支持多语言内容抓取、实时进度监控和深度AI平台集成。
Dify架构通过多个独立模块协作实现高效运行,包括Nginx负责路由、Web提供前端UI、API+Worker处理业务逻辑、PluginDaemon+Sandbox保障插件扩展及计算隔离等。文章详细描述了从请求入口到数据持久化的整个流程,并强调了安全防护和弹性扩展设计。
Nxtscape是一个开源的智能浏览器,提供本地运行AI代理、隐私保护和广告拦截等功能。界面类似Google Chrome且兼容所有扩展程序。