开源归档 - 第45页共201页

AI Screenshot Translator：简单实用的截图翻译工具

2025年6月10日8时作者 NLP工程化

GitHub 上的 AI Screenshot Translator 是一款实用工具，用于翻译图像中的文本，支持 PDF 数学公式和多窗口管理，可通过自定义快捷键一键截图并翻译。

Awesome-Multimodal-LLM-for-Code：专注于多模态场景下代码生成的资源库

2025年6月10日8时作者 NLP工程化

Awesome-Multimodal-LLM-for-Code：整合多种多模态代码生成资源的优秀库，涵盖Web前端、科学绘图等场景，提供高质量论文和数据集，并持续更新。

Kokoro TTS：一款强大的CLI文字转语音工具，能将文本快速转换为自然流畅的语音

2025年6月10日8时作者 NLP工程化

Kokoro TTS是一款强大的CLI工具，支持多种语言和声音格式，可将文本转换为语音，并提供EPUB、PDF和TXT等多种输入选项。

Supermemory MCP：跨大型语言模型的通用记忆系统

2025年6月10日8时作者 NLP工程化

通过system prompt要求AI在每次聊天中使用tool call传递上下文至MCP（向量数据库），用于保存历史信息并按需查询用户洞察。

3B小模型吊打72B巨头！轻量级文档解析OCR，性能超Gemini，高效且精准！

2025年6月10日8时作者开源星探

近日，Yuliang-Liu团队发布了一款名为MonkeyOCR的轻量级文档解析模型，它以结构-识别-关系（SRR）三元组范式实现了高效精准的文档解析，在英文文档解析任务中超越了Gemini 2.5 Pro和Qwen2.5-VL-72B。其处理速度达每秒0.84页，支持中英文文档处理，并能生成Markdown或JSON结构化数据，适用于企业文档处理、学术研究等场景。

Slidev：开发者必备！用代码打造炫酷演示文稿

2025年6月9日14时作者小兵的AI视界

Slidev 是一个专为开发者设计的开源演示工具，结合现代前端技术和需求提供强大灵活解决方案。支持代码高亮、实时编辑、主题定制、LaTeX 公式渲染和图表绘制等多种功能，适用于技术分享、教学演示和个人项目展示场景。

简单实用的截图翻译工具AI Screenshot Translator ，AI 自动识别并翻译图片中的文字

2025年6月9日11时作者 GitHubStore

通过截图操作发送图片至AI模型进行文本识别和翻译，支持自定义快捷键、多窗口结果管理及系统托盘运行。极大提升日常翻译效率，解决文档臃肿、公式复制问题等痛点。

小红书开源142B参数MoE大模型dots.llm1，AI赋能的Paperless-ngx文档管理工具

2025年6月9日11时作者每日AI新工具

本文介绍了五项最新技术项目，包括大规模MoE模型dots.llm1、Paperless-gpt文档管理工具、深度研究报告生成器Open Deep Research MCP Server、多智能体金融交易框架TradingAgents以及零监督多智能体系统设计MAS-Zero。这些项目涵盖了人工智能在不同领域的应用，如语言建模、数据处理、报告生成和智能体协作等。

LangChain的Java版本

2025年6月9日8时作者 NLP工程化

LangChain4j 是为 Java 开发者设计的框架，提供统一 API 和开发工具箱，支持 15+ 主流 LLM 提供商和向量数据库集成。

TTS.cpp：为跨平台设备提供实时开源文本到语音（TTS）解决方案

2025年6月9日8时作者 NLP工程化

TTS.cpp 提供跨平台实时开源文本到语音解决方案，支持多种模型，并在MacOS上利用Metal加速实现近乎实时生成。

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30