开源归档 - 第38页共201页

一手实测超强开源OCR文档识别，效果超闭源模型。

2025年6月18日23时作者开源AI项目落地

MonkeyOCR 是一个用于文档解析的OCR开源项目，采用结构-识别-关系三元组范式，支持英文和中文文档解析，性能表现优异。

2025年6月18日14时作者小兵的AI视界

字节跳动开源的ContentV项目通过高效训练策略和极简架构实现了高质量视频生成。支持文本到视频生成、自定义参数、风格迁移等多功能，并已上线多个应用场景。

2025年6月18日14时作者 Hugging Face

它是一个轻量级
工具包
，让你可以在
免费的 Colab Notebook
上启动 VLM 训练。

2025年6月18日11时作者 GitHubStore

MagicTryOn项目利用Transformer模型实现高质量视频试衣效果，包括图像和视频试衣支持。该技术已在多个场景中展现出巨大潜力。

2025年6月18日8时作者 NLP工程化

Kimi-Dev 是一款强大的开源编程LLM，性能超越其他开源模型，在SWE-bench Verified上达到60.4%；支持本地部署和Hugging Face使用，并通过大规模强化学习优化解决方案的准确性和鲁棒性。

2025年6月18日8时作者 NLP工程化

腾讯AI实验室推出的SongGeneration项目基于LeLM框架实现高质量歌曲生成，支持多偏好对齐和多种音乐风格表达，模型性能超越开源模型。

2025年6月18日8时作者 NLP工程化

OpenDeRisk是7×24小时风险管理系统，提供深度根因分析、多Agent协作及可视化证据链等功能。

2025年6月18日8时作者 NLP工程化

全球首个开源权重的大规模混合注意力推理模型MiniMax-M1发布，支持100万token上下文长度，计算效率提升75%，在复杂任务中表现卓越。

2025年6月18日8时作者开源星探

一款基于最新SOTA AI模型的开源图像修复工具IOPaint，提供智能擦除、对象替换、文本编辑等功能，通过Web UI和命令行轻松使用。

2025年6月17日23时作者开源AI项目落地

氛围编程工具Stagewise结合前端UI和AI编程，简化代码编写过程，支持多种前端框架，降低使用门槛。