开源
4.2K+ Star!olmOCR:一款开源的高性能OCR工具
olmOCR 是由 Allen Institute for Artificial Intelligence 开发的工具包,旨在将 PDF 文档线性化以用于语言模型的数据集构建和训练。它提供了自然文本解析、多版本比较等功能,并支持大规模 PDF 处理和模型微调。
3月1日周六 | Python热门项目
文章介绍了6个Python项目及其简介,包括olmOCR、AstrBot、vision-agent、fastrtc、DiffSynth-Studio和LLaMA-Factory,涵盖了PDF处理、聊天机器人、视觉任务生成、实时通信、视频图像合成等多个领域。
TRELLIS:微软、清华、中科大联合开源的高质量3D生成模型
TRELLIS 是一款由微软、清华大学和中国科学技术大学联合开发的开源项目,专注于提供高质量的3D资产生成模型。它支持从文本或图像提示生成各种格式的3D资产,并具备灵活编辑功能。
一款基于 AI 的趋势发现和内容发布系统:TrendPublish
GitHub 上的 TrendPublish 是一款基于 AI 的趋势发现和内容发布系统,支持多源数据采集、AI 智能处理,并可将内容自动发布到微信公众号。
DeepSeek Profile Data:深度剖析计算与通信重叠策略
DeepSeek Profile Data详细介绍V3/R1版本中计算与通信重叠策略,并提供详细的性能分析数据,使用PyTorch Profiler可视化。
DeepSeek在开源周最后一天发布的萤火文件系统 (3FS)
DeepSeek发布的萤火文件系统3FS专为AI训练中的模型批量读取样本数据场景设计,通过Direct IO和异步对齐的读取方式提高性能,减少了服务端的数据加载时间。
腾讯开源了一个AI安全卫士!可一键揪出30+AI组件的隐形漏洞!
腾讯开源的安全工具AI-Infra-Guard能检测30多种常见AI组件的安全漏洞。它支持28种AI框架指纹识别,并包含200+安全漏洞数据库,通过轻量级的命令行工具一键扫描潜在风险。