开源星探
开源AI分身!Second Me:本地训练+隐私优先,你的数字替身时代已来
Second Me 是Mindverse团队开发的开源AI分身框架,采用本地训练和去中心化架构保护用户数据隐私。它通过个性化AI训练、去中心化AI网络等功能设计助力解决实际问题。
字节版“妙鸭”工具开源!InfiniteYou:支持人物身份特征保持,灵活修改图像!
字节跳动推出的InfiniteYou AI图像生成工具能够保留人物身份特征的同时灵活修改图像,支持即插即用设计,并提供增强插件提升图像真实感和清晰度。
超酷的PDF转换工具!直接支持DeepSeek V3,本地AI精准解析PDF扫描件!
一款名为PDF Craft的开源工具专注于将扫描书籍的PDF文件转化为Markdown或EPUB格式,支持本地AI模型运行核心功能和远程调用LLM处理复杂任务,具有高效、精准、隐私友好等特点。
阿里巴巴开源的 3D 动画神器,单张图片秒变可动3D人体视频!
阿里巴巴通义实验室发布的大规模人体重建模型LHM,可在几秒钟内将一张全身照片转换为可动画的3D头像,支持实时渲染和姿势控制。该模型已开源并提供在线试用和本地部署选项,能够降低技术门槛并在多个领域如内容创作、虚拟现实和游戏开发中应用。
开源语音 RAG 助手!用自然语音实时搜索向量数据库,革新语音交互体验!
通过语音对话实时搜索Qdrant向量数据库的开源工具Oliva降低了用户与AI的知识库交互门槛。它支持多智能体协作、实时信息检索和个性化配置,提升了效率和智能化水平。
完全离线的本地AI助手:Sidekick,本地运行、数据安全、多功能一体!
一款名为Sidekick的开源AI助手可以在Mac上完全离线运行,确保数据安全和隐私。它支持知识检索、代码解释、图像生成等功能,适合本地知识管理、代码开发、论文写作等场景。
3天内猛涨2.6k+ Star!LangManus:用自然语言操控全网数据,复杂任务一键执行
一款名为LangManus的AI自动化工具通过大语言模型和多种集成工具支持,实现了端到端的任务自动化,包括搜索、爬取、代码执行等,简化了复杂任务流程。
一款刚刚开源的TTS语音模型!25ms超低延迟支持实时对话,4种规格适配全场景!
Orpheus TTS 是一款全新的开源 TTS 模型,支持接近人类的自然情感表达、超低延迟(25-50毫秒)以及强大的零样本语音克隆功能。该模型提供从 150M 到 3B 参数四种不同规模的选择。
256M参数多模态OCR神器,0.35秒解锁全文档奥秘!
一款名为SmolDocling的轻量级OCR模型,仅256M参数,支持文档中的标题、正文、图表等多任务识别,并能导出为Markdown、HTML等多种格式。