开源星探，作者每时AI

7K Star 开箱即用！阿里多语言语音生成模型2.0上线：CosyVoice，还支持了方言。

2024年12月18日10时作者开源星探

点击上方“
蓝色字体
”关注我，每天推送“
实用有趣的项目
”！
近年来，人工智能技术在各个领域都取

2024年12月17日8时作者开源星探

一款多功能文档处理工具MarkItDown由微软开源提供，支持PDF、Office文档、图片、音频等多种格式文件转换为Markdown格式，具备OCR文字识别、语音转文字等功能。适用于文档批量处理、索引检索和数据分析等场景。

2024年12月17日8时作者开源星探

MSST 是一款集成了音源分离训练框架和UVR（终极人声消除器）的强大Web界面工具，提供直观的用户界面、灵活的自定义处理流程以及多种预训练模型支持，满足音频爱好者和专业工作者的需求。

2024年12月16日8时作者开源星探

西北工业大学与微软等团队联合推出开源项目Freestyler，能根据歌词和伴奏直接生成自然流畅的说唱人声，模仿指定歌手音色。

2024年12月15日14时作者开源星探

ComfyUI-IF_MemoAvatar是一款基于MEMO技术的插件，通过分析面部特征和音频生成富有表现力的表情丰富的动态视频。它支持Windows和Linux用户使用，并具备高质量视频输出、情感表达转移等特色功能。