开源
Labubu换装记!让视频换装变得如此简单!基于扩散Transformer的视频虚拟试衣新突破
MagicTryOn项目利用Transformer模型实现高质量视频试衣效果,包括图像和视频试衣支持。该技术已在多个场景中展现出巨大潜力。
Kimi-Dev:强大的开源编程LLM,助力软件开发任务
Kimi-Dev 是一款强大的开源编程LLM,性能超越其他开源模型,在SWE-bench Verified上达到60.4%;支持本地部署和Hugging Face使用,并通过大规模强化学习优化解决方案的准确性和鲁棒性。
SongGeneration:腾讯AI实验室推出的高质量歌曲生成项目
腾讯AI实验室推出的SongGeneration项目基于LeLM框架实现高质量歌曲生成,支持多偏好对齐和多种音乐风格表达,模型性能超越开源模型。
MiniMax-M1:全球首个开源权重的大规模混合注意力推理模型,专为处理长输入和复杂任务而生
全球首个开源权重的大规模混合注意力推理模型MiniMax-M1发布,支持100万token上下文长度,计算效率提升75%,在复杂任务中表现卓越。
开源AI图像修复神器!狂揽21K+标星,擦除、替换、扩展一键搞定!
一款基于最新SOTA AI模型的开源图像修复工具IOPaint,提供智能擦除、对象替换、文本编辑等功能,通过Web UI和命令行轻松使用。
Fish Audio 的 OpenAudio S1:新一代语音生成,让机器也能“声临其境”!
OpenAudio S1 是 Fish Audio 推出的多语言 TTS 模型,基于超过200万小时的音频数据训练,采用双自回归架构和强化学习与人类反馈技术。支持13种语言、40亿参数版本及5亿参数开源版,并具备零样本语音克隆功能。