月度归档: 2025 年 3 月
太给力了!刚刚开源的TTS模型,1:1零样本声音克隆,连呼吸节奏都能控制!
Spark-TTS 是一款全新的高质量语音合成系统,支持零样本语音克隆、细粒度语音控制、跨语言生成等功能。它结合了 BiCodec 编解码器和 Qwen-2.5 思维链技术,实现自然且高效的语音生成,适用于多种场景如有声读物、多语言内容及AI角色配音。
6 个值得关注的 Manus 开源平替,收藏起来!
近日,Manus 作为 AI 科技圈热点,多款开源替代方案涌现。OpenManus、AutoMate、OpenHands 等项目提供多样化功能和灵活性,涵盖模块化架构、本地运行能力、RPA 自动化等;深度研究系列则专注于AI驱动的研究助手。这些开源项目的潜力不容忽视。
阿里开源新模型:媲美DeepSeek-R1,参数大降20倍!
阿里巴巴开源了QwQ-32B大模型,其在主流测试基准上表现优异。该模型通过冷启动和大规模强化学习提升性能,具备数学解题及编程任务能力,并集成了与Agent相关的能力。
搞到邀请码了吗?从Manus爆火谈谈Agent的巅峰与思考|建忠研思
本周 AI 圈热议话题之一是 Monica 团队推出的全球首款通用 AI Agent Manus。然而,它迅速引发了技术噱头与炒作的争议。李建忠将在 CSDN「建忠研思」栏目中解析 Manus 的真实价值及未来方向。
首个开源免费的商用级别克隆数字人模型,1080显卡可用,数字人不再有门槛。
数字人模型HeyGem.ai正式开源,用户可免费下载安装。硅基通过秒级克隆技术实现高精度口型匹配与4K超高清视频生成,成本大幅降低至零。