百万小时训练!这个中文TTS模型让AI播客告别”机械音”,效果堪比真人主播

MOSS-TTSD 是由清华大学语音与语言实验室开发的开源口语对话语音生成模型,支持中文和英文双语生成,并具备零样本语音克隆能力,广泛应用于 AI 播客、访谈、新闻报道等多种场景。

Karpathy戳破强化学习神话,首提AI复盘式进化!暴力试错将死

Karpathy提出强化学习并非通往AGI的最佳途径,建议采用像人类复盘的学习方法。他认为现有强化学习方法效率低且与人类迭代机制存在差距。他提出了一个新框架来改进当前的强化学习技术。

阿里达摩院开源多模态医学大模型—灵枢

专注AIGC领域的专业社区,聚焦大语言模型在医疗领域的应用研究。目前大模型面临三大难题:医疗知识覆盖不足、幻觉风险高及推理能力欠缺。阿里达摩院开源统一多模态医学大模型灵枢,并详细介绍数据构建与训练方法。