多语言对话归档

沐神B站更新了

2025年7月24日14时作者 Datawhale

李沐老师介绍了如何使用Higgs Audio V2模型处理文本并生成语音，该模型还具备多种罕见能力。通过整合1000万小时的语音数据及创新方法来解决语音信号表示问题，从而实现了强大的多模态语音合成系统。

跃问APP开源的130B语音模型 Step-Audio，快手开源运动控制DragAnything，微软智能体入门10个免费课程

2025年2月18日12时作者每日AI新工具

Step-Audio是首个支持多语言对话、情感表达和方言的开源智能语音交互框架；Frames of Mind项目通过思维链可视化思考过程；DragAnything实现对象运动控制；《AI Agents for Beginners》课程教授初学者构建AI代理技能；Chat2Geo结合遥感数据进行地理空间分析。

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31