多模态语音表征新突破!CoGenAV:高效、鲁棒、通用的语音识别“利器”

通义联合深圳技术大学推出的CoGenAV模型通过融合音频和视觉信息,显著提升了语音识别和处理性能。仅需223小时标记数据即可训练,展现出极高的数据效率,并在多种语音处理任务中表现出色。

「通义」应用团队从阿里云分拆,并入阿里智能信息事业群|智涌独家

阿里将AI应用‘通义’从阿里云分拆,整合至智能信息事业群。此次调整包括To C方向的产品经理及工程团队,并与智能搜索产品’夸克’平级。此举旨在梳理内部AI To C应用,提升用户体验和获客能力。