刚刚,阿里Qwen2.5-Omni又开源,实时语音与视频,太卷了~

Qwen2.5-Omni 是一款端到端的多模态模型,旨在感知包括文本、图像、音频和视频在内的多种模态,并以流式方式生成文本和语音响应。其关键特性包括Thinker-Talker架构、TMRoPE位置嵌入技术以及跨模态卓越性能等。

重磅!在浙大发布

2025年3月16日,Datawhale与阿里云通义灵码联合举办的AI+X高校行暨通义灵码+X校园见面会在浙江大学成功举行。活动吸引了近200名师生参加,夏振华、许文豪等嘉宾分享了编程技能的未来和动手实践机会,并签署了战略合作协议。肖俊教授和范晶晶强调了产学研结合的重要性,王荣刚表示希望通过“繁星计划”培养企业所需人才。