刚刚,小米又开源一大模型,22个公开测评SOTA
小米公司正式开源声音理解大模型MiDashengLM-7B,其在22个公开评测集上刷新多模态大模型最好成绩,并在推理效率和数据利用率方面表现突出。该模型基于Xiaomi Dasheng作为音频编码器和Qwen2.5-Omni-7B作为自回归解码器训练而成。
小米公司正式开源声音理解大模型MiDashengLM-7B,其在22个公开评测集上刷新多模态大模型最好成绩,并在推理效率和数据利用率方面表现突出。该模型基于Xiaomi Dasheng作为音频编码器和Qwen2.5-Omni-7B作为自回归解码器训练而成。
UltraEval-Audio是首个同时支持语音理解和生成评估的开源框架,涵盖34项权威Benchmark,提供一键式基准管理、内置多种评估方法等功能,助力音频大模型开发与优化。