语音理解归档

刚刚，小米又开源一大模型，22个公开测评SOTA

2025年8月4日16时作者智东西

小米公司正式开源声音理解大模型MiDashengLM-7B，其在22个公开评测集上刷新多模态大模型最好成绩，并在推理效率和数据利用率方面表现突出。该模型基于Xiaomi Dasheng作为音频编码器和Qwen2.5-Omni-7B作为自回归解码器训练而成。

2025年1月25日16时作者 NLP工程化

UltraEval-Audio是首个同时支持语音理解和生成评估的开源框架，涵盖34项权威Benchmark，提供一键式基准管理、内置多种评估方法等功能，助力音频大模型开发与优化。