阿里放出了一款情感识别模型:R1-Omni,它能通过看视频来识别人的情绪,像人在看电视剧时能感受到演员的喜怒哀乐一样。R1-Omni是一款基于强化学习与可验证奖励的全模态大模型,利用视觉和音频信息来识别情感,它把RLVR用于模型中,来提高模型在情感识别方面的推理、理解和泛化能力,能看、能听、会分析、能生成详细且可解释的推理过程。



参考文献:
[1] github:https://github.com/HumanMLLM/R1-Omni
(文:NLP工程化)
阿里放出了一款情感识别模型:R1-Omni,它能通过看视频来识别人的情绪,像人在看电视剧时能感受到演员的喜怒哀乐一样。R1-Omni是一款基于强化学习与可验证奖励的全模态大模型,利用视觉和音频信息来识别情感,它把RLVR用于模型中,来提高模型在情感识别方面的推理、理解和泛化能力,能看、能听、会分析、能生成详细且可解释的推理过程。
参考文献:
[1] github:https://github.com/HumanMLLM/R1-Omni
(文:NLP工程化)