给语音模型戴上「眼镜」,错误率降低12.5%!人大CMU最新开源 AAAI 2025
BPO-AVASR通过双焦点偏好优化方法提升了视觉和音频结合的语音识别性能,解决了噪声、口语化表达及同音词混淆等问题,在多个基准数据集上取得了最优表现。
BPO-AVASR通过双焦点偏好优化方法提升了视觉和音频结合的语音识别性能,解决了噪声、口语化表达及同音词混淆等问题,在多个基准数据集上取得了最优表现。
德克萨斯州Alpha School引入AI助教后,学生考试成绩提升至全国前2%。学校每天仅用2小时进行AI辅导,剩余时间专注于兴趣项目和技能培养。
过去20年,STEM博士创业率下降38%,原因是知识负担加重。论文指出科学家平均年龄在40多岁后才取得重大突破。AI可能成为解决这一问题的途径,研究表明一个人和AI合作能够媲美两人团队,显著提升效率和产出质量。
研究发现,LLM在创作梗图时表现出惊人的幽默感与创造力,甚至超越了人类创作者。AI创作的梗图评分更高,但最具灵魂的作品仍来自人类。