卡耐基梅隆大学归档

李沐B站更新了！教你手搓语音大模型，代码全开源还能在线试玩

2025年7月23日16时作者量子位

李沐老师回归小破站，手把手教如何使用最新研发的Higgs Audio V2模型处理文本和语音任务，并实现多种罕见功能。

2025年7月8日8时作者量子位

CMU研究发现，仅用监督微调训练的大模型在其他通用任务上的表现有限甚至退步。强化学习微调的模型则能更好地将数学能力迁移到推理和非推理任务上，预示着强化学习可能是实现可迁移推理的关键方法。

2025年6月17日23时作者机器之心

CMU Infini-Al-Lab 研究人员提出 Multiverse，一种支持原生并行生成的新型生成模型框架，显著提高大语言模型的推理效率和速度。

2025年5月28日11时作者量子位

清华大学等机构联合发布RBench-V，评估大模型的视觉推理能力。结果显示表现最好的模型o3准确率仅为25.8%，远低于人类的82.3%。论文在Reddit机器学习社区引发讨论。

2025年4月7日16时作者新智元

2025年CSRankings公布，卡耐基梅隆大学蝉联第一。清华、上海交通大学/浙江大学并列第三，北京大学位居第五。中国高校在AI领域表现突出，包揽全球前十中的六席。

2025年3月24日16时作者新智元

BPO-AVASR通过双焦点偏好优化方法提升了视觉和音频结合的语音识别性能，解决了噪声、口语化表达及同音词混淆等问题，在多个基准数据集上取得了最优表现。

2025年3月11日8时作者 AI寒武纪

腾讯发布首个混合Transformer-Mamba MoE架构的超大模型Hunyuan-TurboS，其在数学、推理等关键benchmark上超越或持平GPT-4o-0806、DeepSeek-V3。模型成本降低7倍。

2024年12月20日14时作者机器人大讲堂

具身风暴近日完成天使轮融资，超千万元资金将用于产品研发及量产。该公司专注于具身智能机器人交互技术研发，目标打造通用理疗机器人，核心团队包括多位博士和教授。其产品已在降低成本的同时提升了用户体验和效率。