Mistral首个开源语音模型来了!全面碾压Whisper,多项测试超越GPT-4o mini
首个开源语音模型Voxtral发布,支持8大主流语言,30分钟音频转录,性能全面超越Whisper,可进行复杂问答任务和语音翻译,未来将添加更多功能。
首个开源语音模型Voxtral发布,支持8大主流语言,30分钟音频转录,性能全面超越Whisper,可进行复杂问答任务和语音翻译,未来将添加更多功能。
萨里大学合作完成,通讯作者为吴高昌副教授(东北大学)与朱霞天副教授(萨里大学)。
论文标题:
Cos
本文提出首个大模型推理任务可靠性基准ReliableMath,揭示现有模型在处理无法解问题时的缺陷,并设计了用于评估可靠性的方法和数据集。通过实验分析发现,使用指令性提示可以显著提高模型对不可解问题的回答准确性及可靠性,但小模型仍存在提升空间。
AniCrafter 通过引入3DGS Avatar + 背景视频作为条件控制视频扩散模型,实现任意角色在任意场景下的动画化任务。项目和代码链接已提供。
Mira Murati 的创业公司 Thinking Machines Lab 成功募集了 20 亿美元的种子轮融资,成为硅谷历史上规模最大的种子轮融资之一。该公司将构建一个包含顶尖人才团队和海量算力的「共生体」。
AI 领域持续快速发展,ACL 2025 将于7月在奥地利维也纳召开。机器之心等机构联合发起 ‘云帆・ACL 2025 AI Talent Meetup’,邀请参与者围绕前沿技术与人才交流展开讨论。
归藏介绍了AI深度研究产品秘塔的免费特性及创新交互设计,包括成本优化、信息验证展示等,强调其透明度和用户友好性,并通过多个具体案例展示了其在热点事件分析、知识科普以及游戏攻略等方面的优势。