日期: 2025 年 6 月 17 日
MiniMax开源首个推理模型!456B参数,性能超DeepSeek-R1,技术报告公开
MiniMax发布全球首个开源大规模混合架构的推理模型MiniMax-M1,参数规模4560亿,在复杂的软件工程、工具使用和长上下文任务方面优于DeepSeek-R1。研究人员使用512块H800训练三周,成本约385.9万元。
欧洲团队开源「地球AI大脑」!EarthMind突破遥感多模态统一理解壁垒
研究者们开发出EarthMind框架,用于理解复杂的遥感数据。它能够处理图像级、区域级和像素级别的感知与推理任务,并发布开源评测基准EarthMind-Bench来评估模型的性能。
首个全面梳理语音大模型发展脉络的权威综述,入选ACL 2025主会
本文介绍了一篇被ACL 2025主会议接收的语音语言模型综述论文,该文由香港中文大学团队撰写。文章探讨了当前语音大模型的发展及其在自然对话、实时交互等方面的应用前景,并提出了未来研究的重点和挑战。
月之暗面又开源了!登顶全球第一,还超了新版DeepSeek-R1
Kimi-Dev-72B是首个在SWE-bench Verified编程基准测试中取得全球最高开源模型成绩的代码大模型,参数量仅为72B。通过大规模强化学习优化,Kimi-Dev-72B不仅能在错误修复和单元测试方面表现出色,还支持自我博弈机制以同时担任BugFixer和TestWriter的角色。