MiniMax开源首个推理模型!456B参数,性能超DeepSeek-R1,技术报告公开
MiniMax发布全球首个开源大规模混合架构的推理模型MiniMax-M1,参数规模4560亿,在复杂的软件工程、工具使用和长上下文任务方面优于DeepSeek-R1。研究人员使用512块H800训练三周,成本约385.9万元。
MiniMax发布全球首个开源大规模混合架构的推理模型MiniMax-M1,参数规模4560亿,在复杂的软件工程、工具使用和长上下文任务方面优于DeepSeek-R1。研究人员使用512块H800训练三周,成本约385.9万元。
研究者们开发出EarthMind框架,用于理解复杂的遥感数据。它能够处理图像级、区域级和像素级别的感知与推理任务,并发布开源评测基准EarthMind-Bench来评估模型的性能。
本文介绍了一篇被ACL 2025主会议接收的语音语言模型综述论文,该文由香港中文大学团队撰写。文章探讨了当前语音大模型的发展及其在自然对话、实时交互等方面的应用前景,并提出了未来研究的重点和挑战。
Kimi-Dev-72B是首个在SWE-bench Verified编程基准测试中取得全球最高开源模型成绩的代码大模型,参数量仅为72B。通过大规模强化学习优化,Kimi-Dev-72B不仅能在错误修复和单元测试方面表现出色,还支持自我博弈机制以同时担任BugFixer和TestWriter的角色。
文章推荐了咕泡科技的一站式科研辅导服务,帮助解决科研过程中选题、实验设计及验证、创新点设计等问题。导师会从多个方面进行细致指导,并提供快速投稿支持和高资质专家的配套服务,适合多种科研需求人群。
iMeanAI Coyage 是一个基于AI的新平台型产品,它不仅能帮用户搜索航班、预订酒店,还能识别用户的意图并自动组合行程,提供最优方案。通过智能决策和风险提示,帮助用户避免高峰时段和潜在问题。