小米又发新模型!MiMo-VL多模态模型开源,仅7B参数部分性能直逼R1、o3-mini
小米大模型Core团队推出多模态开源模型MiMo-VL-7B系列,该模型在视觉理解和推理任务中表现出色,并在多个数学竞赛中超越了Qwen2.5-VL-7B和DeepSeek等同级别模型。
小米大模型Core团队推出多模态开源模型MiMo-VL-7B系列,该模型在视觉理解和推理任务中表现出色,并在多个数学竞赛中超越了Qwen2.5-VL-7B和DeepSeek等同级别模型。
DeepSeek发布R1-0528版本模型,参数规模达到6850亿。该模型在编程、推理和交互等方面提升显著,性能接近OpenAI等旗舰模型,并且价格更为亲民。新模型表现优于上一代,在多个基准测试中表现出色。
美团在2025年第一季度实现了良好的财务表现,并透露了其在AI大模型和机器人领域的进展。公司内部约52%的新代码由AI生成,LongCat(龙猫)大语言模型在推理和非推理模式下的性能接近GPT-4。6月将推出新的大模型作为餐饮业的商业决策助手,并通过收购光年之外公司、投资智谱AI等手段提升自身技术实力。此外,美团还进行了多笔机器人相关领域的投资。
美国AI公司Anthropic发布新一代编码模型Claude Opus 4和Sonnet 4,性能提升高达10%,在SWE-bench上达到业内最先进水平。模型支持多种模式并能通过扩展接口连接到数据库、API等工具,引发了开发者们的广泛好评。
OpenAI CEO萨姆·奥特曼宣布与前苹果首席设计师乔纳森·艾维合作,双方计划开发新一代人工智能计算机产品。
在百度AI Day活动上,文心4.5 Turbo和X1 Turbo大模型展示了多项技术创新。通过混合训练技术提升跨模态学习效率和多模态融合效果,后训练采用自反馈增强技术优化生成结果质量,同时具备数据建设闭环以提供丰富多样高质量数据。百度文心大模型在推理能力评估中获得最高级评级,并成功应用到数字人主播等实际场景中。
微软Build 2025大会发布多项AI技术更新,包括编码代理Copilot、代理工厂Windows AI Foundry和NLWeb等。微软宣布裁员3%,预计到2030年AI编写代码的比例将达到95%。谷歌I/O开发者大会也在筹备中,预计将推出新的GeminiAI功能、Project Astra AI助手、Veo生成式AI视频模型更新以及对Google搜索的重大AI变革。