DeepSeek更新刷榜!R1-0528改进编码性能,媲美o3 High和Claude 4

DeepSeek发布R1-0528版本模型,参数规模达到6850亿。该模型在编程、推理和交互等方面提升显著,性能接近OpenAI等旗舰模型,并且价格更为亲民。新模型表现优于上一代,在多个基准测试中表现出色。

AI赛道隐形高手?!美团王兴披露内部基础大模型表现接近GPT-4o,机器人投资遍地开花

美团在2025年第一季度实现了良好的财务表现,并透露了其在AI大模型和机器人领域的进展。公司内部约52%的新代码由AI生成,LongCat(龙猫)大语言模型在推理和非推理模式下的性能接近GPT-4。6月将推出新的大模型作为餐饮业的商业决策助手,并通过收购光年之外公司、投资智谱AI等手段提升自身技术实力。此外,美团还进行了多笔机器人相关领域的投资。

AI编码力压群雄!Anthropic上线最强模型Claude 4系列,“举报”模式引争议

美国AI公司Anthropic发布新一代编码模型Claude Opus 4和Sonnet 4,性能提升高达10%,在SWE-bench上达到业内最先进水平。模型支持多种模式并能通过扩展接口连接到数据库、API等工具,引发了开发者们的广泛好评。

获信通院“4+级”评级,文心大模型最新版有何技术创新?百度吴甜详解

在百度AI Day活动上,文心4.5 Turbo和X1 Turbo大模型展示了多项技术创新。通过混合训练技术提升跨模态学习效率和多模态融合效果,后训练采用自反馈增强技术优化生成结果质量,同时具备数据建设闭环以提供丰富多样高质量数据。百度文心大模型在推理能力评估中获得最高级评级,并成功应用到数字人主播等实际场景中。

卷到飞起!微软Build 2025大会一口气推50多个AI工具,想成为智能体网络中心

微软Build 2025大会发布多项AI技术更新,包括编码代理Copilot、代理工厂Windows AI Foundry和NLWeb等。微软宣布裁员3%,预计到2030年AI编写代码的比例将达到95%。谷歌I/O开发者大会也在筹备中,预计将推出新的GeminiAI功能、Project Astra AI助手、Veo生成式AI视频模型更新以及对Google搜索的重大AI变革。