最新W4A4KV4全量化框架,单卡A100大模型推理速度飙升
COMET框架在ASPLOS 2025上发布,实现了权重、激活和KV缓存全4比特压缩下的高性能推理,仅造成0.32的困惑度微增,并实现端到端推理加速2.02倍。
COMET框架在ASPLOS 2025上发布,实现了权重、激活和KV缓存全4比特压缩下的高性能推理,仅造成0.32的困惑度微增,并实现端到端推理加速2.02倍。
阿里巴巴发布2025财年第一季度财报,总收入同比增长7%,经营利润同比增长93%。AI相关产品收入连续七个季度实现三位数增长。云智能集团收入达到1180.28亿元人民币,同比增长11%。阿里在AI领域的研发投入显著增加,并推出多款新型混合推理模型。AI技术推动了多个业务板块的增长,如淘宝天猫、阿里巴巴国际数字商业集团等。
今天凌晨1点,著名大模型平台Anthropic发布了最新大模型Claude 4。Claude 4包括Opus 4和Sonnet 4两个版本,其中Opus 4在编程领域表现出色,独立稳定连续工作7小时超过OpenAI记录;Sonnet 4则在SWE-bench上达到72.7%表现优于Codex-1等前沿模型。Claude 4具备两种思考模式:标准和扩展,用户可以灵活切换以满足不同场景需求,并新增了思考摘要功能来帮助节省空间。Anthropic还宣布了一系列新功能和集成,助力开发者构建更强大的AI智能体。
谷歌在I/O 2025上发布了影视级AI制作工具Flow,集成了多种最新模型支持文本指令、物理模拟等特性。它还提供了专业影视制作功能如相机控制和场景构建器。Flow现已开放使用,订阅用户每月可生成100次视频。
今日CNBC报道,前苹果iPhone设计师乔尼・艾维领导的初创公司io将以64亿美元被OpenAI全资收购。此次收购使OpenAI进军硬件领域,艾维将加入OpenAI,并负责其和io的设计与创意工作。
继AIGC开放社区线上公开课成功举办后,AI线下实战课陆续开始。5月24日下午广州天河区首场课程聚焦MCP开发协议,由教育头部企业AI算法负责人主讲,内容涵盖场景破局、原理拆解和实战演练。
OpenAI 收购 io 并发布支持 MCP 的 Responses API,简化智能体开发与管理,包括支持 Mckey Platform、图像生成、Code Interpreter 和文件搜索工具更新等功能。
6月14日『MCP协议驱动的AI新范式』线下活动即将举行,汇聚技术大咖和专家,探讨协议升级对AI技术突破、商业模式革新及行业标准演进的影响。
Microsoft开源了 NLWeb 框架,使网站能够通过自然语言快速转变为AI驱动的应用。该框架支持多操作系统和大模型,简化开发流程,并能结合底层大语言模型知识提供智能体验。