量子位
Claude公司估值615亿美元再融35亿,那DeepSeek…
Anthropic宣布新一轮35亿美元融资,投后估值615亿。本轮由光速创投领投,推动研发新一代AI系统,扩大计算能力,提升Claude-3.7编程能力,开发协作AI系统等。Anthropic年收入达10亿美元,客户包括Google、亚马逊等巨头。
阿里PC-Agent重构人机交互,精准拆解跨应用指令,自动化办公更进一步
阿里通义实验室提出PC-Agent框架,实现复杂PC任务自动化。该框架通过主动感知模块和层次化多智能体协作结构处理跨应用工作流指令。实验表明其在复杂任务上表现优于现有方法。
AI三小时做的小游戏,9天赚12万!马斯克:AI游戏前景无限
一个人用3小时靠AI开发的游戏《飞行模拟器》9天赚12.64万。游戏通过广告模式盈利,每售出一个F16飞机和多个广告汽艇等产品每月收入约17360美元。开发者Pieter Levels通过不断尝试成功闯出自己的天地,并分享了自己的创业经验。
标点符号成大模型训练神器!KV缓存狂减一半,可处理400万Tokens长序列,来自华为港大等 开源
来自华为、港大、KAUST和马普所的研究者提出了一种新的稀疏注意力机制——SepLLM,它通过根据原生语义动态划分token数量来显著减少KV缓存使用量,并在免训练、预训练和后训练场景下实现了50%以上的KV缓存减少。
CVPR满分论文:一块2080Ti搞定数据蒸馏,GPU占用仅2G,来自上交大“最年轻博导”课题组
上交大EPIC实验室提出的新方法NFCM将数据集蒸馏转化为极小化极大优化问题,显著减少了显存占用和提升了训练速度,并且在多个基准数据集中取得了优异性能。