量化压缩80%!160GB就能运行671B的DeepSeek R1
671B参数的DeepSeek R1在UnslothAI团队的技术优化下成功压缩至131GB,仅需160GB显存即可运行。该模型在多项基准测试中表现出色,为开发者和用户提供了一种新的量化压缩思路。
671B参数的DeepSeek R1在UnslothAI团队的技术优化下成功压缩至131GB,仅需160GB显存即可运行。该模型在多项基准测试中表现出色,为开发者和用户提供了一种新的量化压缩思路。
DeepSeek发布Janus-Pro模型,实现图文理解和图像生成的双面杀手。该模型通过解耦视觉编码路径实现了真正的”一心二用”,并采用统一架构设计、精心训练策略和MIT开源协议。其在理解任务得分0.8和生成质量上碾压DALL-E 3等主流模型。
Scale AI CEO 指责中国AI创新速度慢并呼吁加强对出口管制。引发争议及反击,强调AI竞争应合作而非对抗。
Perplexity 宣布推出多模态助手,能够实际帮你完成任务。该助手具备多模态能力,能直接启动相机并连接现实世界的服务如预订餐厅、设置提醒等。用户可将其设为默认助手,取代现有手机助手。
OpenAI的5000亿美元星门计划面临资金、架构等多重困境,Sam Altman的融资方案被质疑。有人认为这只是远大梦想的开始,但也有人持怀疑态度,指出大语言模型本质上只是复杂的模式匹配器。
中国团队DeepSeek仅花费550万美元训练出媲美GPT-4的模型引发全球关注。该团队表示投入远超此数字,包括GPU投资超过10亿美元、运营成本每年数亿美元以及约150位顶级研究员参与。团队展示了五大关键技术突破,并在多项评测中表现优异。DeepSeek还展示了其高效的市场策略和成本优势,美国用户只需7美元即可使用。
OpenAI 发布了 Operator,一款可以完成具体任务的代理工具。Operator 可以自主预订机票、安排餐厅等任务,并拥有自己的浏览器实时展示操作过程,用户可随时接管任务。
白宫会议上的Sam Altman与Larry Ellison表示人工智能将治愈癌症。然而,哈佛医学院的研究显示癌症正在变化,并且尽管投入大量资金,癌症生存率提高有限。Simona Cristea指出,肿瘤像变色龙一样在治疗中产生耐药性。目前的模型无法有效处理真实数据,而AI有望解决这一问题。最新研究表明,AI在癌症影像学数据压缩和预测方面表现突出。专家认为,AI可能帮助找到某些类型癌症的治疗方法。但Cristea提醒,不存在包治百病的神药。
字节发布UI-TARS视觉语言模型,能像人一样操控电脑界面,并在多项测试中击败GPT-4等对手。它具备感知、推理及行动能力,支持点击、输入等多种操作。UI-TARS通过SFT和DPO训练,在多个GUI代理基准测试中达到最佳成绩,还开源了桌面版应用。