80%
马云佩戴阿里新工牌现身杭州园区,出席阿里云15周年庆
4月10日,阿里巴巴创始人马云现身杭州阿里云谷园区。2009年成立的阿里云近期宣布收入达317.42亿元,并发布新模型聚焦推理和全模态融合。阿里的AI赛道持续加码,未来三年将投入超过3800亿元用于基础设施建设,同时加大对AI人才招聘力度。
16天闪电融资超16亿!大模型独角兽暴风吸金,已集齐成都+珠海+杭州+北京四城投资
成都高新区宣布战略投资智谱超亿元,将与智谱共同打造四川省首个基座大模型‘智谱诸葛大模型’。该项目总投资3亿元,预计未来三年赋能企业不低于500家,五年内争取不低于1000家企业。
马斯克暴论:5年内AI超越人类总智能,2029年文明终结概率20%!谷歌却在疯狂「玩火」
马斯克预测2029年AI将超越人类智慧,导致20%概率文明灭绝;谷歌联创Brin鼓励员工每周工作60小时开发AGI。马斯克质疑Google忽视人工智能安全与风险,呼吁Grok至少追求真相的人工智能。
大模型「记忆断片」成历史!AI初创全新Zep系统,知识图谱破解上下文诅咒
Zep AI推出为智能体打造的记忆层插件,通过回忆聊天历史生成摘要和其他相关信息,使AI助手能够在不影响用户聊天体验的情况下异步地从过去的对话中提取相关上下文。
ICLR 2025 高分论文!何恺明和刘壮提出:数据集偏差的十年之战
MIT副教授何恺明的新研究揭示,尽管过去十多年里业界为构建更大、更多样化数据集做了努力,但现代神经网络似乎越来越善于‘识破’并利用这些数据集中潜藏的偏差。此发现引发对消除数据集偏差是否已取得胜利的质疑。
7G显存,训练自己的DeepSeek-R1,GRPO资源暴降80%
Unsloth AI 提供了 GRPO 训练算法,使用户能够在仅 7GB VRAM 上重现 DeepSeek R1-Zero 的‘顿悟时刻’,相比传统方法减少约80%的 VRAM 使用量。
量化压缩80%!160GB就能运行671B的DeepSeek R1
671B参数的DeepSeek R1在UnslothAI团队的技术优化下成功压缩至131GB,仅需160GB显存即可运行。该模型在多项基准测试中表现出色,为开发者和用户提供了一种新的量化压缩思路。