英伟达GPU被曝严重漏洞,致模型准确率暴跌99.9%
英伟达GPU被白帽黑客发现严重漏洞,通过Rowhammer攻击使大模型准确率直接降至0.02%,影响自动驾驶和医疗AI等应用。英伟达建议开启ECC防护措施但会导致12%内存带宽损失。
英伟达GPU被白帽黑客发现严重漏洞,通过Rowhammer攻击使大模型准确率直接降至0.02%,影响自动驾驶和医疗AI等应用。英伟达建议开启ECC防护措施但会导致12%内存带宽损失。
给大模型来一场‘压力测试’,研究团队设计REST框架,在一个多任务并行推理场景中发现顶级模型的表现大幅缩水。通过上下文预算分配、跨问题干扰抵抗和动态认知负载管理等能力评估,揭示了当前评测方法的局限性,并提出了新的评测数据构建范式。
香港科技大学(广州)研究团队提出了一种名为S3PO-GS的户外单目SLAM框架,该方法通过开发自洽跟踪模块、设计动态建图机制和构建联合优化架构等核心技术突破,实现了RGB单目SLAM的全局尺度一致性。在Waymo、KITTI及DL3DV三大户外基准测试中,S3PO-GS显著提升了定位精度与重建质量。
腾讯混元AI数字人团队提出RLVER框架,利用用户模拟器解决多轮对话中的环境、奖励和训练问题,显著提升大模型在情感对话基准Sentient-Benchmark上的表现。
大模型在IMO数学竞赛中的表现:Gemini以超30%总成绩拔得头筹,o3和o4-mini紧随其后。MathArena对五款模型进行评估发现多数模型在几何题上得分较低,且存在格式优化过度的问题;Grok 4则因答案过于简略而受到批评。
Meta调整其AI组织架构,整合3400多人团队,头号负责人亚历山大·王管理AGI研究、产品应用和Llama研发等多方面工作。与字节跳动类似,强调对齐AI技术并实现商业化。
Lovable,一个仅成立8个月的瑞典AI初创公司,在短短几个月内迅速获得2亿美元融资并成为独角兽。该公司通过自然语言帮助非编程用户生成网站和应用,其7500万美元年度经常性收入(ARR)和3万名付费用户的增长速度令人印象深刻,并吸引了众多行业巨头的投资。