日期: 2025 年 5 月 22 日
马斯克:Optimus 将成为有史以来最大的产品,比第二大10倍!
马斯克在演讲中宣布Optimus人形机器人将成为有史以来最大的产品。网友对此反应五花八门,有人质疑价格问题,也有工程师提出技术角度的疑问,还有人畅想应用场景。
首个AI翻译实战榜单出炉!GPT-4o稳坐天花板,文化方面Qwen系列一马当先丨开源
首个应用型AI翻译测评榜单TransBench上线,新增幻觉率、文化禁忌词等指标。TransBench评测数据集已全面开源,涵盖多种语言,针对电商和文化特性等方面进行实战考核。目前发布的首期测评结果中,GPT-4o、DeepL Translate、Qwen系列表现突出。
雷军发布小米自研3nm芯片系列新品:首搭手机平板和手表,基带模块也亮相了
小米自研SoC芯片玄戒O1发布,采用3nm制程,性能超越苹果A18 Pro,搭载于小米15S Pro手机上。多项指标领先,包括安兔兔跑分超过300万、GPU提升43%等。
不到1个月,豪掷100亿美元!OpenAI掀起了一场新的AI范式迁移
OpenAI宣布斥资超过100亿美元收购两家公司,加速其业务扩张。这反映了在模型迭代放缓的背景下,AI行业正从单一模型能力竞争转向构建‘全栈式服务体系’的新趋势。
天工超级智能体:用 Office Agent 重新定义 AI 生产力
昆仑万维发布天工超级智能体(Skywork)在GAIA Benchmark上力压群雄。Skywork定位为AI版的Office,涵盖文档、PPT和表格三个场景,支持多场景写作、精美可编辑幻灯片生成及数据分析与可视化等功能。
无需昂贵设备,单目方案生成超逼真3D头像,清华&IDEA新研究入选CVPR2025
清华和IDEA的研究团队提出HRAvatar,一种基于3D高斯点的单目视频重建方法,实现灵活且精确的几何变形、表情编码器提升表情参数提取准确性,并通过分解外观属性(反照率、粗糙度、菲涅尔反射)实现真实重光照。
小学数学题,大模型集体不及格!达摩院推出新基准VCBench
大模型在小学数学题测试中表现不佳,平均得分为47.03%-49.77%,显著低于人类的93.30%。达摩院推出的新基准VCBench专注于评估具备显式视觉依赖性的多模态数学推理任务,强调vision-centric而非knowledge-centric。该基准主要针对小学1-6年级的数学问题,全面评估纯视觉推理的多种能力,涵盖六大核心认知领域和五种不同认知能力。
实测小米自研芯片玄戒 O1:一颗中国芯,到底能不能打
小米自研芯片玄戒 O1 引发关注,与高通旗舰芯片对比测试。跑分成绩优异,但在实际应用中表现略逊一筹。总体而言,玄戒 O1 为小米在高端市场提供了新的选择。