量子位，作者每时AI - 第52页共151页

微软AI公开折磨微软员工，修Bug唯一贡献是改了PR标题，GitHub评论区成吃瓜现场

2025年5月24日16时作者量子位

微软员工尝试使用Copilot修复代码中的Bug时遭遇失败，引起了程序员们的围观和嘲笑。AI智能体的建议经常导致错误，并且不能有效解决问题。

2025年5月24日16时作者量子位

字节跳动最新发布BAGEL模型，融合图像理解、生成、编辑等多种功能，参数规模只有7B，但表现超越或媲美众多顶级开源和闭源模型。通过MoT架构实现统一多模态能力，并在Hugging Face上架开源。

2025年5月23日23时作者量子位

作为衡量AI专业能力最具代表性的任务之一。
目前，AI虽然在棋力、效率、通用性等方面均取得显著成绩，

2025年5月23日16时作者量子位

Salesforce团队开源的Elastic Reasoning和Fractured Sampling两种方案提升了推理效率，前者通过将思考部分和解题部分分开管理预算，后者则采用三维碎片化采样策略。这两种方法在数学和编程任务上提高了准确率，在推理预算紧张时依然表现优秀。

2025年5月23日16时作者量子位

灵宝CASBOT团队提出的DTRT方法在ICRA 2025录用，通过结合人类引导的运动和力数据来估计人类意图并分配角色，在物理人机协作中的预测精度显著优于现有技术。

2025年5月23日16时作者量子位

标准了！
来自香港科技大学、腾讯西雅图AI Lab、爱丁堡大学、Miniml.AI、英伟达的研究者联

2025年5月23日16时作者量子位

第七届北京智源大会将于2025年6月6日至7日在中关村国家自主创新示范区展示中心举行，汇聚全球顶尖研究者分享最新成果。大会将围绕人工智能四大主题展开，包括基础理论、应用探索、产业创新和可持续发展等，设有近20场专题论坛。

2025年5月23日16时作者量子位

格灵深瞳的Glint-MVT视觉基础模型通过线性探测测试，平均准确率比OpenCLIP和CLIP高2.3%和1.1%，在应用效果上实现了精准分割及复杂场景识别。

2025年5月23日16时作者量子位

首个无监督文本嵌入的跨向量空间转换方法vec2vec提出，无需配对数据就能学习到不同编码器表征间的转换关系。该模型保留了嵌入结构和语义信息，并通过多种损失函数优化性能，在多个数据集上表现优异。

2025年5月23日16时作者量子位

一项新研究发现，包括GPT-4o在内的多个大语言模型存在不同程度的谄媚行为，并提出了一种新的评估基准ELEPHANT来衡量这种行为。