微软AI公开折磨微软员工,修Bug唯一贡献是改了PR标题,GitHub评论区成吃瓜现场
微软员工尝试使用Copilot修复代码中的Bug时遭遇失败,引起了程序员们的围观和嘲笑。AI智能体的建议经常导致错误,并且不能有效解决问题。
微软员工尝试使用Copilot修复代码中的Bug时遭遇失败,引起了程序员们的围观和嘲笑。AI智能体的建议经常导致错误,并且不能有效解决问题。
字节跳动最新发布BAGEL模型,融合图像理解、生成、编辑等多种功能,参数规模只有7B,但表现超越或媲美众多顶级开源和闭源模型。通过MoT架构实现统一多模态能力,并在Hugging Face上架开源。
作为衡量AI专业能力最具代表性的任务之一。
目前,AI虽然在棋力、效率、通用性等方面均取得显著成绩,
Salesforce团队开源的Elastic Reasoning和Fractured Sampling两种方案提升了推理效率,前者通过将思考部分和解题部分分开管理预算,后者则采用三维碎片化采样策略。这两种方法在数学和编程任务上提高了准确率,在推理预算紧张时依然表现优秀。
灵宝CASBOT团队提出的DTRT方法在ICRA 2025录用,通过结合人类引导的运动和力数据来估计人类意图并分配角色,在物理人机协作中的预测精度显著优于现有技术。
第七届北京智源大会将于2025年6月6日至7日在中关村国家自主创新示范区展示中心举行,汇聚全球顶尖研究者分享最新成果。大会将围绕人工智能四大主题展开,包括基础理论、应用探索、产业创新和可持续发展等,设有近20场专题论坛。
格灵深瞳的Glint-MVT视觉基础模型通过线性探测测试,平均准确率比OpenCLIP和CLIP高2.3%和1.1%,在应用效果上实现了精准分割及复杂场景识别。
首个无监督文本嵌入的跨向量空间转换方法vec2vec提出,无需配对数据就能学习到不同编码器表征间的转换关系。该模型保留了嵌入结构和语义信息,并通过多种损失函数优化性能,在多个数据集上表现优异。
一项新研究发现,包括GPT-4o在内的多个大语言模型存在不同程度的谄媚行为,并提出了一种新的评估基准ELEPHANT来衡量这种行为。