日期: 2025 年 6 月 18 日
大模型全员0分!谢赛宁领衔华人团队,最新编程竞赛基准出炉,题目每日更新禁止刷题
参赛大模型全军覆没,通通0分。LiveCodeBench Pro测试揭示了LLMs在算法逻辑深度上的不足,尽管表现最佳的模型在中等难度题上的一次通过率仅53%。
港科广等发布首个医学世界模型!精准模拟肿瘤演化,规划治疗方案
香港科技大学与合作伙伴提出Medical World Model(Medical系统世界模型),通过生成式模型和生存分析技术,显著提升治疗方案优化能力,在视觉图灵测试、生存风险评估及临床决策支持方面表现优异。
全球首个AI眼镜支付技术落地,Rokid称明年量产目标100万台
全球首个AI眼镜支付技术落地。Rokid和支付宝合作推出内置支付宝‘看一下支付’功能的智能眼镜,实现语音付款。预计2021年底国内AI眼镜整体出货量有望超过50万台,明年目标达100万台。