LiveCodeBench Pro 归档

0%通过率！Code神话泡沫！LiveCodeBenchPro发布！

MLNLP社区是国内知名的人工智能与自然语言处理学术社群，旨在促进跨学科交流合作。近期，该团队揭穿了大模型在编程比赛中表现不佳的事实，并提出了改进方法以提升AI能力。

2025年6月18日23时作者量子位

参赛大模型全军覆没，通通0分。LiveCodeBench Pro测试揭示了LLMs在算法逻辑深度上的不足，尽管表现最佳的模型在中等难度题上的一次通过率仅53%。