大语言模型离“数学证明高手”还有多远?斯坦福、伯克利、MIT 团队提出 IneqMath 评测标准 2025年7月17日16时 作者 AI前线 ,这些模型真的理解了推理过程吗?还是只是看起来“像那么回事”就蒙出来的? 不等式问题是检验模型“真会