推理正确率下降65.5%!斯坦福、MIT等用「不等式」拷问AI逻辑极限

斯坦福等团队提出IneqMath基准,用于评估大语言模型在数学不等式证明中的严谨性与合理性。结果显示模型推理正确率远低于答案正确率,暴露出其逻辑缺陷。研究者引入多维度评审器审查模型解题过程,以提升模型的逻辑严谨性。

全网骂他AI作弊狗,硅谷风投反手砸1.2亿!这届VC就爱疯批创业者

Cluely由Roy Lee创立,主打通过AI帮助用户在面试、求职、写论文等场景中「作弊」。该公司获得了1.2亿美元种子轮融资,估值达1500万美元。a16z认为其开创了新型实时生产力工具类别。

CS博士求职8个月0 offer,绝望转行!斯坦福入学停滞,全美仅增0.2%

计算机专业入学率仅微增0.2%,顶尖高校招生几乎停滞。AI自动化初级编程岗位,导致许多人毕业即失业,求职八个月未果。美国计算机科学已成为全美失业率第七大的专业,高达6.1%。专家建议选择能持久培养、可迁移技能的学科。