提升大模型内在透明度:无需外部模块实现高效监控与自发安全增强|上海AI Lab & 上交

上海人工智能实验室和上海交通大学的研究团队提出TELLME方法,通过表征解耦技术提升大模型内部透明度,实现可靠且简单的监控。该方法显著提升了模型的安全性和通用能力,并具有良好的扩展性。

推理正确率下降65.5%!斯坦福、MIT等用「不等式」拷问AI逻辑极限

斯坦福等团队提出IneqMath基准,用于评估大语言模型在数学不等式证明中的严谨性与合理性。结果显示模型推理正确率远低于答案正确率,暴露出其逻辑缺陷。研究者引入多维度评审器审查模型解题过程,以提升模型的逻辑严谨性。

CVPR 2025 Award Candidate 英伟达等Difix3D+:用单步扩散模型修复 3D 重建伪影

研究团队提出了一种创新方案Difix3D+,通过单步扩散模型对3D渲染结果进行‘图像修复’,显著提升新视角图像的质量和一致性。该方法已被CVPR2025接收,并入选最佳论文候选。