软件开发范式变了!首届 AICon 深圳站,来讲你的 AI 开发绝活!

AI 不再是工具,而是‘共创者’与‘驱动者’,重构软件开发的起点、过程与目的本身。从需求到架构雏形,再到氛围编程和智能体驱动交付,AI 帮助开发者解放繁琐工作,聚焦创新性功能开发和核心业务逻辑。

提升大模型内在透明度:无需外部模块实现高效监控与自发安全增强|上海AI Lab & 上交

上海人工智能实验室和上海交通大学的研究团队提出TELLME方法,通过表征解耦技术提升大模型内部透明度,实现可靠且简单的监控。该方法显著提升了模型的安全性和通用能力,并具有良好的扩展性。

推理正确率下降65.5%!斯坦福、MIT等用「不等式」拷问AI逻辑极限

斯坦福等团队提出IneqMath基准,用于评估大语言模型在数学不等式证明中的严谨性与合理性。结果显示模型推理正确率远低于答案正确率,暴露出其逻辑缺陷。研究者引入多维度评审器审查模型解题过程,以提升模型的逻辑严谨性。