三位数学家改写经典牛顿法!300年前算法一夜更新,收敛速度更快函数范围更广
三位普林斯顿数学家提出的新牛顿法扩展了函数处理范围,使其更适用于高次幂和更多变量的复杂问题。该方法在凸性和平方和条件下表现出更好的收敛速度,并成功取代了梯度下降在某些情况下的应用。
三位普林斯顿数学家提出的新牛顿法扩展了函数处理范围,使其更适用于高次幂和更多变量的复杂问题。该方法在凸性和平方和条件下表现出更好的收敛速度,并成功取代了梯度下降在某些情况下的应用。
AMD MI300X在FP8下全面超越英伟达H200,吞吐量最高可达H200的5倍。得益于SGLang框架和优化的AI内核库AITER,MI300X在延迟相似的情况下实现了更高的吞吐量,并且在固定并发情况下性能提升75%。
港科大团队提出GraphGS框架,无需精确相机位姿即可高效重建大规模开放场景,并在ICLR 2025上入选。该方法利用数学策略筛选关键匹配对、建立相机拓扑图及应用多视角一致性损失函数等技术突破,实现高效、高保真的三维场景重建和新视角合成。
DeepSeek V3-0324是最新版本的小规模升级,它能够处理复杂问题如4维空间超立方体,并通过一句提示词生成完整产品页面。该模型在Xeophon的Benchmark测试中表现出色,解决了诸如“如何让7米长的甘蔗通过1米高、2米宽的门”等难题。其依然免费且开源。
多模态思维链(MCoT)系统综述发布,介绍了其基本概念、分类法和应用场景,并探讨了当前挑战及未来研究方向。通过推理构建视角、结构化推理视角等六大技术支柱提升模型能力,改变机器人的操作、自动驾驶的安全性、医疗诊断的速度与准确性以及教育的个性化教学等方面。论文链接:https://arxiv.org/pdf/2503.12605
阿里通义千问Qwen发布新模型Qwen2.5-VL-32B-Instruct,尺寸为32B,具备更强的数学推理能力、图像解析能力和内容识别准确度,在多个基准上达到同规模SOTA表现。
秒哒是百度推出的应用开发平台,无需代码编写即可快速生成完整的网站、小游戏和H5页面,支持多智能体协作和多工具调用技术。通过对话式生成应用,用户可以在几分钟内完成复杂项目,并能进行二次编辑和优化。
苹果计划在AirPods和Apple Watch上加装摄像头以增强人工智能功能,但目前进展缓慢。古尔曼透露了苹果未来的多项新技术,包括血压监测、5G和卫星通信以及可能的Meta风格AI眼镜,预计至少需要几年时间才能实现。
Alpha学校采用个性化AI导师模式,学生每天仅用2小时学习,其余时间专注于技能培养。成绩提升至全国前2%的水平,学费高昂且缺乏具体证据支持AI系统性能。