ICLR 2025 一行代码!FreDF频域损失稳定提升时间序列预测精度
本文提出FreDF方法,通过频域标签训练解决时间序列预测中标签自相关性被忽视的问题。只需添加一行代码即可显著提升预测精度,并在多种模型上均表现出一致的性能提升效果。
本文提出FreDF方法,通过频域标签训练解决时间序列预测中标签自相关性被忽视的问题。只需添加一行代码即可显著提升预测精度,并在多种模型上均表现出一致的性能提升效果。
清华大学朱军团队提出 DeepMesh 方法,通过引入自回归生成框架和创新网格标记化方法,显著提升三维网格的生成能力。该方法支持生成高达3万个面片的高质量三维网格,并在多种应用场景中表现出色。
中国高校图学习开源框架Jittor Geometric发布,展示了在谱域、动态和分子等领域的新进展。该平台支持多种经典图数据集,并且训练速度比现有主流框架快25%。Jittor Geometric提供了统一的模式编写高度统一的数据集和模型,降低了用户的学习成本。未来将通过补充更多前沿模型、优化分布式训练和支持PyTorch转换脚本等功能进一步完善。
AMD推出的Agent Laboratory利用自主大型语言模型支持科学发现流程,通过文献综述、实验和报告撰写三个阶段生成研究报告和代码仓库,显著提高研究质量和效率并降低成本。
NeurIPS 2024 LLM推理教程代码介绍:涵盖生成算法、元生成算法和高效元生成算法,旨在提高模型推理效率和效果。
OpenAI元老级成员Alec Radford宣布离职,他被认为是GPT-1、GPT-2等模型的主要作者之一。Radford的离开引起业界广泛关注,认为这可能影响OpenAI的发展方向。
上周,HyperAl超神经更新了 AlphaFold3 依赖数据库,但很多小伙伴都反映数据太大,部署
在NeurIPS会议上,Ilya承认对未来「一无所知」。尽管他在AI领域有极高预测准确率,他仍认为保持谦逊能促进创新。Shane Gu提出,思维链方法不仅能提升模型推理能力,还能显著改善其校准性。
Qwen团队成员认为预训练在智能体、合成数据和推理方面仍具有重要作用,并且需要更多时间进行优化以覆盖整个互联网知识。同时,强调了预训练模型质量对合成数据和后训练的影响以及训练大型模型的挑战。
本周解读AI及机器人技术的3个专题。讨论Scaling Law是否撞墙,指出大模型性能提升可能不再单纯靠堆叠数据和参数规模;世界模型在自动驾驶中发挥作用;麦肯锡报告预测未来18个可能重塑全球经济的领域。