ICLR 2025 Spotlight 参数高效微调新范式!上海交大联合上海AI Lab推出参数冗余微调算法
本文提出参数冗余微调范式NoRM,在LoRA基础上通过SVD分解和Sim-Search方法去除冗余参数,显著提升指令微调、数学推理和代码生成任务性能。
本文提出参数冗余微调范式NoRM,在LoRA基础上通过SVD分解和Sim-Search方法去除冗余参数,显著提升指令微调、数学推理和代码生成任务性能。
谷歌DeepMind的DreamerV3在《我的世界》中无需人类数据自主完成钻石收集任务,标志着AI向通用人工智能(AGI)又迈进了一步。
ATEC2025 科技精英赛由清华大学等顶尖学府联合主办,聚焦人工智能与机器人技术融合创新。赛事设置双赛道,奖金池高达21万美元,提供商业级硬件设备,并邀请专家学者评委参与验证和交流。
研究者提出了一种新的视觉自监督学习模型Web-SSL,它能够在不依赖语言监督的情况下,在大规模数据集上与CLIP模型媲美,并在多种视觉问题解答任务中表现出色。
PaperBench测试了多款AI模型复现ICML 2024顶会论文的能力。结果显示,Claude 3.5 Sonnet表现最好,平均得分为21.0%。研究发现当前AI在长期规划、持续调试和策略执行方面存在问题。PaperBench为评估AI科研能力提供了量化标准,有助于加速科学发现并推动开放协作。
智谱 AI 发布的 AutoGLM 沉思现已上线,完全免费且立即可用。它能像人一样思考、看世界和做事情,支持在网页端、PC 客户端及手机 App 上使用。案例展示了其在旅游规划与产品对比方面的应用能力。
强大的AI编程助手Augment Agent正式登场,宣称对GitHub Copilot胜率高达70%,支持20万token上下文窗口。它能在大型代码库中导航和修改代码,并提供实时同步、记忆功能及原生工具集成等优势。
今天是2025年4月3日,星期四,北京天气晴朗。文章介绍了关于大模型测试《Large Language Models Pass the Turing Test》,以及RAG用于视频文章生成的方案WIKIVIDEO和面向东方语言的语音识别开源方案Dolphin。
Windsurf 更新推出部署功能和企业模式支持,增强IDE集成能力。包括一键部署、自动Commit信息生成、长对话性能优化等新特性。