月度归档: 2025 年 4 月
ICLR 2025 高效又稳定!人大团队提出模型剪枝新方法LLM-Streamline
模型剪枝方法LLM-Streamline通过判断层的重要性,并进行剪枝来减少模型参数量,同时使用余弦相似度和轻量级蒸馏小模型来弥补损失。该方法具有低内存消耗、合理训练方法以及新的稳定性指标等优势,相比已有方法性能更高。
2024 AAAS Fellow名单出炉:华人学者刘威入选
三位华人学者入选2024年AAAS Fellow名单,包括腾讯杰出科学家刘威、纽约城市学院教授田英利和埃默里大学教授熊莉。他们分别在计算机视觉、机器学习及数据隐私等领域做出突出贡献。
Hugging Face创始人推出免费的“网页版Cursor”
Hugging Face创始人Thomas Wolf发布了新工具DeepSite,用户只需描述需求就能快速生成网页和游戏。该工具使用最新的DeepSeek V3模型,界面直观易用,完全免费。
R1–Zero强化学习路线新发现及R1思路用于GUI Agent动作预测方案
2025年4月1日,北京天气晴。文章介绍了R1进展中的两个工作,一是研究多种基础模型预训练特性的影响;二是将GRPO-RL强化用于Agent的UI动作预测,数据和奖励函数设计有趣。研究发现Qwen2.5模型在不使用模板的情况下有强大的推理能力,但模板会破坏数学解题能力。此外,文章还讨论了强化学习在图形用户界面(GUI)动作预测中的应用。
OpenAI完成400亿美元融资,规模创私人公司融资记录
OpenAI宣布获得400亿美元融资,估值飙升至3000亿美元。软银领投75%,其余资金由微软、Coatue Management等投资者提供。融资分为两期:首轮100亿美元立即到位,剩余300亿美元将在2025年底前注入,并要求OpenAI完成转型。
Apple Intelligence全球开放!支持简体中文等多语种,Vision Pro也能用AI了
苹果将Apple Intelligence功能向全球更多用户开放,新增对多语种支持,并在Vision Pro中加入创新AI工具。更新包括Writing Tools、Image Playground和Genmoji等功能。