AI 开始「自由玩电脑」了!吉大提出「屏幕探索者」智能体

基于强化学习训练的视觉语言模型成功在开放GUI环境中进行了自我探索,提升了智能体的交互能力。该研究展示了如何结合探索奖励、世界模型和GRPO强化学习来增强智能体的探索效率,并通过经验流蒸馏技术进一步提升了其自主性。

免费、开源!谷歌Gemini CLI彻底火了,平替Claude Code

谷歌 Gemini CLI 是一款开源终端 AI 智能体,支持自然语言命令执行强大的 AI 功能,包括编程、聊天和内容创作等。免费版本提供100万 token上下文窗口,每分钟60次请求限制,成为新的竞争对手。

人民大学&字节Seed:利用μP实现Diffusion Transformers高效扩展

中国人民大学高瓴人工智能学院李崇轩团队和字节跳动Seed团队合作研究Diffusion Transformers的超参优化,提出μP理论并将其应用于实际模型训练。通过大规模实验验证了该方法的有效性,并开放论文代码供进一步研究。

ICCV 2025放榜!录取率24%,夏威夷门票你抢到了吗?

ICCV 2025 将于美国夏威夷举行,共收到11239份有效投稿,录用率约为24%,相比前几届保持相对稳定。ICCV实施新政策强化审稿人问责制与诚信,拒29篇论文。录用的论文包括三维重建、AI安全、医学图像分割等内容。