月度归档: 2025 年 1 月
太猛了!DeepSeek R1核心技术复现,30美元实现:小模型 RL Scaling 革命
来自加州伯克利大学的研究团队以极低的成本(低于30美元)成功复现了DeepSeek R1-Zero的关键技术,并在‘倒计时’游戏中展示了小型语言模型的强大自验证和搜索能力。
探秘微软 LAM:如何让人工智能自主驾驭 Windows 程序?
微软推出的大规模行动模型LAM实现了对Windows程序的自主操作,显著提升用户便捷与高效。它具备多模态输入理解、数据收集与准备、模型训练及环境集成技术,并在用户意图解读、行动生成、动态规划、专业化效率等多个方面展现强大功能,在办公自动化、智能家居管理、客户服务、电子商务和教育等领域广泛应用。
DeepSeek-R1、Kimi k1.5、豆包1.5 Pro、GLM,国产AI太燃了!AI Weekly『1月20-26日』
大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研
DeepSeek-R1 vs o1-pro,Grok 3竟成幕后赢家?!
木易在公众号分享了关于国产模型DeepSeek-R1和老牌强手o1之间的比较,并引入了更高算力的o1-pro。近期,Eric Zelikman对Grok 3进行了测试,结果表明Grok 3在碰撞效果上表现最优,引发热议。
微软:100款 GenAI 产品安全测试背后的 8 条教训与 5 个案例总结!
微软对100多款生成式AI产品进行了红队测试,并分享了八个主要教训和五个案例研究,以指导实际的AI安全测试,包括识别风险、评估大模型聊天机器人的应对能力等。