X-R1: 不到50元,人人都能复现0.5B Aha Moment
X-R1是基于强化学习的训练框架,目标降低R1复现门槛。通过最少成本在0.5B预训练模型上实现了‘顿悟时刻’效果,使用了更易训练的方法,并优化了数据规模和checkpoint打印。
X-R1是基于强化学习的训练框架,目标降低R1复现门槛。通过最少成本在0.5B预训练模型上实现了‘顿悟时刻’效果,使用了更易训练的方法,并优化了数据规模和checkpoint打印。
牛津大学提出Agentic Reasoning框架通过整合外部代理增强LLM推理能力,在复杂研究任务中超越现有模型,显著提高准确性和生产力。
Anthropic发布首份AI经济指数报告,分析超过400万次Claude.ai对话。主要结论包括:1. AI使用中增强型和自动化类型各占一半;2. 大多数AI使用集中在软件开发和写作任务上,且渔业和林业的人工智能应用率最低;3. 至少25%的任务依赖AI的职业比例约为36%,至少75%任务依赖AI的职业占比约4%;4.AI在高薪职业中的普及度高于低薪和高薪职位。
DeepSeek爆火,高性能低成本让企业接入AI成为必然趋势。大模型工程师等岗位年薪百万,但普通程序员正被AI替换。知乎知学堂推出大模型应用开发工程师速成计划,帮助学员掌握前沿技术、提升竞争力。
Unsloth AI 提供了 GRPO 训练算法,使用户能够在仅 7GB VRAM 上重现 DeepSeek R1-Zero 的‘顿悟时刻’,相比传统方法减少约80%的 VRAM 使用量。
OpenAI CEO Sam Altman近期频繁亮相,发文提出关于AGI的三个观察点,并强调未来将推出AI Agents,类似于虚拟同事的概念。Sam Altman还分享了三方面对AI经济学的理解。
DeepSeek R1凭借其低成本和技术创新,在市场上迅速获得了关注,特别是在Chatbot市场。尽管短期内对ToB和开发者影响有限,但未来发展方向可能走向Agent系统,并且OpenAI已经开始布局这一趋势。