200多行代码,超低成本复现DeepSeek R1「Aha Moment」!复旦大学开源
复旦大学知识工场实验室团队基于 GRPO 算法高效复现了 R1-zero 自发反思能力,项目代码简洁,仅依赖基础库实现,训练 7B 模型成本低至 7.3 元。
news
复旦大学知识工场实验室团队基于 GRPO 算法高效复现了 R1-zero 自发反思能力,项目代码简洁,仅依赖基础库实现,训练 7B 模型成本低至 7.3 元。
多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,
专注AIGC领域的专业社区报道了OpenAI首席执行官Sam Altman对GPT-4.5试用感受极佳的消息,并关注马斯克即将发布的Gork3。
Ilya Sutskever 的创业公司 Safe SuperIntelligence(SSI)正洽谈超过10亿美元融资,估值将超过300亿美元。这家神秘企业由前苹果和OpenAI高管创立,专注于开发安全超级人工智能。
专注于AIGC领域的专业社区分享了Adobe发布的全新生成式AI应用Adobe Firefly。它支持图像、矢量图形及视频生成功能,并且首次推出处于公测试阶段的文生视频模型,实现了从文本提示到高质量1080p视频的转化。