接棒DeepSeek!阿里千问宣布开源百万Token上下文模型:主打闪电般的推理「附送详细技术报告」
阿里通义千问团队推出Qwen2.5-1M开源模型,支持百万Token上下文长度,并带来闪电般快速的推理框架。
阿里通义千问团队推出Qwen2.5-1M开源模型,支持百万Token上下文长度,并带来闪电般快速的推理框架。
来自加州伯克利大学的研究团队以极低的成本(低于30美元)成功复现了DeepSeek R1-Zero的关键技术,并在‘倒计时’游戏中展示了小型语言模型的强大自验证和搜索能力。
大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研
木易在公众号分享了关于国产模型DeepSeek-R1和老牌强手o1之间的比较,并引入了更高算力的o1-pro。近期,Eric Zelikman对Grok 3进行了测试,结果表明Grok 3在碰撞效果上表现最优,引发热议。
权威基准测试中,DeepSeek R1综合排名第3,并且在多个技术领域表现出色。此外,R1还被评为人类最后的考试排名第二,引起Meta恐慌。
木易创建了‘AI信息Gap’公众号,专注于分享AI知识。2025年1月,小红书因用户激增和TikTok禁令引发流量爆发,并被网友戏称为‘洋悟运动’。DeepSeek发布新模型后引起广泛关注并决定开源。文章认为这体现了中国科技的崛起与开放精神。
ElevenLabs,一家专注于合成语音技术的初创公司,在短短一年内完成了2.5亿美元C轮融资,估值在30亿到33亿美元之间。该公司致力于开发AI语音克隆和配音工具,并且已经与多家知名企业合作。
Andrej Karpathy认为OpenAI的Operator项目类似于数字世界的’人形机器人’,预言未来十年将是智能体(Agent)发展的时代。尽管存在挑战,Karpathy仍对智能体充满信心,并描述了其未来的发展蓝图。