AI寒武纪
OpenAI 首席研究 Mark Chen :DeepSeek独立发现了o1 核心理念,然而市场反应过度
国产 AI 新锐 DeepSeek(深度求索)发布 o1 级别推理模型R1,引发硅谷与全球关注。OpenAI首席研究 Mark Chen 对其表示肯定但态度微妙,强调成本控制和蒸馏技术优势。DeepSeek前实习生 Zihan Wang 回应认为 OpenAI 有保守倾向,质疑开源政策。
太卷了!阿里千问送新年大礼:Qwen2.5-VL视觉模型免费体验,解锁无限视觉智能
阿里千问家族迎来了新的旗舰级成员Qwen2.5-VL,重点提升视觉理解、智能体能力和长视频理解能力。亮点包括精准图像识别、智能交互与任务完成、长时间视频内容理解和结构化数据输出等。
不过年?DeepSeek继续整活,推出统一多模态理解与生成模型
DeepSeek发布的新多模态模型Janus-Pro-7B在GenEval和DPG-Bench基准测试中击败了OpenAI的DALL-E 3和Stable Diffusion,其解耦视觉编码框架带来灵活性、性能提升和简洁高效的优势。
接棒DeepSeek!阿里千问宣布开源百万Token上下文模型:主打闪电般的推理「附送详细技术报告」
阿里通义千问团队推出Qwen2.5-1M开源模型,支持百万Token上下文长度,并带来闪电般快速的推理框架。
太猛了!DeepSeek R1核心技术复现,30美元实现:小模型 RL Scaling 革命
来自加州伯克利大学的研究团队以极低的成本(低于30美元)成功复现了DeepSeek R1-Zero的关键技术,并在‘倒计时’游戏中展示了小型语言模型的强大自验证和搜索能力。
DeepSeek R1 彻底出圈:震动整个AI行业,高强度刷爆社媒,赞誉,恐慌,破防,八卦全都来了
权威基准测试中,DeepSeek R1综合排名第3,并且在多个技术领域表现出色。此外,R1还被评为人类最后的考试排名第二,引起Meta恐慌。
Andrej Karpathy泼冷水:智能体爆发并非近在眼前,还需十年
Andrej Karpathy认为OpenAI的Operator项目类似于数字世界的’人形机器人’,预言未来十年将是智能体(Agent)发展的时代。尽管存在挑战,Karpathy仍对智能体充满信心,并描述了其未来的发展蓝图。
突发!OpenAI 刚刚发布代理Operator:AI进入Level 3,但只有美国Pro用户可以试用
OpenAI 推出名为Operator的研究预览版代理,能够像人类一样浏览网页并执行各种在线任务。这款工具结合了GPT-4o的视觉能力和强化学习,支持WebArena和WebVoyager基准测试领先水平。它具备自我纠错能力,并且允许用户个性化工作流程。OpenAI计划将其公开于API中并扩大访问权限。
字节清华开源力作!UI-TARS原生AI智能体,人人都能拥有“智能助手”
字节联合清华发布的UI-TARS AI Agent纯视觉感知、端到端架构及系统2推理能力使其成为通用GUI自动化新突破。多项硬核数据验证其性能超越Claude和GPT-4等现有模型。