大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效率提升,AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。
关于AI Weekly
马化腾谈及AI时说:“我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇,所以我们觉得非常重要。”
AI Weekly回来了!

“AI Weekly”是AI领域的前沿资讯周报,每周与你相约,精心筛选并总结过去一周内AI领域最重要、最具影响力的事件。这个专栏致力于打破信息壁垒,帮助你高效掌握最新动态,增强对AI技术及应用趋势的洞察力。
省流版摘要
-
DeepSeek发布6710亿参数模型DeepSeek-V3:DeepSeek宣布开源专家混合模型
DeepSeek-V3
,具备6710亿参数,激活参数370亿,在算法代码和数学推理等领域表现媲美GPT-4o
。 -
智谱开源智能体基座模型CogAgent-9B:智谱发布GLM-PC基座模型
CogAgent-9B
,支持屏幕截图任务预测,在多项数据集测试中表现优异,进一步提升了智能体任务能力。 -
阶跃星辰推出Step-1X-Medium模型:阶跃星辰发布增强型AI图像模型
Step-1X-Medium
,生成速度提升30%,新增“图生图”功能,并强化了中国风内容创作能力。 -
阿里通义千问开源视觉推理模型QVQ-72B-Preview:阿里发布
QVQ-72B-Preview
视觉推理模型,在多模态任务和数学基准测试中表现出色,但仍需优化语言混合与递归推理能力。 -
马斯克xAI完成60亿美元C轮融资:xAI获得60亿美元融资,估值超400亿美元,投资方包括英伟达、AMD及多家知名机构,资金将用于基础设施建设与AI技术研发。
-
AI编程助手Cursor融资1亿美元,估值飙升至26亿美元:Cursor完成B轮融资,由Thrive Capital领投,估值从4月的4亿美元增至26亿美元,其AI工具被广泛应用于代码自动补全和重写任务。
1. DeepSeek发布671B参数开源模型DeepSeek-V3
本周最靓的仔必须是DeepSeek。
12月26日,AI初创公司DeepSeek宣布开源其最新专家混合(MoE)模型DeepSeek-V3
。该模型拥有671B(6710亿)参数,激活参数为37B(370亿),并在14.8万亿个token上进行了预训练。

DeepSeek-V3
在算法代码、数学推理等领域的表现超越了多个现有开源模型,性能可媲美GPT-4o
和Claude-3.5-Sonnet
等顶尖闭源模型。同时,该模型支持原生FP8权重开源,并提供BF16转换脚本,方便开发者进行适配和应用。
2. 智谱开源GLM-PC基座模型CogAgent-9B
智谱AI于12月26日宣布开源其GLM-PC基座模型CogAgent-9B-20241220
。该模型基于GLM-4V-9B
训练,专为智能体(Agent)任务设计。CogAgent-9B
仅需屏幕截图作为输入(无需HTML等文本表征),即可根据用户指定的任务,结合历史操作,预测下一步的GUI操作。

与2023年12月开源的第一版CogAgent模型相比,CogAgent-9B
在GUI感知、推理预测准确性、动作空间完善性、任务普适性和泛化性等方面均有提升,并支持中英文双语的屏幕截图和语言交互。在Screenspot、OmniAct、CogAgentBench-basic-cn和OSWorld等数据集上的测试结果显示,CogAgent-9B在多个数据集上取得了领先的成绩。
3. 阶跃星辰发布Step-1X-Medium模型
12月25日,阶跃星辰宣布推出增强型AI图像模型Step-1X-Medium
。该模型基于MMDit架构,生成速度提升超过30%,并通过针对性训练,增强了对用户指令的理解能力和图文一致性,生成的画面细节更加自然。

此外,Step-1X-Medium
新增了“图生图”功能,允许用户上传基础图片,并通过简单的指令对原图进行细节增强、风格迁移或局部修改。该模型还对中国风内容的创作能力进行了升级,能够更好地捕捉东方面孔的神韵,呈现高级、细腻的画面质感。
4. 阿里通义千问开源视觉推理模型QVQ-72B-Preview
12月25日,阿里巴巴通义千问团队发布了QVQ-72B-Preview
,这是一个基于Qwen2-VL-72B
构建的开源多模态推理模型,旨在提升AI在视觉理解和复杂问题解决方面的能力。

在多项评测中,QVQ-72B-Preview
表现出色:在MMMU评测中取得了70.3的高分,超越了Qwen2-VL-72B-Instruct
;在MathVista等数学相关基准测试中也有显著提升。尽管如此,团队指出模型仍存在语言混合与切换、递归推理等局限性,需进一步优化。
5. xAI完成60亿美元C轮融资,估值超400亿美元
埃隆·马斯克创立的人工智能公司xAI宣布完成60亿美元的C轮融资,估值从半年前的240亿美元跃升至超过400亿美元。本轮融资吸引了包括A16Z、贝莱德、富达管理与研究公司、红杉资本、摩根士丹利等知名投资机构,以及GPU巨头英伟达和AMD在内的多方参与。

xAI表示,此次融资将用于加速先进基础设施建设,推出面向数十亿用户的突破性产品,并推进未来技术的研发。公司计划通过这笔资金进一步提升其AI模型能力,强化竞争优势,并实现“探索宇宙真实本质”的使命。
6. AI编程助手Cursor完成1亿美元融资,估值飙升至26亿美元
人工智能编程助手Cursor的开发公司Anysphere近期完成了1亿美元的B轮融资,投后估值达到26亿美元。本轮融资由老股东Thrive Capital领投,Andreessen Horowitz(a16z)等也参与其中。值得注意的是,Anysphere在四个月前的A轮融资中估值为4亿美元,此次估值在短时间内实现了6.5倍的增长。

Cursor是一款AI驱动的编程助手,旨在通过代码自动补全和重写功能提升开发者的编程效率。自推出以来,Cursor在开发者中获得了广泛认可,其年化经常性收入(ARR)从今年4月的400万美元增长到10月的每月400万美元。目前,包括OpenAI、Midjourney、Shopify等公司在内的多家企业已开始使用Cursor来辅助开发工作。
(文:AI信息Gap)