“AI公司”Alibaba
阿里巴巴在2023财年第三季度的业绩显示其正成为AI领域的核心力量。公司CEO吴泳铭强调了未来三年将投入超过3800亿人民币用于云和AI基础设施建设,推动阿里云智能集团收入同比增长13%至317.42亿元,并宣布推出多项新工具和服务以支持商家和消费者。
阿里巴巴在2023财年第三季度的业绩显示其正成为AI领域的核心力量。公司CEO吴泳铭强调了未来三年将投入超过3800亿人民币用于云和AI基础设施建设,推动阿里云智能集团收入同比增长13%至317.42亿元,并宣布推出多项新工具和服务以支持商家和消费者。
阿里巴巴Qwen团队发布了深度推理模型QwQ-Max-Preview,其在数学、编程及通用任务中表现出色,并支持联网搜索和思维链展示。该模型将开源,并推出Android和iOS应用程序,促进AI技术在全球范围内的传播和应用。
DeepSeek开源周内,阿里发布了Wan2.1模型。该模型支持文生视频和图生视频任务,并且采用了宽松的Apache2.0协议。万相2.1在VBench评测中表现出色,但在文本生成、物理细节理解和变形处理等方面仍存在不足。通过采用3D时空变分自动编码器(Wan-VAE),模型能在消费级显卡上运行并优化内存使用和生成速度。
DeepSeek开源高效FP8精度矩阵乘法库DeepGEMM,支持NVIDIA Hopper架构,在密集和分组矩阵乘法下性能提升显著,使用方便,支持广泛应用场景。
大摩上调阿里巴巴评级至‘超配’,目标价从100美元上调至200美元。预计阿里云收入三年内翻倍,EBITDA利润率将提高到约35%。基于乐观预期,阿里的分拆估值为每股200美元,其中云业务估值为每股60美元,使得阿里云市值达到1400亿美元。
Ovis2是阿里巴巴提出的新型多模态大模型架构,显著提升了小规模和大规模模型的能力密度,并增强了思维链推理能力、视频处理能力和多语言OCR能力。它已在OpenCompass上展示了卓越的性能,并在多个数学推理榜单中排名前列。
从零实现DeepSeek R1的强化学习项目,探索GRPO算法的应用,仅用单个H100 GPU400步训练提升模型性能,完全自研且提供多脚本结构。