
“我们看了那篇论文,心想:‘天啊,怎么我们落后了?我们之前也在做这些事情啊,’结果就是,我们的工程主管决定说:‘取消春节假期,所有人都留在公司,加班睡办公室,我们要加速开发进度。’几周之内,我们就推出了自己的版本,也就是Qwen系列模型。它非常具有竞争力”。
硬·AI
作者 | 赵雨荷
编辑 | 硬 AI
媒体报道,DeepSeek今年1月推出的低成本、功能强大的人工智能模型震惊了全球科技行业后,阿里巴巴集团的工程师们取消了假期,在春节假期期间继续工作,奋起直追,连夜加班赶进度。
阿里巴巴董事会主席蔡崇信(Joe Tsai)周三在巴黎举行的VivaTech科技大会上表示,中国充满活力的消费互联网环境,加上本地工程师之间激烈的竞争文化,正不断推动中国在AI领域的创新。
他透露,阿里巴巴是在DeepSeek发布R1模型之后,才意识到自己在AI领域已经落后了。他举例说明了中国科技行业竞争的激烈程度:
“我们看了那篇论文,心想:‘天啊,怎么我们落后了?我们之前也在做这些事情啊,’结果就是,我们的工程主管决定说:‘取消春节假期,所有人都留在公司,加班睡办公室,我们要加速开发进度。’几周之内,我们就推出了自己的版本,也就是Qwen系列模型。它非常具有竞争力”。
在那之后,阿里巴巴以极快的速度不断推出新模型,全面转向聚焦人工智能,特别是通用人工智能(AGI)。根据Hugging Face的排名,目前阿里巴巴的Qwen系列模型是全球最受欢迎的开源大型语言模型之一。公司还承诺在未来三年内投入超过3800亿元人民币(约合530亿美元),用于建设包括数据中心在内的AI基础设施。
蔡崇信还说,开源大型语言模型(LLMs)将带动人工智能应用的激增,并推动云计算需求的增长。目前,阿里巴巴正经历“一个巨大考验的时期”之后,进一步聚焦自身庞大业务帝国的重心。
他说,阿里巴巴选择将Qwen系列模型开源的原因之一,是为了推动AI应用的普及,让更多人都能使用AI,而这将有利于公司的云计算业务。
“我们从开源中获得的好处在于,它会带动对AI的需求,会产生更多的训练需求,未来我们还会看到大量推理(inference)方面的需求。”
蔡崇信今年早些时候曾表示,阿里巴巴已与苹果公司建立合作,为iPhone提供AI技术。
尽管如此,阿里巴巴在AI领域的大规模投资回报目前仍不确定,该公司2024年第一季度的销售额仅同比增长7%。
回顾自己在2023年年中重新出任阿里巴巴领导职位的经历,蔡崇信坦言,当时阿里巴巴面临多重挑战,导致阿里经历了“一个巨大的考验时期”:“我当时看到的是一家有些迷失方向的公司。我觉得我们扩张得太快了。”
作为与马云共同创办阿里巴巴的创始成员之一,尽管蔡崇信近来开始更加坦率地谈论公司所经历的困难,但同时也表达了对未来发展的乐观态度。上个月在澳门举办的一场科技大会上,他曾提到阿里巴巴经历了一系列挫折,但也强调公司“正走在一条非常好的路上”。
硬·AI
(文:硬AI)