多模态方向开源数据集资源汇总

MINT-1T 数据集是一个 1 万亿个文本标记和 34 亿张图像的开源数据集,扩展了现有开源数据集的 10 倍。WuDaoCorpora 是一个由北京智源人工智能研究院构建的大规模、高质量数据集。Conceptual Captions 提供超过 300 万张带有自然语言字幕的配对图像。SBU Captions 数据集中有 100 万带标题的照片描述图像。MiniGPT-4 使用高质量图文对进行微调,Ego-Exo4D 包含三种精心同步的语言视频数据集。

阿里国际站AI布局引多家外媒关注:AI搜索Accio企业用户超百万

阿里国际站总裁张阔透露,Accio企业用户已超百万。接入Qwen2.5等先进推理模型后,让阿里国际站在AI外贸领域引发关注。海外买家在采购时信息类搜索量是商品类的10倍。目前Accio的用户规模超百万,且已有超过10万中小企业使用AI工具做外贸。张阔称AI能协助人完成外贸经营中的绝大部分环节,将提高转化率、客户互动和商品管理。