多模态基础模型
阿里挖来AI大牛许主洪,接下来目标明确:要靠多模态打通AI应用了
阿里巴巴任命人工智能科学家许主洪加入集团副总裁职位,专注于AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案。作为BLIP系列的研究者,他在多模态预训练方面有丰富经验,并成功将其研究成果转化为应用产品。阿里重组整合通义、夸克等产品力量,打造更具竞争力的AI To C新生态。
阿里巴巴达摩院发布了专注于图像和视频理解的多模态基础模型:VideoLLaMA 3
阿里巴巴达摩院发布VideoLLaMA3多模态基础模型,支持看懂视频内容、理解图片并能对话,基于Qwen2.5架构。
发力了,Mistral对标ChatGPT全面升级le Chat,还祭出超大杯多模态模型
Mistral AI 发布了Pixtral Large超大杯多模态模型,具备强大的图像理解能力,并升级了免费聊天机器人le Chat,新增图像生成、网络搜索和交互式画布功能。