多模态
字节开源多模态理解与生成统一模型,对视觉的理解到达开源顶峰,AI图片编辑能力超强。
字节跳动开源多模态模型BAGEL,支持图像生成、修改及动态变化理解。具备聊天、生成图片、编辑图片、风格转换和导航等能力。
阶跃星辰CEO姜大昕谈大模型最新技术趋势
阶跃星辰CEO姜大昕认为多模态是实现AGI的必经之路,并坚持全线布局。公司发布22款自研基座模型,平均每月发布一款基础大模型,因此被称为‘多模态卷王’。目前其覆盖文字、语音、图像、视频、音乐等全系列,其中16款为多模态模型。姜大昕强调了多模态在应用中的重要性,并指出智能终端Agent是其发力方向。