对话阶跃星辰创始人姜大昕:多模态模型还没出现GPT-4时刻,坚持追求「智能上限」
AI 大模型领域竞争激烈,阶跃星辰专注于多模态模型研发。创始人姜大昕认为 AGI 追求智能上限是当务之急,并描绘了模型三步曲演进路线。
AI 大模型领域竞争激烈,阶跃星辰专注于多模态模型研发。创始人姜大昕认为 AGI 追求智能上限是当务之急,并描绘了模型三步曲演进路线。
阶跃星辰创始人姜大昕详解多模态模型在AGI实现中的重要性及技术路径。他指出多模态是实现AGI的必经之路,并强调了多模态理解生成一体化的关键作用。目前多模态模型仍处于探索期,尚未出现像语言模型界的Transformer一样的可拓展架构。姜大昕还介绍了阶跃星辰在智能终端Agent、机器人等领域的应用策略及对未来技术演进路线的看法。
阶跃星辰在北京举行媒体沟通会,预计发布满血版推理模型Step R1及先进图片编辑模型。创始人姜大昕强调多模理解生成一体化是建立世界模型的最佳路径,未来将聚焦智能终端Agent和AGI方向。
上海徐汇已汇聚七家AI标杆企业,构建技术研发、场景落地和产业协同创新生态。这些企业在模型能力提升、应用推广和技术商业化等方面发挥作用,推动人工智能发展,并通过高质量孵化器吸引顶尖企业和人才,助力建设全国人工智能高地。
国内AI团队推出Step1X-Edit图像编辑框架,具备自然语言指令进行复杂图像编辑的能力,性能接近OpenAI的GPT-4。
阶跃星辰开源图像编辑模型Step1X-Edit,支持文字替换、风格迁移等多种指令,实现多语言能力,性能超越GPT-4o等闭源模型。
阶跃星辰发布开源图像编辑模型 Step1X-Edit,参数量为19B,在多种真实用户指令上达到SOTA水平,并实现了多模态语言理解与扩散图像生成的深度融合。
阶跃星辰近日开源了图生视频模型Step-Video-TI2V,该模型支持生成102帧、5秒、540P分辨率视频,并具备运动幅度和镜头运动可控两大特点。
3月10日,《做多中国行》上市公司行走进上海徐汇的阶跃星辰/财跃星辰。活动吸引超过30名投资者参与,双方介绍大模型应用及生态合作。阶跃星辰发布11款多模态大模型,涵盖语音识别、图像生成等,包括全球参数量最大的开源视频生成模型和业内首款产品级开源语音交互模型。