阶跃星辰 Tech Fellow 段楠:Step-Video 系列模型的关键技术解读

4 月 18-19 日,由 CSDN&Boolan 联合举办的「2025 全球机器学习技术大会」将在上海虹桥西郊庄园丽笙大酒店隆重举行,云集多位重量级嘉宾分享前沿议题。段楠博士将详解多模态大模型进展,并深入剖析 Step-Video-T2V 和 Step-Audio 模型的最新成果和挑战,为参会者提供宝贵见解。

财联社《做多中国行》走进阶跃星辰 实地探访AI大模型独角兽

3月10日,《做多中国行》上市公司行走进上海徐汇的阶跃星辰/财跃星辰。活动吸引超过30名投资者参与,双方介绍大模型应用及生态合作。阶跃星辰发布11款多模态大模型,涵盖语音识别、图像生成等,包括全球参数量最大的开源视频生成模型和业内首款产品级开源语音交互模型。

Phi 4 Multimodal:微软开源的多模态大模型,支持音频、视觉和文本处理

微软开源的多模态大模型Phi 4 Multimodal,在OpenASR排行榜上排名第一,性能卓越;支持音频、视觉和文本处理。亮点包括使用LoRAs混合技术添加模态适配器等。参数量达38亿的Phi-4-Mini版本已发布。

速递|英伟达支持的机器人初创Field估值200美金,已有数百万美元收入

机器人初创公司 Field AI 正在与投资者洽谈,以 20 亿美元的估值筹集资金。该公司已开始通过销售专业模型产生数百万美元的收入,这些模型指导其他供应商的机器人执行各种任务。

最大参数 300 亿!阶跃星辰与吉利联合开源两款多模态大模型

吉利汽车集团与阶跃星辰联合宣布,将Step系列多模态大模型向全球开发者开源。包括参数量最大的视频生成模型和首款语音交互大模型。阶跃Step-Video-T2V可直接生成高质量视频,而阶跃Step-Audio是业内首个产品级的开源语音交互模型。