社区供稿 | 阶跃星辰 Step-Video-TI2V 图生视频模型开源,运动可控,动漫效果尤佳!
阶跃星辰近日开源了图生视频模型Step-Video-TI2V,该模型支持生成102帧、5秒、540P分辨率视频,并具备运动幅度和镜头运动可控两大特点。
阶跃星辰近日开源了图生视频模型Step-Video-TI2V,该模型支持生成102帧、5秒、540P分辨率视频,并具备运动幅度和镜头运动可控两大特点。
间进行了学习,下面是整理的课程内容
课程链接:
https://hf.co/learn/nlp-co
Hugging Face 使用基于 Git LFS 的存储方案在 GitHub Hub 上存储模型、数据集和 Spaces。Xet 团队提出了一个创新的解决方案——基于内容的分块 (CDC),通过只传输变化的数据块来提升存储效率和迭代速度,目前该技术已应用于多个仓库,并实现了数据去重。
第三篇《让LLM来评判》系列文章总结了评估模型的通用设计原则,包括清晰的任务描述、精细的评分标准、加入推理步骤和明确输出格式等。同时,也提到使用成对比较、引用参考内容及思维链等方式提升评估准确性,并探讨了奖励机制和社区机制的作用。
Ovis2是阿里巴巴提出的新型多模态大模型架构,显著提升了小规模和大规模模型的能力密度,并增强了思维链推理能力、视频处理能力和多语言OCR能力。它已在OpenCompass上展示了卓越的性能,并在多个数学推理榜单中排名前列。