香港城市大学归档

数据减少超千倍，500 美金就可训练一流视频模型，港城、华为Pusa来了

2025年6月19日11时作者机器之心

FVDM & Pusa 提出了一种新的视频扩散模型 (FVDM)，通过引入向量化时间步变量 (VTV) 解决了传统视频生成的局限性。Pusa 项目利用非破坏性微调方法将预训练模型成本降低了数倍，展示了低成本、高灵活视频生成的新时代。

2025年5月29日16时作者量子位

腾讯ARC Lab和香港城市大学推出的新Benchmark Video-Holmes，通过复杂视频推理任务测试大模型能力。结果显示所有主流大模型在SR、IMC等指标上均不及格。Video-Holmes规避了现有基准的简单问题限制，强调多线索信息的整合与分析能力。

MLNLP社区举办学术Talk，邀请香港城市大学潘文博分享大模型安全对齐的研究成果，揭示其内部机制由多个维度控制，主持人王鹏介绍相关背景知识。

2025年4月11日16时作者量子位

THEMIS团队提出水印保护框架THEMIS，用于解决移动端AI模型部署后的安全问题，包括模型提取与盗窃、知识产权侵犯等问题。该框架通过自动工具实现加密模型的精准提取和只读模型的写入能力，并提出FFKEW算法进行高效水印嵌入，展示了在多种应用场景下的有效性。

2024年12月15日20时2024年11月22日13时作者机器之心

研究团队提出了首个世界轨迹基础大模型 UniTraj，克服了现有方法的局限性，实现了跨任务、跨区域的泛化能力，并在不同数据质量下保持鲁棒性。