超CLIP准确率11%!伯克利港大阐明「LLM文本-视觉」对齐深层机制

新智元报道
UC伯克利和香港大学团队的新工作LIFT首次系统性地剖析了冻结大语言模型作为文本编码器在多模态对齐中的优势来源、数据适配性和关键设计选择,显著提升了组合语义理解能力和长文本处理效果。

老黄预言成真!全球首个AI原生游戏引擎,一句话秒出GTA级神作

全球首款AI原生UGC游戏引擎Mirage由顶尖机构联合打造,通过实时交互式’世界模型’和先进的扩散模型技术,支持玩家即时生成和控制游戏内容。它打破了传统预设游戏的限制,允许用户按照自己的想象扩展游戏世界。