刚刚,OpenAI元老级研究员Alec Radford离职,他主导了GPT-1、GPT-2的研发
OpenAI元老级人物Alec Radford即将离职进行独立研究,他在初代GPT、GPT-2及GPT-3等项目中均发挥重要作用。
OpenAI元老级人物Alec Radford即将离职进行独立研究,他在初代GPT、GPT-2及GPT-3等项目中均发挥重要作用。
研究团队提出MARVEL数据集来评估多模态大语言模型的抽象视觉推理能力,该数据集中包含了770个高质量测试样例,并覆盖了六种核心知识模式、多样化的几何和抽象形状输入以及五种不同的任务配置方式。实验结果显示大多数模型在MARVEL上的表现接近随机水平,揭示出模型的视觉感知能力是提升其抽象视觉推理的关键瓶颈。
AIxiv专栏介绍了西湖大学研究团队提出的StyleStudio,它解决文本驱动的风格迁移中的内容泄漏和不可控的问题。论文提出了跨模态自适应实例正则化技术、基于风格图像的无分类器生成引导以及引入教师模型稳定图像生成三个贡献。实验显示其在文本对齐能力和布局稳定性方面优于现有方法。