Gemini 2.0 原生绘画能力惊艳我了,兑现了我对 GPT-4o 曾经的幻想!

MLNLP社区介绍了谷歌 Gemini 2.0系列模型的原生多模态输出能力,特别是其绘画功能。Gemini 2.0实现了文本与图像的一致生成,并通过多次对话实现复杂场景的精细调整。Gemini 2.0在保持一致性方面表现出色,可应用于电商批量生成图片、产品设计等多个领域。

大模型怎么做好角色扮演?最大的真实数据集、SoTA开源模型、最深入的评估在这里

复旦大学博士生王鑫的研究成果《CoSER: Coordinating LLM-Based Persona Simulation of Established Roles》提出了一种新的框架来改进角色扮演AI。该研究利用真实数据集和先进的评估方法,包括来自771本知名文学作品的大量角色对话,以及详细的剧情摘要和背景信息。通过给定情境表演(Given-Circumstance Acting)的方法训练模型,并在多智能体模拟和基于惩罚的LLM评判中进行评估,取得了优异的表现。