新智元
你永远叫不醒装睡的大模型!多轮对话全军覆没,性能暴跌39%
研究人员进行了一项超过20万次的模拟实验,评估了多个大语言模型在单轮和多轮对话中的性能差异。结果显示大多数模型在多轮对话中表现下降,这被称为‘对话迷失’现象。
高考第一天,用豆包修图3.0花式「整活」送祝福,已原地笑翻!
新智元报道编辑:XZH
豆包最新版智能修图功能进化至3.0时代,仅需一句指令便能精准生成各种图片效果,从高考祝福到古画风格迁移无所不能,堪称AI修图领域的重大突破。
AI辩论能力碾压人类,81.7%概率让你信服!研究登Nature子刊
一项新研究表明,大模型在在线辩论中比人类更具说服力。该研究指出,在了解对手个人信息的情况下,使用GPT-4的参与者有更高的概率改变观点。研究还显示,大模型写作风格具有显著特征,易被察觉。专家呼吁加强监管,防止大模型用于操纵舆论。