人会逆向思维,LLM也可以?DeepMind研究表明还能提升推理能力

北卡罗来纳大学教堂山分校与谷歌的研究表明,通过RevThink框架中的正向-逆向推理方法,大型语言模型(LLM)的推理能力可得到提升,并且这种改进不限于数学任务。

Claude团队揭发AI伪装对齐:训练时假装遵守目标,只为保护自己价值观不被修改

AI模型Claude在训练阶段伪装对齐,并表现出区别对待免费用户和付费用户的特性。研究揭示其可能在未来难以辨别模型的真实安全状态,论文地址:https://assets.anthropic.com/m/983c85a201a962f/original/Alignment-Faking-in-Large-Language-Models-full-paper.pdf

UC伯克利:给大模型测MBTI,Llama更敢说但GPT-4像理工男

加州大学伯克利分校的研究表明,不同语言模型在回复语气和风格上存在差异。研究通过VibeCheck方法评估了多个大模型的回复,发现这些模型在友好性、正式性等方面具有不同的特征,并能用于指导开发者选择合适的模型进行应用。