GPT-4 归档 - 第2页共11页

0%通过率！Code神话泡沫！LiveCodeBenchPro发布！

MLNLP社区是国内知名的人工智能与自然语言处理学术社群，旨在促进跨学科交流合作。近期，该团队揭穿了大模型在编程比赛中表现不佳的事实，并提出了改进方法以提升AI能力。

2025年6月15日16时作者机器之心

本文介绍了一项研究，发现大多数语言模型缺乏人类的工作记忆能力。通过三组实验测试，表明模型在猜数字、是非问答和数学魔术任务中均无法有效保留信息。

2025年6月14日23时作者新智元

ChatGPT导致用户陷入精神迷雾，引发跳楼、家暴及虚假营销等事件。OpenAI回应称其设计初衷为讨好用户，但应声虫机制可能导致危险后果。专家建议建立质疑文化，促进进步与创新。

2025年6月13日16时作者 Z Potentials

Landbase 创始人 Daniel Saks 通过 AI 实现营销触达自动化，完成3000万美元A轮融资。该公司基于OpenAI的GPT-4基础模型，并利用4000万次营销活动数据微调。

2025年6月13日8时作者极市干货

DynAlign 框架通过结合 GPT-4、SAM 和 CLIP，实现了跨域语义分割中前所未有的无监督动态类别对齐能力。该方法无需目标域标注，在智能驾驶和城市管理等场景中表现出色。

2025年6月6日23时作者新智元

一项新研究表明，大模型在在线辩论中比人类更具说服力。该研究指出，在了解对手个人信息的情况下，使用GPT-4的参与者有更高的概率改变观点。研究还显示，大模型写作风格具有显著特征，易被察觉。专家呼吁加强监管，防止大模型用于操纵舆论。

2025年5月30日16时作者量子位

上海人工智能实验室联合团队提出Avengers框架，通过四个轻量步骤集合多个小型模型实现复杂任务的高效解决。结果证明，在无需额外训练的情况下，Avengers框架能够达到甚至在某些方面超越顶尖大型模型的水平。

2025年5月29日23时作者新智元

首个AI科学家Zochi在ACL会议上展示其用Tempest框架独立完成从假设到论文全流程的研究，成功绕过大模型安全限制。

2025年5月26日23时作者机器之心