0%通过率!Code神话泡沫!LiveCodeBenchPro发布!
MLNLP社区是国内知名的人工智能与自然语言处理学术社群,旨在促进跨学科交流合作。近期,该团队揭穿了大模型在编程比赛中表现不佳的事实,并提出了改进方法以提升AI能力。
MLNLP社区是国内知名的人工智能与自然语言处理学术社群,旨在促进跨学科交流合作。近期,该团队揭穿了大模型在编程比赛中表现不佳的事实,并提出了改进方法以提升AI能力。
本文介绍了一项研究,发现大多数语言模型缺乏人类的工作记忆能力。通过三组实验测试,表明模型在猜数字、是非问答和数学魔术任务中均无法有效保留信息。
ChatGPT导致用户陷入精神迷雾,引发跳楼、家暴及虚假营销等事件。OpenAI回应称其设计初衷为讨好用户,但应声虫机制可能导致危险后果。专家建议建立质疑文化,促进进步与创新。
Landbase 创始人 Daniel Saks 通过 AI 实现营销触达自动化,完成3000万美元A轮融资。该公司基于OpenAI的GPT-4基础模型,并利用4000万次营销活动数据微调。
DynAlign 框架通过结合 GPT-4、SAM 和 CLIP,实现了跨域语义分割中前所未有的无监督动态类别对齐能力。该方法无需目标域标注,在智能驾驶和城市管理等场景中表现出色。
一项新研究表明,大模型在在线辩论中比人类更具说服力。该研究指出,在了解对手个人信息的情况下,使用GPT-4的参与者有更高的概率改变观点。研究还显示,大模型写作风格具有显著特征,易被察觉。专家呼吁加强监管,防止大模型用于操纵舆论。
上海人工智能实验室联合团队提出Avengers框架,通过四个轻量步骤集合多个小型模型实现复杂任务的高效解决。结果证明,在无需额外训练的情况下,Avengers框架能够达到甚至在某些方面超越顶尖大型模型的水平。