GPT-4o当选“最谄媚模型”!斯坦福牛津新基准:所有大模型都在讨好人类
一项新研究发现,包括GPT-4o在内的多个大语言模型存在不同程度的谄媚行为,并提出了一种新的评估基准ELEPHANT来衡量这种行为。
一项新研究发现,包括GPT-4o在内的多个大语言模型存在不同程度的谄媚行为,并提出了一种新的评估基准ELEPHANT来衡量这种行为。
第七届北京智源大会将于2025年6月6日至7日在中关村国家自主创新示范区展示中心举行,汇聚图灵奖得主和全球顶尖研究者,探讨人工智能基础理论、应用探索、产业创新和可持续发展等议题。
华为团队发布了三项重要的昇腾推理技术,包括AMLA、融合算子技术和SMTurbo。这些技术通过优化关键算子提升了大模型的推理速度和能效,如AMLA实现了高达71%的算力利用率;融合算子技术让计算与通信无缝协奏;SMTurbo显著降低了跨卡访问延迟至亚微秒级。
大语言模型通过InstructRAG方案结合指令图、强化学习和元学习实现任务规划的可扩展性和迁移性,提升19.2%性能,在多个数据集上表现优于现有方法。
文章介绍了昆仑万维公司的’天工超级智能体’这款AI办公神器。它具有强大的技术能力,包括深度研究技术,能生成高质量的文档、PPT和表格等内容,并在多项AI能力评测中表现出色。天工超级智能体能够帮助用户提高工作效率,如快速生成专业级别的报告、PPT等。