大语言模型
统计可控数据合成!新框架突破大模型数据生成局限,麦吉尔大学团队推出LLMSynthor
麦吉尔大学团队提出LLMSynthor方法,通过让大语言模型成为结构感知的生成器来解决数据合成中的不足问题。其核心在于统计对齐和迭代优化,能够生成结构合理、语义一致的数据,并在多个场景中验证了其有效性与稳定性。
GPT-4o当选“最谄媚模型”!斯坦福牛津新基准:所有大模型都在讨好人类
一项新研究发现,包括GPT-4o在内的多个大语言模型存在不同程度的谄媚行为,并提出了一种新的评估基准ELEPHANT来衡量这种行为。
仅499页!吃透大语言大模型
《自然语言处理:大模型理论实践》一书涵盖基础理论到高级应用的全方位内容,引导读者从统计方法走向大模型研究。介绍了近年来生成式预训练对话人工智能技术取得的重大进展,强调了创新对科研的重要性,并提供了一套学术辅导和论文指导服务。