大型语言模型归档 - 第3页共13页

必看！Andrej Karpathy 昨天在 YC 的旧金山创业大会 40 分钟的演讲，全是干货，文末附资料！

2025年6月20日11时作者 GitHubStore

Andrej Karpathy 在 YC 的旧金山创业大会上分享了关于 AI 时代软件开发的新范式。他定义了从传统代码到神经网络权重再到大型语言模型（LLMs）的发展路径，讨论了 LLMs 的超能力和认知缺陷，并介绍了如何通过应用如 Cursor 实现部分自主应用来优化用户体验。

2025年6月19日8时作者机器之心

s（如 GPT-4、Claude、Gemini 等）在代码生成领域取得了显著进展。它们不仅在经典编程

2025年6月18日16时作者 AI前线

g）掀起了一场疯狂的 AI 人才争夺战。据外媒报道，扎克伯格正在为 Meta 新成立的超级智能团队招

2025年6月15日16时作者机器之心

本文介绍了一项研究，发现大多数语言模型缺乏人类的工作记忆能力。通过三组实验测试，表明模型在猜数字、是非问答和数学魔术任务中均无法有效保留信息。