嵌入归档 - 每时AI

怎么学习设计和训练一个大模型——也就是神经网络？

2025年1月13日14时作者 AI探索时代

设计大模型需要先从技术点切入。建议初学者选择合适的工具（如PyTorch框架）和理论（如Transformer架构），专注于学习一种技术方向，并逐步理解其核心思想。

2025年1月6日14时作者 AI探索时代

嵌入和向量化都是将数据转化为向量的过程，但嵌入更注重保留语义关系并能通过学习捕捉深层关系；向量化则侧重直接性，不需学习，通常基于规则或统计生成稀疏向量。二者可以结合使用以优化表示质量。

2024年11月25日14时作者机器之心

Meta 部门总监用小学数学解释大模型原理，博主分享了构建LLM的方法和基础概念。