从零开始构建大模型:GitHub超44K Star的大模型教程
2025 年以来,AI 大模型持续火热。从 DeepSeek、GPT-4 到 Gemini 2.0,各家模型参数动辄千亿级。《Build a Large Language Model (From Scratch)》通过 PyTorch 实现 LLM 架构,并涵盖 Transformer 细节与大规模预训练。
2025 年以来,AI 大模型持续火热。从 DeepSeek、GPT-4 到 Gemini 2.0,各家模型参数动辄千亿级。《Build a Large Language Model (From Scratch)》通过 PyTorch 实现 LLM 架构,并涵盖 Transformer 细节与大规模预训练。
创立两年的Lepton AI被英伟达收入囊中,贾扬清和白俊杰加入英伟达。Lepton AI专注于人工智能基础设施,通过创新技术提供低成本、灵活的GPU资源解决方案。
文章介绍了一个软件开发者对十种开源AI工具的评价,涵盖数据处理、语音技术等多方面。包括MindsDB、Ivy、Stable Diffusion WebUI、Rasa、OpenCV、MLflow、KNIME、Prefect、Evidently和Vapi等。每个项目都因其独特功能而受到赞誉,如智能应用开发、跨框架切换支持、AI生成艺术、机器学习流程管理等。
Meta AI研究副总裁Joelle Pineau宣布将于5月离职,正值扎克伯格加大AI投资之际。Pineau主导了Llama开源系列及PyTorch项目,此举引发业内对Meta战略调整和未来新作的猜测。
SpatialLM是群核科技开源的一款空间理解多模态模型,能够从普通手机拍摄的视频中重建精细3D场景,并标注房间结构、家具摆放和通道宽度等信息。其核心功能包括生成3D场景、提升机器人的空间认知能力、降低数据采集成本以及在虚拟现实中提供丰富场景支持。
MoshiVis利用7B参数的Moshi模型新增适配器参数支持讨论图像,兼容PyTorch、Rust和MLX三种后端,具备实时视觉对话能力。