月度归档: 2025 年 1 月
逼空英伟达!DeepSeek发布Janus-Pro,附部署教程
DeepSeek发布多模态AI绘画大模型Janus-Pro,集成生成与反推功能。GitHub用户4小时完成ComfyUI节点安装,并分享使用心得及优缺点。
手把手教学:40000 元在家跑顶级DeepSeek R1的完整方案!
在家无需昂贵显卡即可运行670B参数超大规模AI模型DeepSeek R1,Hugging Face工程师Matthew Carrigan提供了详细配置指南。
清华NLP开源RAG开箱即用框架,自动适配知识库无需纠结模型选型
清华大学THUNLP团队联合东北大学NEUIR、面壁智能及9#AISoft团队推出的UltraRAG框架革新了RAG系统的开发与配置方式,提供一键式便捷操作和模块化设计,显著降低学习成本和开发周期。
“DeepSeek甚至绕过了CUDA”,论文细节再引热议,工程师灵魂提问:英伟达护城河还在吗?
英伟达新硬件优化论文《DeepSeek-V3》绕过CUDA直接使用PTX编程语言进行优化,大幅提升硬件效率。专家指出这不代表完全脱离CUDA生态,而是展示出优化其他GPU的能力,并引发了对AI是否能编写底层代码的讨论。
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏
杭州阿里云发布新春节礼大模型Qwen2.5-Max,其在多个基准测试中表现优于DeepSeek V3等模型。Qwen2.5-Max具备超大规模MoE模型特性和多模态能力展示功能。