大模型
与deepseek撞了个满怀!公众号连载文集《探秘大模型应用开发》出版了!
2025年初,DeepSeek大模型凭借超低训练成本和高推理能力迅速走红,并登顶全球苹果应用商店免费榜。然而,开发者们面对大模型开发还缺乏系统知识和最佳实践。《探秘大模型应用开发》一书通过整理归纳大量碎片化信息,帮助读者理解大模型技术,解答相关疑问。
教育部部长:AI教育白皮书将发布
教育部部长怀进鹏表示DeepSeek和机器人是教育改革与发展的重大机遇,并透露今年将发布人工智能教育白皮书。多地已展开‘AI+教育’布局,覆盖教、学、评、育等多个方面。分析师预测大模型将带来智能教育硬件及软件应用的商业化机会。
AI大模型独角兽,估值4500亿
Anthropic完成35亿美元E轮融资,估值达615亿美元,与OpenAI缩小差距;此轮融资由Lightspeed Venture Partners领投,加速下一代AI系统的开发和国际扩张。
周鸿祎谈AI大模型开闭源之争:一旦形成规模,开源必将胜出
2025年开年以来,DeepSeek凭借低成本高性能优势迅速走红,周鸿祎表示其证明了大模型从不可用阶段进阶为完全可用,终结了一拥而上的‘百模混战’局面,支持开源生态对闭源模式的超越。
我没有大模型经验,可以给个机会吗?
大模型面试经验不重要,但了解基础和好奇心加分。重点考察候选人对基础知识的理解、论文阅读能力及动手实践能力。能熟练使用不同流水算法并比较性能、实现自定义算子、掌握不同大模型 tokenizer 的差异等经历都可加分。