月度归档: 2025 年 3 月
有「六小龙」还不够,杭州出手,投资智谱
智谱近期宣布获得超10亿元战略融资,并拿下千万美元海外订单,加速商业化。该模型在出海方面瞄准了一带一路国家的“国家级主权大模型”项目,并且积极开源模型以获取更多客户和开发者支持。
神级提示词:瞬间解锁DeepSeek-R1、o1、Grok 3满血模式!
文章介绍了OpenAI发布的满血版o1以及其对应的Pro套餐,强调了提示词在提升模型回答质量上的作用,并通过具体例子展示了如何利用神级提示词让推理模型Grok 3 – Think提供更深入、有深度的答案。
DeepSeek-R1 解读及技术报告中文版
MLNLP社区致力于促进国内外机器学习与自然语言处理领域的交流合作。最新研究成果《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》通过纯强化学习实现了模型推理能力的自主进化,并结合蒸馏技术实现高效迁移,显著提升了多项任务表现。
大神Karpathy更新AI科普视频,小白友好!
Andrej Karpathy 在 YouTube 上发布了一段长达 2 小时的学习视频,详细介绍了如何使用大型语言模型(LLM),涵盖模型生态系统、交互示例和多种应用场景。
LangGraph全新4大预构建Agents框架登场
LangGraph预构建Agents生态新增5个开源项目:多智能体Swarm、记忆管理库LangMem、工具调用库trustcall以及层次化多智能体系统langgraph-supervisor,支持流式处理、长期记忆管理和复杂JSON结构操作。
我没有大模型经验,可以给个机会吗?
大模型面试经验不重要,但了解基础和好奇心加分。重点考察候选人对基础知识的理解、论文阅读能力及动手实践能力。能熟练使用不同流水算法并比较性能、实现自定义算子、掌握不同大模型 tokenizer 的差异等经历都可加分。