强化学习
专注于强化学习(RL)提升大语言模型(LLM)推理能力的资源库
Awesome-RL-based-LLM-Reasoning 是一个专注于提升大语言模型推理能力的资源库,汇集了最新的相关论文、幻灯片和开源项目,涵盖多种RL方法和LLM推理优化技巧。
刚刚,马斯克发布Grok-3,反击DeepSeek、OpenAI
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言等大模型的发展和应用落地。马斯克旗下xAI发布最新大模型Gork3,性能远超OpenAI的LLM,展示了深度学习与强化学习结合的应用。
DeepSeek重塑国内 AI 新秩序:打脸的百度与尴尬的“六小龙”
百度接入DeepSeek打破闭源路线,腾讯跟进接入微信。阿里开源模式加持。DeepSeek带来行业重塑,各家大厂纷纷调整策略应对冲击。
热议:为什么 DeepSeek 出来后,国产其他大模型的集体失声了,以前都号称很强的?
MLNLP是国内外知名的人工智能社区,致力于推动自然语言处理与机器学习领域的交流与发展。2025年出现的DeepSeek模型通过技术革新颠覆了行业现状,展示了技术实力和成本优势。
王炸组合:微信接入满血DeepSeek R1,背后的Agentic RAG技术~
微信灰度接入DeepSeek R1,支持更全面的回答。DeeSeek-R1采用Agentic RAG方式接入,可以设计通用AI Agentic框架,并结合官方Prompt和搜索接入实现。