月度归档: 2025 年 6 月
unsloth制作了一份关于大模型强化学习的完整指南
Unsloth发布了关于大模型强化学习的完整指南,涵盖目标、关键作用及在AI代理中的应用等内容,并提供了GRPO、RLHF、DPO和奖励函数的相关信息。
斩获 32.9K 标星的内网穿透神器!图形化操作碾压命令行,轻量高性能,全协议通吃!
一款简单易用的内网穿透神器nps支持多种协议,通过Web界面管理客户端和隧道配置。适合开发者、居家用户、企业IT及自由职业者等需求。
干货的一天 -【MCP协议驱动的AI新范式】峰会活动精彩回顾
2025年6月14日AIGC开放社区与微软Reactor联合主办的‘MCP协议驱动的AI新范式’峰会在上海成功举行,多位专家分享了MCP协议在技术、商业落地及生态建设中的应用价值。
Karpathy最新分享!给大模型做好“服务”将是巨大机会
近日,Karpathy 在演讲中提出软件演进分为1.0、2.0和3.0时代。其中,3.0时代通过大语言模型(LLM)实现了编程的新方式。他指出LLM的本质类似于一个全新的操作系统,并强调了理解和利用其特长和局限性的重要性。同时,Karpathy也指出了AI时代的两大机遇:部分自主应用和构建针对智能体友好的工具。