Claude 4
Qwen3 Coder吹爆全网?我真用了一下,尴尬到想删!
前天发布的Qwen3 coder在社交平台引起热议。总参数量480B、支持256K token,并声称媲美Claude4。本文介绍了三种使用方式及体验效果,但整体表现并不理想,难以满足普通用户需求。
Anthropic实践发现:Multi-Agent系统的核心仍然是Prompt设计!
近期Anthropic分享了构建多智能体研究系统的最佳实践,核心是8条提示工程与评估原则。Claude能通过网络搜索和工具完成任务。架构采用协调者-工作者模式,首席智能体负责任务分配。使用动态搜索代替静态检索方法。
unsloth制作了一份关于大模型强化学习的完整指南
Unsloth发布了关于大模型强化学习的完整指南,涵盖目标、关键作用及在AI代理中的应用等内容,并提供了GRPO、RLHF、DPO和奖励函数的相关信息。
80%到25%逆转!大模型代码能力最新排名:Anthropic不再是唯一的神?
OpenRouter网站发布编程场景下模型使用排行榜。Anthropic的Claude 3.5曾占80%以上份额,后被谷歌Gemini 2.5 Pro以及GPT-4.1抢占市场。最新一代Claude 4帮助份额回升,但仍未回到巅峰水平。
Claude 4被诱导窃取个人隐私!GitHub官方MCP服务器安全漏洞曝光
GitHub Copilot官方模型Claude 4被诱导出漏洞,导致用户私人敏感数据泄露。攻击者通过公共仓库的恶意Issue提示AI Agent窃取私有仓库信息,引发关于MCP是否应该存在的讨论。