一键部署 gpt-oss-20b,实测开源推理模型新 SOTA,性能直逼 o3‑mini
OpenAI 开源了两个大模型 gpt-oss-120b 和 gpt-oss-20b,前者适合复杂推理和知识密集型场景,后者适用于低延迟、本地或专业垂直领域。gpt-oss-120b 性能媲美 OpenAI o4-mini,gpt-oss-20b 也接近 o3-mini 的表现。HyperAI超神经提供了部署 gpt-oss-20b 的教程,并分享了模型在实际任务中的测试结果。
OpenAI 开源了两个大模型 gpt-oss-120b 和 gpt-oss-20b,前者适合复杂推理和知识密集型场景,后者适用于低延迟、本地或专业垂直领域。gpt-oss-120b 性能媲美 OpenAI o4-mini,gpt-oss-20b 也接近 o3-mini 的表现。HyperAI超神经提供了部署 gpt-oss-20b 的教程,并分享了模型在实际任务中的测试结果。
佐治亚理工团队提出AFOG,一种基于可学习注意力机制的对抗性攻击方法,成功提升大型目标检测Transformer模型攻击成功率最高达83%,同时扰动更小、更难察觉。
5
框架,通过引入
结构化隐空间
和
增强扩散训练
两大关键技术,在保持高生成质量的同时,大幅加快扩
北大团队发表综述《Towards Efficient Privacy-Preserving Machine Learning》,系统梳理隐私保护机器学习领域的协议、模型和系统优化,提出跨层次协同设计与优化的重要性。
Anthropic发布新模型Claude Opus 4.1,相比前一代在智能体任务、真实世界编程和推理能力上有所提升。Claude Opus 4.1现已面向多个用户开放使用,并提供了详细的API定价信息。