在线教程丨Qwen3狂揽近20k star,网友实测:比Llama更快解决更难问题

HyperAI超神经上线教程,一键部署Qwen3-30B-A3B模型体验。8款混合推理模型开源,性能提升显著,GitHub获近20k stars。Qwen3-30B-A3B参数量少表现佳,迅速成为开源大模型王座。HyperAI提供免费算力福利和部署教程助力更多开发者便捷体验Qwen3的强大能力。

上交大推出首个AI智能体协议全面综述:从碎片化到互联互通的智能体网络

上海交通大学团队发布论文《A Survey of AI Agent Protocols》,提出二维分类体系和七大维度评估框架,旨在解决智能体间协议碎片化问题。该研究通过真实案例分析展示了不同协议在旅行规划中的应用差异,并对未来AI智能体协议的发展进行了展望。

R1-Zero的无监督版本来了!SFT不再是必须,EMPO重新定义大模型推理微调

本文提出Entropy Minimized Policy Optimization (EMPO)方法,旨在实现完全无监督条件下大模型推理能力的提升。该方法不需要监督微调或人工标注的答案,仅通过强化学习训练从基模型中获得策略,并利用语义相似性聚类生成的多个回答作为奖励信号,从而在数学及其他通用推理任务上取得显著性能提升。