学术
在线教程丨Qwen3狂揽近20k star,网友实测:比Llama更快解决更难问题
HyperAI超神经上线教程,一键部署Qwen3-30B-A3B模型体验。8款混合推理模型开源,性能提升显著,GitHub获近20k stars。Qwen3-30B-A3B参数量少表现佳,迅速成为开源大模型王座。HyperAI提供免费算力福利和部署教程助力更多开发者便捷体验Qwen3的强大能力。
CVPR Oral 南京大学李武军教授课题组推出分布式训练算法UniAP,大模型训练最高加速3.8倍
为参与作者。
训练成本高昂已经成为大模型和人工智能可持续发展的主要障碍之一。
大模型的训练往往采用多
上交大推出首个AI智能体协议全面综述:从碎片化到互联互通的智能体网络
上海交通大学团队发布论文《A Survey of AI Agent Protocols》,提出二维分类体系和七大维度评估框架,旨在解决智能体间协议碎片化问题。该研究通过真实案例分析展示了不同协议在旅行规划中的应用差异,并对未来AI智能体协议的发展进行了展望。
R1-Zero的无监督版本来了!SFT不再是必须,EMPO重新定义大模型推理微调
本文提出Entropy Minimized Policy Optimization (EMPO)方法,旨在实现完全无监督条件下大模型推理能力的提升。该方法不需要监督微调或人工标注的答案,仅通过强化学习训练从基模型中获得策略,并利用语义相似性聚类生成的多个回答作为奖励信号,从而在数学及其他通用推理任务上取得显著性能提升。