17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤 2025年3月29日11时 作者 量子位 外知名博主让DeepSeek和Chatgpt下国际象棋的视频在Youtube上就获得百万播放,ARC
比肩LLaMA 3!人大高瓴提出语言模型新范式:首个8B扩散大语言模型LLaDA 2025年2月22日23时 作者 PaperWeekly 突破性进展,展现了诸如上下文学习、指令遵循、推理和多轮对话等能力。目前,普遍的观点认为其成功依赖于自
杭州领跑AI开源!阿里Qwen除夕开源视觉理解新旗舰,全系列3尺寸,7B模型超GPT-4o-mini 2025年1月28日12时 作者 量子位 衡宇 白交 发自 川渝 量子位 | 公众号 QbitAI 眼看着半只脚都跨进蛇年了,杭州城还是一如既
WizardLM新作!AgentGen:通过环境和任务生成增强基于大模型的Agent规划能力 2024年12月24日20时 作者 PaperWeekly 基于大语言模型的智能体(LLM-based Agent)受到了广泛关注,并越来越受欢迎。此外,规划能
南大、南洋理工发布最新类别增量学习综述,多维全面分析与严格统一评估 2024年12月1日22时 作者 PaperWeekly ©PaperWeekly 原创 · 作者 | 戚智泓 单位 | 南京大学硕士生 研究方向 | 类别增