「DeepSeek二代」来袭!数学暴击o3,英伟达开源LLM登顶
英伟达发布OpenReasoning-Nemotron模型,基于Qwen2.5架构和DeepSeek-R1-0528生成数据,该模型在多个基准测试中表现优异,特别是在数学、科学和代码任务上。
英伟达发布OpenReasoning-Nemotron模型,基于Qwen2.5架构和DeepSeek-R1-0528生成数据,该模型在多个基准测试中表现优异,特别是在数学、科学和代码任务上。
微软发布Phi-4推理系列模型,通过优化数据和训练策略提升小型语言模型的复杂推理能力。该系列包括三款不同参数规模的模型,在数学、科学等高难度基准上达到与顶尖大型模型相当甚至更好的性能。