清华大学DeepSeek:从入门到精通(不跑路)

《DeepSeek:从入门到精通》详细介绍了DeepSeek的核心功能、应用场景及提示语设计原则,强调了推理模型与通用模型的区别,并提出了关键的技能体系和进阶技巧。

仅817样本超越o1-preview,上交大LIMO”少即是多”推理新范式

LIMO提出了一种新的假设:基础模型中已全面编码领域知识,在预训练阶段通过最少但精心策划的认知过程可以激发复杂的推理能力。使用817个高质量问题和相应的推理链进行监督式微调的Qwen2.5-32B-Instruct模型在数学基准测试中的表现显著优于先前的工作。

OpenAI Deep Research被huggingface 24小时复现开源了,冲~

本文介绍了多个OpenAI Deep Research的复现项目,并重点介绍Hugging Face的open-Deep-Research项目,它在GAIA基准测试中的准确率达到了54%。强调了使用代码表达操作的优势以及未来改进的方向,如扩展文件格式数量、提出更细粒度的文件处理等。

微软开源大模型MarS:直接模拟了整个金融市场

MarS是一款由LMM驱动的金融市场模拟引擎,旨在生成现实、互动且可控的订单,并评估其在市场的规模法则和真实性。它概述了核心组件和潜在应用,展示通过噪声Agent运行市场模拟的能力及其结果可视化。