数学归档 - 每时AI

多模态推理新思路：D2I框架如何让模型“深思熟虑”又“直觉敏锐”？

本文介绍了一种名为 Deliberate-to-Intuitive (D2I) 的推理框架，旨在提升多模态大型语言模型（MLLMs）在复杂推理任务中的表现。通过在训练阶段采用深度推理策略，并在测试阶段允许模型自由生成答案，显著提升了多模态模型的推理能力，同时保持了训练的高效性和可扩展性。

2025年4月15日8时作者 NLP工程化

Skywork-OR1发布，7B参数量模型在AIME数学竞赛中得分69.8，性能媲美671B DeepSeek-R1，开源模型、数据和代码助力研究。

2025年2月20日8时作者 NLP工程化

教学项目：用C语言编写一个微型张量库，帮助零基础学习神经网络，不涉及PyTorch和NumPy，仅基于数学与C语言。

2025年2月19日16时作者新智元

6位来自七大科学领域科学家获奖，计算机领域共有22位学者。其中，华人学者占8席。值得一提的是，迄今已

2025年2月4日23时作者量子位

阿里自研Qwen2.5-Max在Chatbot Arena大模型竞技场中表现优异，总分1332位列第七。尤其在编程、数学方面突出，综合排名第三，超越谷歌Gemini家族和Llama 3.1等模型。

2025年2月1日14时作者 AI信息Gap

OpenAI发布新一代推理模型o3-mini，首次向免费用户提供新模型，并提供高算力版本o3-mini-high。其性能超越了o1，在STEM领域具有优势。