推理框架归档

多模态推理新思路：D2I框架如何让模型“深思熟虑”又“直觉敏锐”？

本文介绍了一种名为 Deliberate-to-Intuitive (D2I) 的推理框架，旨在提升多模态大型语言模型（MLLMs）在复杂推理任务中的表现。通过在训练阶段采用深度推理策略，并在测试阶段允许模型自由生成答案，显著提升了多模态模型的推理能力，同时保持了训练的高效性和可扩展性。

2025年5月22日8时作者 NLP工程化

Kubernetes原生高性能分布式LLM推理框架，提升性能、灵活部署和优化资源利用。相关技术参考及服务内容介绍。