极市干货，作者每时AI

解读何恺明团队工作：分形生成其实是一种多叉树视觉 Transformer

2025年3月7日23时作者极市干货

读
何恺明团队的分形生成模型提出了一种基于多叉树结构的视觉Transformer，通过分层处理图像数

2025年3月5日23时作者极市干货

zhihu.com/p/680567656
编辑丨极市平台
极市导读
本文作者回顾了在模型量化领域的

2025年3月5日23时作者极市干货

首次在3D多模态大语言模型中移除了编码器，让LLM直接处理3D编码任务。通过提出混合语义损失和分层几何聚合策略，首个无编码器的3D LMM ENEL表现出色，7B模型与ShapeLLM-13B相当，在多个任务上超过现有方法。

2025年3月4日23时作者极市干货

研究发现DeepSeek生成的74.2%文本风格与OpenAI模型相似，Copyleaks开发集成系统识别具体AI模型。结果显示DeepSeek与OpenAI模型有显著风格相似性。

2025年3月4日23时作者极市干货

180个存储节点提供了 6.6TiB/s的存储性能, 全面支持大模型的训练和推理的KVCache转存

2025年3月3日23时作者极市干货

MITracker提出了一种高效的多视角跟踪方法，通过融合多视角特征解决了传统单视角跟踪中的遮挡和目标丢失问题。该研究构建了大规模的多视角跟踪数据集MVTrack，并提出了类无关的多视角跟踪方案MITracker，在多个评估指标上达到了最先进的性能。

2025年2月28日23时作者极市干货

读
本文详细介绍了扩散模型的原理、数学基础以及基于PyTorch的实现方法。文章从图像生成任务的背景

2025年2月28日23时作者极市干货

首届跨域少样本物体检测挑战赛（CD-FSOD）由NTIRE2025举办，旨在提升小样本目标检测模型在不同领域数据上的泛化能力。大赛聚焦跨域场景下的少样本目标检测任务，提供多种验证集用于实验，并鼓励参赛者探索多样化的基础模型和训练策略。

2025年2月28日23时作者极市干货

该框架通过三阶段网络设计、高效多感受野特征交互模块以及训练测试策略，实现了在分类任务及高分辨率下游任务上的高性能与低效率平衡。

2025年2月27日23时作者极市干货

何部署和测试DeepSeek-R1模型，涵盖了从Ollama到vLLM的多种推理框架的安装与配置，并