IDEA研究院归档

AI能看懂细节了！IDEA研究院多模态目标检测模型DINO-XSeek，自然语言精准定位目标

2025年3月6日23时作者量子位

基于多模态大语言模型的DINO-XSeek目标检测模型实现了精准感知和理解复杂场景中的目标，能够通过自然语言描述识别出具体细节，如人物的穿着、位置等信息。该模型结合了视觉与语言理解能力，在实际应用中可应用于工业制造、安防、农业等多个领域。

2024年12月15日20时2024年11月22日17时作者量子位

IDEA研究院最新成果DINO-X通用视觉大模型，在各种开发世界感知和目标理解任务中实现全面检测、泛化能力增强、细粒度目标理解和多任务感知，已在多个基准测试中获得新SOTA成绩。