在无人机高空搜索中,目标过小看不清或被遗漏的问题,将在这项新技术的加持下成为历史。近日,中国科学院上海微系统与信息技术研究所仿生视觉系统实验室李嘉茂研究员、朱冬晨研究员团队,在机器视觉弱小目标检测领域取得重要进展,具身智能即将拥有一双明察秋毫的"超级眼睛"。
团队方法对复杂街景进行目标检测能够显著提升小目标检出率
据介绍,目标检测是具身智能实现场景理解与环境交互的基石。在无人机图像探测等典型应用中,受观测视角、拍摄距离、传感器分辨率等成像条件限制,所获取的图像中常包含大量微小且密集的关键目标。与常规尺寸目标相比,弱小目标因像素占比极低,在检测任务上存在明显的性能瓶颈。
"我们提出了一种名为 DAWDet 的创新方法,可以把它想象成一个视力超强、又特别细心的人工智能眼睛,经过专门训练,可在无人机航拍、自动驾驶摄像头拍摄的复杂图像中,精准地找出那些非常小、非常模糊又挤在一起的目标,比如远处的小型车辆、密集的人群、微小的故障点等等。"朱冬晨解释说,DAWDet 通过设计多项针对性机制有效提升弱小目标检测性能,可根据图像内容智能调整"关注力",在不同层面对小目标进行精细捕捉,此外,还将弱小目标进行增强,同时抓取整体轮廓和局部细节,让小目标不再模糊难辨。
团队方法在 RGBT-Tiny 数据集(2025)上达到最优性能
该模型在无人机场景数据集 Visdrone-2019、可见光 - 热红外数据集 RGBT-Tiny 以及驾驶场景数据集 SODA-D 上,性能全面超越目前先进目标检测器,在检测精度和运算效率等方面均体现明显优势。"这意味着,未来,即使在夜晚、大雾等复杂的环境和天气中,都可以更精细、更准确、更可靠地识别到弱小的目标,为无人机探测识别、自动驾驶、智能机器人等领域带来更强大的技术支持。"朱冬晨表示。
该成果被模式识别与人工智能领域的国际顶级期刊《模式识别》(Pattern Recognition)刊发,这一研究也得到了科技部科技创新 2030、中国科学院青促会、上海市优秀学术带头人等项目支持。
通讯员:王荣会
编辑:吴宇卿
点赞分享给身边的人
在无人机高空搜索中,目标过小看不清或被遗漏的问题,将在这项新技术的加持下成为历史。近日,中国科学院上海微系统与信息技术研究所仿生视觉系统实验室李嘉茂研究员、朱冬晨研究员团队,在机器视觉弱小目标检测领域取得重要进展,具身智能即将拥有一双明察秋毫的"超级眼睛"。团队方法对复杂街景进行目标检测能够显著提升小目标检出率据介绍,目标检测是具身智能实现场景理解与环境交互的基石。在无人机图像探测等典型应用中,受观测视角、拍摄距离、传感器分辨率等成像条件限制,所获取的图像中常包含大量微小且密集的关键目标。与常规尺寸目标相比,弱小目标因像素占比极低,在检测任务上存在明显的性能瓶颈。"我们提出了一种名为 DAWDet 的创新方法,可以把它想象成一个视力超强、又特别细心的人工智能眼睛,经过专门训练,可在无人机航拍、自动驾驶摄像头拍摄的复杂图像中,精准地找出那些非常小、非常模糊又挤在一起的目标,比如远处的小型车辆、密集的人群、微小的故障点等等。"朱冬晨解释说,DAWDet 通过设计多项针对性机制有效提升弱小目标检测性能,可根据图像内容智能调整"关注力",在不同层面对小目标进行精细捕捉,此外,还将弱小目标进行增强,同时抓取整体轮廓和局部细节,让小目标不再模糊难辨。团队方法在 RGBT-Tiny 数据集(2025)上达到最优性能该模型在无人机场景数据集 Visdrone-2019、可见光 - 热红外数据集 RGBT-Tiny 以及驾驶场景数据集 SODA-D 上,性能全面超越目前先进目标检测器,在检测精度和运算效率等方面均体现明显优势。"这意味着,未来,即使在夜晚、大雾等复杂的环境和天气中,都可以更精细、更准确、更可靠地识别到弱小的目标,为无人机探测识别、自动驾驶、智能机器人等领域带来更强大的技术支持。"朱冬晨表示。该成果被模式识别与人工智能领域的国际顶级期刊《模式识别》(Pattern Recognition)刊发,这一研究也得到了科技部科技创新 2030、中国科学院青促会、上海市优秀学术带头人等项目支持。通讯员:王荣会编辑:吴宇卿点赞分享给身边的人
OCR:戳上面 星标指南 e 关注上海嘉定微信号
OCR:人文教化地 智慧汽车城 关注”上海嘉定”
OCR:小红书 点击关注 小嘉同学 ? 小红书号
OCR:点击上方蓝字关注 上海嘉定
OCR:RGB(baseline) RGB(Ours) Thermal(baseline) Thermal(Ours)
OCR:Visible Thermal Method AP APs APs AP AP AP, AP AP AP's AP AP, AP, FLOPs Faster RCNN[7] 211322 13225 13232232 5253 35# 3332 ##### 35.2 45.6 RetinaNet [34] 292.3G 299.5G FCOS[35] 17.4 38.6 284.5G ATSS[37] 29.7 46.5 31.6 739.1G 290.8 G Deformable-DETR [38] 22.4 48.1 Sparse RCNN [8] 7 31.6 24 35.6 213.0G YOLO11-N[17] 51.1 6.3G Baseline[16] 47.9 32.9 : 6.5G Hyper-YOLO-T[18] 48.9 33.0 40.0 24.2 36.8 52.9 9.4G DAWDet 33.1 49.1 39.1 30.5 33.4 48.2 34.3 49.1 40.7 26.7 37.6 55.0 7.6 G
OCR:点击上方蓝字关注 上海嘉定
OCR:m&2 上明珠家
OCR:点击下载 上海嘉定 APP
OCR:RGB(baseline) RGB(Ours) Thermal(baseline) Thermal(Ours)
OCR:戳上面 星标指南 b 关注上海嘉定微信号
OCR:长按二维码关注 上海嘉定 视频号
OCR:人文教化地 智慧汽车城 关注”上海嘉定” LOAOR
OCR:Visible Thermal Method AP APa AP AP AP, AP, AP AP AP's AP, AP, AP, FLOPs Faster RCNN [7] 28.8 4.4 3. 2.3 30.4 4.3 29.5 43.4 36.2 21.9 35.2 45.0 292.3G RetinaNet [34] 21.8 825 2853 19.3 21.7 15.4 21.4 33.8 17.5 28.6 22 3828 27.7 14.0 38.6 299.5G FOOS[35] 16.9 19.2 17.4 284.5G ATSS[37] 24.2 384 230 43.2 32.3 Deformable-DETR [38] 28.2 19.9 29.7 48.1 46.5 739.1G 290.8 G 19.2 29.8 21.9 21.4 31.6 Sparse RCNN [8] 31.5 24.0 18.0 22.4 31.6 213.0G YOLO11-N[17] 31.7 73 37 273 31.3 4栋 3.3 48 39.4 24.9 35.9 519 31.8 36.6 6.5G 6.3 G Baseline [16] Hyper-YOLO-T [18] 32.9 48.9 39.1 27.6 33.0 47.2 33.5 47.9 40.0 24.2 36.8 52.9 9.4G DAWDet 33.1 49.1 39.1 30.5 33.4 48.2 34.3 49.1 40.7 26.7 37.6 55.0 7.6 G



