图像分类、目标检测、语义分割、实例分割等计算机视觉方向基本概念

Post author:xfxia
Post published:2023年8月8日
Post category:其他

参考原文：

图像分类、目标检测、语义分割、实例分割和全景分割的区别_AI视觉网奇的博客-CSDN博客

1.图像分类

（Object Classification）：识别图片中存在的不同物体的种类（下方左图，人类、羊类、狗类）

常用算法：KNN、SVM、BP 神经网络、CNN 和迁移学习

常用数据集：ImageNet、MNIST、Caltech 101

2.目标检测

(Object Detection)：识别图片中的物体及其位置，把它们用矩形框框起来（上方右图，识别三类并用框框起来）

目前常用的目标检测算法有

R-CNN

（速度慢，过程繁琐，训练所需空间大）、

Faster R-CNN

（比前者更准确、快速、简便，但还是不够快，不够简洁）和基于

YOLO

的目标检测的算法（速度快，泛化能力强，但精度低，小目标和邻近目标检测效果差，比Fast R-CNN定位误差大一些）

常用数据集：PASCAL VOL、MS COCO、ImageNet

3.语义分割

（semantic segmentation）：就是需要区分到图中每一点像素点，而不仅仅是矩形框框住了（用颜色区分）。但是同一物体的不同实例不需要单独分割出来。（是精细化识别、图像理解的可靠方式，但费人力物力）语义分割只能判断类别，无法区分个体。（下图c，用不同颜色区分不同类，相同类中的个体不用区分成羊12345）

常见算法：

FCN、U-net、SegNet

常见数据集：PASCAL VOL、MS COCO、CItyscapes

4.实例分割

（Instance segmentation）：其实就是

目标检测

和

语义分割

的结合。相对目标检测的边界框，实例分割可精确到物体的边缘；相对语义分割，实例分割需要标注出图上同一物体的不同个体（羊1，羊2，羊3）（和语义分割相似，不过相同的类中用不同的颜色区分成羊12345）

目前常用的实例分割算法是Mask R-CNN、Fast-CNN、DeepMask

常见数据集：PASCAL VOL、MS COCO、CItyscapes

5.全景分割

（panoptic segmentation）：

语义分割

和

实例分割

的结合，即要对所有目标都检测出来，又要区分出同个类别中的不同实例。实例分割只对图像中的

目标

）进行检测和按像素分割，区分不同实例（使用不同颜色），而全景分割是对图中的

所有物体包括背景

（全景）都要进行检测和分割，区分不同实例（使用不同颜色）

目前常用算法：Mask R-CNN、DeeperLab、Baseline、UPSNet

常见数据集：

Cityscapes、ADE20k、Mapillary Vistas、COCO

6.图像增强：

算法对原有的图像进行修饰和加工，提供更好的视觉效果（例如照片拍摄时光线不足，便可以使用图像增强来改善图片质量）

详细内容请看:

《图像增强算法综述》、《图像增强》知识点_Y蓝田大海的博客-CSDN博客

目前常用的实例分割算法：直方图均衡化、对数图像增强算法、指数图像增强算法

7.行为识别

8.图像识别

原文链接：https://blog.csdn.net/qq_54828577/article/details/125733077

你可能也喜欢