对工业异常检测数据集的分析与整理

  • Post author:
  • Post category:其他




对工业异常检测数据集的分析与整理

对于异常检测在工业数据集的实验,有如下特点:

以mvtec举例:(目前异常检测比较公认常用的)


训练集中只包含正常样本

,测试集中包含正常样本与缺陷样本,因此需要使用无监督方法学习正常样本的特征表示,并用其检测缺陷样本。这是符合现实的做法,因为

异常情况不可预知并无法归纳。

数据集一共包含15个类别,其中3629张图片用于训练与验证,1725张用于测试,其中训练集只包含正常样本,其中5类为纹理类数据,剩下的10类为物体类的数据。

现有收集的工业

缺陷检测

数据集的内部组成:


先查到几个汇集的数据集:

这里面

AITEX、DAGM2007、kolektor、original-crack-dataset-1024-1024、ucl

这几个数据集存在数据量小,标签文件与原图像文件不对称的现象,难以使用。

天池数据集中,他的数据量总体可以,但是就训练集来讲,有groundtrue,但是训练集没有给出groundtrue,需要将测试的结果生成json文件,再上传到天池实验室通过后天反馈得出实验结果,不方便!

东北大学给出的热轧带钢表面缺陷数据集,他的数据集里面的缺陷特征不明显!

目前主要是对轨道表面缺陷数据集-RSDDS数据集进行处理。

图片的格式主要是长条形的钢材,在数据扩充上有一定的难度,同时还需要对数据集进行,划分!



版权声明:本文为qq_45496282原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。