对工业异常检测数据集的分析与整理
对于异常检测在工业数据集的实验,有如下特点:
以mvtec举例:(目前异常检测比较公认常用的)
训练集中只包含正常样本
,测试集中包含正常样本与缺陷样本,因此需要使用无监督方法学习正常样本的特征表示,并用其检测缺陷样本。这是符合现实的做法,因为
异常情况不可预知并无法归纳。
数据集一共包含15个类别,其中3629张图片用于训练与验证,1725张用于测试,其中训练集只包含正常样本,其中5类为纹理类数据,剩下的10类为物体类的数据。
现有收集的工业
缺陷检测
数据集的内部组成:
先查到几个汇集的数据集:
这里面
AITEX、DAGM2007、kolektor、original-crack-dataset-1024-1024、ucl
这几个数据集存在数据量小,标签文件与原图像文件不对称的现象,难以使用。
天池数据集中,他的数据量总体可以,但是就训练集来讲,有groundtrue,但是训练集没有给出groundtrue,需要将测试的结果生成json文件,再上传到天池实验室通过后天反馈得出实验结果,不方便!
东北大学给出的热轧带钢表面缺陷数据集,他的数据集里面的缺陷特征不明显!
目前主要是对轨道表面缺陷数据集-RSDDS数据集进行处理。
图片的格式主要是长条形的钢材,在数据扩充上有一定的难度,同时还需要对数据集进行,划分!
版权声明:本文为qq_45496282原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。