目标检测等相关评价指标（AP AR Average Precision和Average Recall）

Post author:xfxia
Post published:2023年5月24日
Post category:其他

COCO 提供了 12 种用于衡量目标检测器性能的评价指标.

[1] – 除非特别说明，AP 和 AR 一般是在多个 IoU(Intersection over Union) 值间取平均值. 具体地，采用了 10 个 IoU阈值 – 0.50:0.05:0.95. 对比于传统的只计算单个 IoU 阈值(0.50)的指标(对应于这里的指标 APIoU=0.50)，这是一种突破. 对多个 IoU 阈值求平均，能够使得目标检测器具有更好的定位位置.

[2] – AP 是对所有类别的求平均值. 这在传统上被称为平均准确度(mAP, mean average precision). 这里并未区分 AP 和 mAP(类似的，AR 和mAR)，假定从上下文中具有清晰的差异. 即：如，AP50=mAP50，AP75=mAP75，… 但，AP50 一定大于 AP75.

[3] – AP (所有 10 个 IoU 阈值和全部 80 个类别的平均值) 作为最终 COCO竞赛胜者的标准. 在考虑目标检测器再 COCO 上的性能时，这是单个最重要的评价度量指标.

[4] – COCO数据集中小目标物体数量比大目标物体更多. 具体地，标注的约有 41% 的目标物体是都很小的(small, 面积< 32×32=1024)，约有 34% 的目标物体是中等的(medium, 1024=32×32 < 面积 < 96×96=9216)，约有 24% 的目标物体是大的(large, 面积 > 96×96=9216). 面积(area) 是指 segmentation mask 中像素的数量.

[5] – AR 是指每张图片中，在给定固定数量的检测结果中的最大召回(maximum recall)，在所有 IoUs 和全部类别上求平均值. AR 与 proposal evaluation 中所使用的相同，但这里 AR 是按类别计算的.

[6] – 所有的评测指标允许每张图片(在全部的类别中)最多 100 个 top-scoring 检测结果进行计算.

[7] – 边界框(bounding boxes)的检测和segmentation mask 的所有评测指标是一致的，除了 IoU 的计算. 边界框的 IoU 计算是关于 boxes的，而 segmentation mask 的 IoU 计算是关于 masks 的.

学习参考：https://www.aiuai.cn/aifarm854.html

你可能也喜欢