使用MindSpore实现FasterRCNN网络的训练和推理

  • Post author:
  • Post category:其他


在这里插入图片描述

​计算机视觉(Compute Vision,CV)给计算机装上了“眼睛”,让计算机像人类一样也有“视觉”能力,能够“看”懂图片里的内容。

作为深度学习领域的最重要的应用场景之一,在手机拍照、智能安防、自动驾驶等场景均有广泛的应用,而检测类任务作为CV领域的一类经典任务,也在以上场景中广泛应用。


本文以经典的目标检测网络FasterRcnn为例,介绍一下如何使用MindSpore来完成一个检测模型的开发及部署。



FasterRcnn 算法简介

FasterRCNN是一个two-stage结构的目标检测网络框架,其中主体结构包含4个部分,包括由Resnet50构成的网络主干,由FPN(Feature Paramid Network)构成的高分辨率特征融合模块,由RPN(Region Proposal Network)构成的兴趣区域(ROI)检测模块,以及由卷积和全连接层构成的分类和位置调整模块(RCNN)。

下图是论文中给出的FasterRcnn网络的结构图。 在本文中,我们对整体结构做了一些调整: 在网络结构上使用ROIAlign模组代替了ROIPooling,并增加了FPN作为高分辨特征的融合组件。

在这里插入图片描述

从图中可以看到,一张图片通过FasterRcnn网络,就可以获取到目标的位置与目标的类别,因此,我们可以将FasterRcnn应用到安防,自动驾驶等各种场景,让自动一定程度上减少人工的工作量。




使用MindSpore训练/推理FasterRcnn

使用MindSpore来复现FasterRCNN这个经典的检测网络。

这里仅列出了部分重要代码片段,完整代码请参考:

https://gitee.co



版权声明:本文为weixin_45212921原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。