基于BP 网络分类器的交通标志识别
摘要:针对中国全部 3 大类 116 个交通标志,即禁令标志、指示标志、警告标志,用 BP 网络实现分类功能. 实验中使用了 3 种测试集,即加高斯噪声、水平扭曲和日本交通标志实景图,对BP 网络的分类性能进行了测试. 实验结果表明:用 BP 网络实现交通标志粗分类功能的效果是比较理想的,对交通标志的颜色失真和形状失真均具有较好的容错性和鲁棒性.
关键词:道路交通标志识别;智能分类器;BP 网络;机器识别
为了安全驾驶和有效导航,交通部门在公路道路上设置了各类重要的交通标志,作为道路交通的有关信息提供给驾驶员. 在 ITS(Intelligent Trans- portation System,智能交通系统)研究领域中,如何实现交通标志的自动识别,对于自动驾驶或辅助驾驶系统的实现都是非常重要的.
交通标志识别 TSR(Traffic Sign Rrecognition) 技术作为交通信息服务系统的重要手段,主要是分析处理交通场景图像,从复杂的交通场景图像中检测出交通标志,然后对交通标志进行正确判别. 本文针对中国 3 大类交通标志,用 BP 网络实现分类功能,并用 3 种测试集对网络性能进行了测试.
交通标志的分类
检测与判别是TSR系统2 个主要的基本技术环节[1]. 检测的主要任务是获取感兴趣区域(ROI),通过颜色提取和形状分析来进一步完成交通标志的检测[2]. 判别的主要任务是识别出每个标志里符号的含义,在过去的研究中,人们大多数用神经网络来完成判别工作,如BP网络、RBF网络、k邻近决策规则等[3],而实验中用到的交通标志图数量不是很多,并未涵盖全部交通标志.
如果对中国全部3 大类 116 种交通标志一起进行判别,由于样本数量大,且实时的交通标志图干扰因素较多,判别的正确率势必会有所下降. 而与道路交通安全有关的标志主要有 3 大类,即禁令标志、指示标志、警告标志,如图 1 所示. 每类标志都具有特殊的形状和颜色,特定的符号和特定的尺寸、比例,以便于识别. 因此可以根据 3 类交通标志各自的特点,先进行大的分类,然后针对每一类再进行具体的判别,这样整个判别环节将被细化成几个互相独立的小环节,便于作进一步的判别.
根据颜色和形状的特征来进行分类是最常用的分类方法,但实时的交通标志中都存在着不同程度的颜色失真和形状失真,会影响到分类的准确率。
禁令标志 指示标志 警告标志
标准图:
噪声图:
扭曲图:
日本实景图:
图 1 样本示例
本文应用了 BP 网络来完成分类的功能,采用神经网络方法的优点:不需要人工分析各类标志的颜色和形状,避免了大量的复杂计算,方法简单直观, 而且具有较好的容错性和鲁棒性.
本研究采用的样本如图 1 所示. 第 1 行为 116 个中国交通标志标准图样本示例,作为训练集;第2~4 行为测试集示例. 其中:第 2 行为人工噪声图(标准图加上均值为零、方差为 0.3 的高斯噪声),
第 3 行为扭曲图(标准图在水平方向扭曲 10°),第 4行为 531 个日本交通标志实景图的示例. 实验中的训练集和测试集的交通标志图均为20×20 的24 位彩色位图. 当然,大图形对识别是有利的. 之所以采用较小的图形,主要是考虑到在实际应用中,图形越小越是意味着交通标志被发现得越早. 这对于车载视觉系统及时进行相应的处理来说是非常重要的.
实验及结果
在应用BP 网络交通标志图像进行分类的实验中,网络的输入单元个数由输入图像的空间分辨率大小决定,输出单元个数由需要分类的个数决定, 隐含层单元个数、学习因子、惯性系数和学习精度则视具体情况可以作适当的调整. 本实验中,学习因子为 0.6,惯性系数为 1.0,学习精度为 0.01, BP 网络采用 3 层结构,其中,输入单元为 1 200 个(对应于 400 个像素点的 RGB 3 色值),输出单元为 3 个(分别对应于 3 类交通标志). 为测试网络性能,在用训练集对 BP 网络进行训练时,选取了 9个不同的隐单元数(分别为 2、4、5、8、10、20、30、50、100). 网络训练完成后,3 组测试集粗分类的回想结果如下.
- 高斯噪声图的回想
加高斯噪声是在 MATLAB 环境下完成的. 当高斯噪声的方差≤0.01 时,网络粗分类的正确率均达到了 100%. 方差分别为 0.05 和 0.1 时,只有个别的几个标志未被正确分类,平均正确率也分别达到了 99.4%和 99.0%. 方差分别为 0.3、0.5 和 1.0 的分类情况如图 3 所示,从图 3 中可以看出,随着方差增大,分类正确率有所下降,但当噪声值加到
1.0 时,我们肉眼已经无法根据颜色识别,而 BP
网络分类正确率仍能达到 70%以上.
加高斯噪声修改的不仅仅是交通标志本身的颜色值,整张图像(包括白色背景)的颜色值都被修改了. 加上较大方差的高斯噪声后,对整幅交通标志图的破坏是很大的,图 2 中加了方差为 0.3 的噪声后标志图的颜色失真已经非常严重. 从对加高斯噪声的交通标志图的粗分类实验中可以看出, BP 网络具有较强的抗噪能力.
图 2 不同隐单元数下的粗分类结果
- 水平扭曲图的回想
由于拍摄视角的变化,捕获的交通标志图像都会有一些不同程度的扭曲. 本实验人为地模拟
这些扭曲的情况,主要是像素点的位置进行了一定程度的水平移动,而移动前后像素点本身的值并未发生变化. 通过对不同程度的水平扭曲的交通标志图的回想来测试 BP 网络的性能. 水平扭曲≤5° 时回想结果非常理想,只有当隐单元数为 2 时,水平扭曲 3°和 5°中有 2 个警告标志未被正确分类, 其余都是 100%. 水平扭曲 10°和 15°的情况分别见表 1 和表 2. 从表 1 和表 2 中可以看出,当水平扭曲相对较大时,只有其中的一些警告标志未被正确分类,其他 2 类交通标志的分类结果几乎都达到了100%. 需要指出的是当隐单元数为 8 时,对于这些不同程度的水平扭曲图,网络的回想结果都是100%.
从实验中可以看出,BP 网络对警告标志的水平扭曲比较敏感,主要原因在于当交通标志的形状被扭曲后,像素点的位置发生了移动,原来位置像素点的颜色值被其他像素点的颜色值所代替,导致
某些像素点的颜色值发生了变化,而黄色是由红色和绿色 2 种颜色混合而成,容易与红色混淆、造成误判.
- 日本交通标志实景图的回想
为测试 BP 网络的性能,还用训练好的网络对531 个日本交通标志实景图进行了回想. 这 531 个标志中均含有较严重的颜色失真和几何失真,所以实验结果更具有实际意义,见表 3.
指示标志的结果最理想,除隐单元数 4 外,其余的分类结果都达到了 100%,禁令标志的分类正确率平均也达到了 90%以上,而警告标志的分类结果却很不理想,很多情况下一个都没有被正确分类,或者个别被正确分类.
从误判的几个禁令标志中可以看出,误判的主要原因在于颜色失真非常大,大多数都是由于颜色过深(主要是光线较暗所至)而造成误判. 而警告标志分类正确率很低的原因:这些标志不但颜色失真
表 1 水平扭曲 10°的 116 个中国交通标志粗分类结果
隐单元数
平均值
2 | 4 | 5 | 8 | 10 | 20 | 30 | 50 | 100 | ||
禁令标志 | 100 | 100 | 100 | 100 | 100 | 100 | 97.7 | 100 | 100 | 99.7 |
指示标志 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
警告标志 | 53.3 | 95.6 | 100 | 100 | 97.8 | 73.2 | 95.6 | 100 | 93.3 | 89.9 |
总识别率 | 82.0 | 98.3 | 100 | 100 | 99.2 | 89.7 | 97.5 | 100 | 97.4 | 96.0 |
表 2 水平扭曲 15°的 116 个中国交通标志粗分类结果
隐单元数
平均值
2 | 4 | 5 | 8 | 10 | 20 | 30 | 50 | 100 | ||
禁令标志 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 97.7 | 100 | 99.7 |
指示标志 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 96.6 | 99.6 |
警告标志 | 11.1 | 93.3 | 68.9 | 100 | 93.3 | 93.3 | 84.4 | 100 | 100 | 82.7 |
总识别率 | 65.8 | 97.4 | 88.0 | 100 | 97.4 | 97.4 | 94.0 | 99.2 | 99.2 | 93.2 |
表 3 531 个日本交通标志粗分类结果
隐单元数
平均值
2 | 4 | 5 | 8 | 10 | 20 | 30 | 50 | 100 | ||
禁令标志 | 93.4 | 100 | 85.6 | 83.3 | 87.3 | 91.1 | 94.5 | 90.5 | 98.6 | 91.6 |
指示标志 | 100 | 61.6 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 95.7 |
警告标志 | 0 | 0 | 0 | 19.4 | 9.2 | 0 | 6.1 | 3.1 | 8.2 | 5.1 |
总识别率 | 77.2 | 75.3 | 72.1 | 74.2 | 74.9 | 75.7 | 79.1 | 75.9 | 82.1 | 76.3 |
比较严重,其形状与训练集中的警告标志也完全不同,如图 1 中的警告标志;另外从对中国交通标志的分类结果中可以看出,黄色警告标志的分类正确率相对较低. 综合这些原因导致对日本警告标志实景图回想的误判率很高. 这 531 个日本交通标志实景图的颜色失真是非常严重的,但总体分类正确率能达到 70%以上,还是相当不错的. 这说明图像的颜色分量具有较好的正交性时,BP 网络对于颜色失真具有较高的容错性和鲁棒性.
结论
从整个实验的测试结果看,用 BP 网络实现交通标志分类的方法是令人满意的,对于一定程度的高斯噪声和水平扭曲的交通标志都能准确分类,对于日本交通标志实景图也有较高的分类正确率. 而用常规的方法分类这些失真交通标志图时,运用颜色和形状来分类是相当困难的,特别是当高斯噪声≥0.5 时,颜色失真已经非常严重,很难提取标志里面的颜色,形状也很模糊. 在常规方法失效的情况下,BP 网络依然能达到较好的分类正确率. 另外在 3 类交通标志中,每类都有几个颜色或形状特殊的标志,常规方法中,需要对这几个标志作特殊的处理,即用另外的算法对这几个标志进行分类, 而 BP 网络中不需要这些特殊的处理.
用 BP 网络完成交通标志分类后,今后的工作可以根据各类交通标志的颜色、形状和内部结构等特征,结合 BP 网络适合解决大分类问题的优点, 构造多级智能分类器来完成判别过程,这样可以简化细分类过程,并提高识别率.
参考文献:
- Escalera A, Armingol J M, Mata M. Traffic sign recognition and analysis for intelligent vehicles[J]. Image and Vision Computing, 2013, 21(3):247-258.
- Kellmeyer D L, Zwahlen H T. Detection of highway warning signs in natural video images using color image processing and neural networks, neural networks[C]. IEEE World Congress on Computational Intelligence, 2012.
- Zheng YongJian, Ritter W, Janssen R. An adaptive system for traffic sign recognition[C]. Intelligent Vehicles 94 Symposium,Proceedings, 2014.