Large-scale Multimodal Gesture Segmentation and Recognition based on Convolutional Neural Networks

  • Post author:
  • Post category:其他


团队介绍

作者:Huogen Wang Pichao Wang Zhanjie Song Wanqing Li

论文发表于ICCVW2017上,Pichao Wang是澳大利亚University of Wollongong大学的Phd,去年就参加Chalearn2016@ICPR竞赛了,取得了挺不错的成绩。本文不是今年他们最好成绩对应的论文,感觉像是调参的副产品。

论文总结

本来是奔着segmentation去看的,没想到如此简单,本文的实验部分也不充分,只给出了最终的结果,没有中间模块的对比实验,差评。论文像是个技术报告,最大特点就是用了多个提取特征的方法,以及不同的神经网络,最后把各个网络的结果融合在一起。(这好像是打比赛常用的技巧)另外文章的introduction和related work写的不错。

论文framework

网络结构图是的冯绍峰

– 图1: 论文的总体框架

  • temporal segmentation: 利用RGB和Depth图片分别微调训练VGG16网络(在ImageNet预训练),进行二分类(



版权声明:本文为u010106759原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。