现在的位置: 首页 > 综合 > 正文

DeepPose: Human Pose Estimation via Deep Neural Networks(精读)

2018年04月13日 ⁄ 综合 ⁄ 共 1129字 ⁄ 字号小中大 ⁄ 评论关闭

一.文献名字和作者

DeepPose: Human Pose Estimation via Deep Neural Networks， CVPR2014

2014-08-29

文献为了解决当前对于姿态估计中只是使用局部的观点来估计关节点的坐标，这样虽然高效，但是，在实际应用中却无法使用。

1.作者提出了如何使用CNN来进行姿态估计的公式；

2.作者提出了一种使用级联的方式来进行更准确的姿态估计器。

1.如何使用全局观点获得关节点的坐标的问题，对于每一个关节点，都把整个图像作为输入，同时，使用卷积神经网络来作为全局的特征提取；

2.对于节点的坐标在不同的图像中处理绝对坐标的问题，作者采用在每一个环节中，通过中点，长和宽选择一个bound box，然后计算节点在bound box中的坐标，从而将绝对坐标转换为统一的坐标；

3.如何实现更高精度的坐标计算问题，作者提出的级联的卷积神经网络，在最初输入时，将图片设定为固定大小，通过缩放的方式将图片缩放到这个大小，在获得初步的节点坐标之后，再在原始图片中根据该坐标选择一定的局部区域，从而实现更高准确度的计算节点的坐标；

1.Frames Labeled in Cinema(FLIC)

2.Leeds Sports Dataset and its extension

作者在上面两个数据集上面，都取得了state-of-art或者超过state-of-art的效果。

文章使用卷积神经网络和级联的思想，将以前用于分类的卷积神经网络，通过改变误差函数，将其转变为用于关节点坐标估计的卷积神经网络。同时，采用级联的方式，首先初步计算得到一个节点的坐标，然后根据这个坐标，重新在原始图片中获得局部图片，利用局部图片进行更高进度的坐标计算，方法比较新，研究点非常好。

将级联的思想和局部高精度图片获得更高精度的节点坐标的想法，是一种创新的地方。

但是，本文提出的级联和局部高精度图片的方法，并不适用于原始图片分辨率比较小的情况，同时，由于采用了级联的方法，对于每一个节点的坐标，相当于做了多次的卷积神经网络，计算复杂度应该会很高。最后，作者使用的卷积神经网络本身是用来做分类的，因此，是否可以探讨更好的适合于姿态估计的卷积神经网络结构。

可以进行的创新点包括：1.对于分辨率比较低的情况，如何使用级联的方法来获得更高的节点坐标进度；2.如何在牺牲较小复杂度的情况下，降低卷积神经网络的复杂度；3.寻找更适合于姿态估计的卷积神经网络结构。

enjoy it~

抱歉!评论已关闭.