现在的位置: 首页 > 综合 > 正文

Atrainable feature extractor for handwritten digit recognition(经典文章阅读)

2018年04月13日 ⁄ 综合 ⁄ 共 844字 ⁄ 字号小中大 ⁄ 评论关闭

一.文献名字和作者

Atrainable feature extractor for handwritten digit recognition，Fabien Lauer, ChingY. Suen, Gérard Bloch

二.阅读时间

2014年10月28日

三.文献的贡献点

这篇文章主要介绍了使用改进的CNN结构作为可训练特征提取器，然后使用SVM作为分类器来对手写字体进行分类。

在特征提取器的部分，作者将传统的LeNet-5的CNN结构最后两个全连接层换成了一个普通10个输出的全连接层，这样，就可以利用CNN的训练算法来训练这个特征提取器。

在分类器方面，采用了核SVM，在进行了特征提取之后，后面的问题就是一个普通的分类问题。

最后为了解决训练样本过少可能引起的问题，作者又对原来已经有的样本进行放射变换之类的操作，扩充训练样本，作者也分析分类错误的样本，发现样本中本来就存在一些人眼都无法分辨的样本，因此，MNIST手写字体的分类错误率是有一个极限的。

这篇文章和《Large-scale Learning with SVM and Convolutional Nets for Generic Object Categorization》的区别主要在于作为特征提取器的CNN的结构问题，本文中是将传统的LeNet-5的最后面的两个全连接层(包括输出层)替换为一个10个输出的全连接层，而在《Large-scale
Learning with SVM and Convolutional Nets for Generic Object Categorization》中，在训练作为特征提取器的CNN的时候，还是使用了整个LeNet-5来训练，在训练结束后，都是直接将C5层的输出作为特征，输入到SVM中。

这篇文章改进显得有些少，不过，目前看来，将CNN作为特征提取的手段，已经是一个很普遍的观点了。