卷积神经网络结构-VGG

VGG详解

VGG是2014年提出的,其主要创新在于全使用3x3、1x1的小卷积核,增加网络深度,提升图像分类准确度。

网络结构

原文中通过实验对比了六种不同的网络结构,分别如下:

VGG

这六种网络结构相似,但是具体的卷积层数目不同,其中网络D是VGG-16,网络E是VGG-19。

VGG-16的具体网络结构如下图所示:

VGG-16

网络优势

整个网络都只使用了1x1、3x3的卷积核,结构更加简洁。

原文中也提到了使用3x3卷积的原因,主要有以下三点:

  1. 从感受野的角度看,两个3x3的卷积核等于5x5,同理三个3x3等于7x7
  2. 使用三个3x3的卷积核,相比于一个7x7的卷积核而言,可以使用三个非线性激活层,决策函数有更强的区分能力
  3. 更少的参数

而使用1x1的好处主要在于变化通道数目,增强非线性能力。

其它技术

原文在实验部分,为了能让网络处理任意尺寸的图像,使用卷积代替全连接,具体使用如下图所示:

全卷积

总结

从原文的实验结果看,可以总结出以下两点:

  1. 在网络搭建时,可以用多个小卷积代替大卷积
  2. 随着网络深度的增加,性能能够得到有效提升

本文标题:卷积神经网络结构-VGG

文章作者:JoinApper

发布时间:2020年12月12日 - 22:12

最后更新:2020年12月12日 - 22:12

原始链接:https://zhuofujiang.github.io/2020/12/12/卷积神经网络结构-VGG/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。