VGG详解
VGG是2014年提出的,其主要创新在于全使用3x3、1x1的小卷积核,增加网络深度,提升图像分类准确度。
网络结构
原文中通过实验对比了六种不同的网络结构,分别如下:

这六种网络结构相似,但是具体的卷积层数目不同,其中网络D是VGG-16,网络E是VGG-19。
VGG-16的具体网络结构如下图所示:

网络优势
整个网络都只使用了1x1、3x3的卷积核,结构更加简洁。
原文中也提到了使用3x3卷积的原因,主要有以下三点:
- 从感受野的角度看,两个3x3的卷积核等于5x5,同理三个3x3等于7x7
- 使用三个3x3的卷积核,相比于一个7x7的卷积核而言,可以使用三个非线性激活层,决策函数有更强的区分能力
- 更少的参数
而使用1x1的好处主要在于变化通道数目,增强非线性能力。
其它技术
原文在实验部分,为了能让网络处理任意尺寸的图像,使用卷积代替全连接,具体使用如下图所示:

总结
从原文的实验结果看,可以总结出以下两点:
- 在网络搭建时,可以用多个小卷积代替大卷积
- 随着网络深度的增加,性能能够得到有效提升