卷积神经网络结构-DenseNet

DenseNet详解

DenseNet是2017年被提出的,其主要创新在于从特征重用角度设计拓扑结构。

github地址为:https://github.com/liuzhuang13/DenseNet

网络结构

DenseNet实际上是通过层间互联实现特征重用的,其基本结构Dense模块如下图所示:

Dense

从中可以看出,模块中层与层之间互相连接,每层网络都可以将前几层的特征映射作为额外输入,然后传递给其后所有层。此种前馈传播方式可以保证,网络中所有层之间都能进行信息流动,从而最大限度地保留所需要的信息,避免了特征的冗余学习。另外,由于每层网络都与最后的分类器直接相连,因此在利用反向传播方法训练时,损失函数的梯度也可以被反馈到浅层,从而避免梯度消失,加速网络训练过程,甚至可以隐式地监督每层网络去学习更具区分性的特征。

DenseNet的整体结构如下图所示,共有三种Dense模块,每个模块间存在卷积层与池化层,用以改变特征映射尺寸。

DenseNet

网络参数

该模型的详细参数如下所示,其中1x1卷积核的使用可以减少输入 3x3卷积核的特征映射数目,从而减少网络参数量。

参数表

总结

原文通过实验证明DenseNet可以持续加深到数百层而不会遇到优化困难,并且随着参数的增长其性能也不断提高。与ResNet相比,达到相同性能时所需的参数更少。

本文标题:卷积神经网络结构-DenseNet

文章作者:JoinApper

发布时间:2020年12月12日 - 22:12

最后更新:2020年12月12日 - 22:12

原始链接:https://zhuofujiang.github.io/2020/12/12/卷积神经网络结构-DenseNet/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。