深度学习

ResNet和DenseNet

Posted by 潇湘潞 on April 22, 2026

前言

何恺明等人提出了残差网络(ResNet) (He et al., 2016)。 残差网络的核心思想是:每个附加层都应该更容易地包含原始函数作为其元素之一。 凭借它,ResNet赢得了2015年ImageNet大规模视觉识别挑战赛。

ResNet沿用了VGG完整的3×3卷积层设计,残差块(residual block)如下图:

residual-block

其中,1×1是调正通道数和分辨率;

ResNet对应的数学表达: \(f(x) = x + g(x)\) 其中,$f(x)$ 分解为两部分相加:一个简单的线性项和一个复杂的非线性项。

进一步扩展: \(f(x) = [x, f(x)]\) 其中,$f(x)$ 分解为两部分在通道上拼接:一个简单的线性项和一个复杂的非线性项。

ResNet and DenseNet

对应,ResNet和DenseNet均可加入1×1 Conv,均为调正通道数和分辨率;

Ref:李沐