Deep Learning回顾之LeNet、AlexNet、GoogLeNet、VGG、ResNet-白红宇的个人博客

Deep Learning回顾之LeNet、AlexNet、GoogLeNet、VGG、ResNet

发布日期：2025-06-08 11:30:52 浏览次数：4 分类：精选文章

本文共 1821 字，大约阅读时间需要 6 分钟。

CNN的发展史

从深度学习的诞生到AI的崛起，CNN作为计算机视觉领域的核心技术，经历了无数次的演变与突破。本文将从LeNet到AlexNet、VGG、GoogLeNet、ResNet的发展历程，回顾CNN的技术革新与应用进展。

LeNet：CNN的开山之作

1985年，Rumelhart和Hinton等人提出了后向传播（Back Propagation，BP）算法，为神经网络的训练开辟了新途径。这一算法在Google Scholar上的引用次数已超过1万次，成为深度学习研究的基石。几年后，LeCun利用BP算法训练多层神经网络用于识别手写邮政编码，这一工作标志着CNN的诞生。LeNet网络结构如图2所示，采用5x5的卷积核，但并未明确提及卷积或卷积神经网络的概念。

AlexNet：深度学习的突破口

2012年，Alex Krizhevsky在寝室用GPU训练了一个深度学习模型，打破了ILSVRC 2012的冠军头衔。这个改变非凡的模型即为AlexNet，由其三大关键技术的配合推动而成：

大量数据：ImageNet等大规模标注数据集为深度学习提供了基础支持。

GPU：这款"计算神器"使复杂模型的训练成为可能。

算法改进：包括网络变深、数据增强、ReLU激活函数、Dropout、Local Response Normalization等技术的综合应用。

AlexNet的成功不仅推动了CNN的普及，还标志着深度学习技术在计算机视觉领域的崛起。

VGG、GoogLeNet、ResNet：CNN的深度化进程

随着AlexNet的成功，深度学习在计算机视觉领域不断深耕。VGG系列（如图6）以更深的网络结构著称，达到了19层，Top-5错误率达到7.3%。GoogLeNet则引入了Inception网络结构（如图9），通过"网中网"降低了计算复杂度并提升性能。ResNet则以残差网络（如图11）解决深层网络训练难题，实现了152层的深度。

技术对比与总结

模型	初入江湖	层数	Top-5错误率	数据增强	Inception	ResNet层数
AlexNet	2012	8	16.4%	+	-	-
VGG	2014	19	7.3%	+	-	-
GoogLeNet	2014	22	6.7%	+	+	-
ResNet	2015	152	3.57%	+	+	+

技术亮点总结

AlexNet：数据增强、Dropout、ReLU激活函数等技术的创新性应用。

VGG：网络深化，Top-5错误率显著降低。

GoogLeNet：Inception网络降低计算复杂度，性能提升显著。

ResNet：残差网络解决深层训练难题，实现了长距离学习。

未来展望

随着技术的不断进步，CNN在计算机视觉领域的应用前景广阔。从基础研究到实际应用，Deep Learning正在改变着整个AI发展格局。本文所述的经典模型，正是深度学习研究的重要里程碑。

[参考文献]

[1] Rumelhart DE, Hinton GE, Williams RJ. Learning internal representations by error propagation. 1985.

[2] LeCun Y, Boser B, Denker JS. Backpropagation applied to handwritten zip code recognition. 1989.

[3] He K, Zhang X, Ren S, Sun J. Deep Residual Learning. 2016.

[4] Krizhevsky A, Sutskever I, Hinton GE. ImageNet classification with deep convolutional neural networks. 2012.

[5] Simonyan K, Zisserman A. Very Deep Convolutional Networks for Large-Scale Image Recognition. 2014.

[6] He K, Zhang X, Ren S, Sun J. Deep Residual Learning for Image Recognition. 2016.

如需了解更多内容，可关注相关技术博客或学习社区。

上一篇：Python自定义函数的创建、调用和函数的参数详解

下一篇：风靡全网的H5究竟是什么？

发表评论

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！