3-卷积神经网络
这是本系列的第 3 讲,开始从通用深度学习框架进入特定模型家族。它围绕视觉任务展开,重点在于说明为什么图像问题通常不会直接使用普通全连接结构,以及 CNN 是怎样利用局部连接、参数共享和层次化特征提取来处理图像数据的。
这讲主要讲什么
这一讲既讲基础结构,也讲经典模型和实践,适合用来建立“从原理到网络设计”的第一轮认识。
- 概述:从深层神经网络在图像问题上的局限出发,引出卷积神经网络的基本思想。
- 自己动手搭 CNN:介绍 CNN 的基本结构、训练方式,以及如何用 Paddle 实现一个可运行的卷积网络。
- 经典 CNN 结构探索:串起 AlexNet、VGG、GoogLeNet/Inception、ResNet 等代表性架构,帮助理解模型演化方向。
- 课程实践:以猫狗分类为例,把图像分类任务真正落到数据和模型实现上。
适合怎么学
- 学这一讲时,建议反复关注张量形状是怎么变化的。卷积层、池化层、通道数和特征图尺寸的变化,是理解 CNN 的关键。
- 看经典网络时不要只记名字,应该重点比较它们分别解决了什么问题,比如更深、更宽、计算效率或梯度传递。
- 如果时间有限,至少自己实现一个最小 CNN 并跑一次分类任务,这会让后面的检测、分割等内容更容易接上。