跳到主要内容

3-卷积神经网络

这是本系列的第 3 讲，开始从通用深度学习框架进入特定模型家族。它围绕视觉任务展开，重点在于说明为什么图像问题通常不会直接使用普通全连接结构，以及 CNN 是怎样利用局部连接、参数共享和层次化特征提取来处理图像数据的。

这讲主要讲什么

这一讲既讲基础结构，也讲经典模型和实践，适合用来建立“从原理到网络设计”的第一轮认识。

概述：从深层神经网络在图像问题上的局限出发，引出卷积神经网络的基本思想。
自己动手搭 CNN：介绍 CNN 的基本结构、训练方式，以及如何用 Paddle 实现一个可运行的卷积网络。
经典 CNN 结构探索：串起 AlexNet、VGG、GoogLeNet/Inception、ResNet 等代表性架构，帮助理解模型演化方向。
课程实践：以猫狗分类为例，把图像分类任务真正落到数据和模型实现上。

适合怎么学

学这一讲时，建议反复关注张量形状是怎么变化的。卷积层、池化层、通道数和特征图尺寸的变化，是理解 CNN 的关键。
看经典网络时不要只记名字，应该重点比较它们分别解决了什么问题，比如更深、更宽、计算效率或梯度传递。
如果时间有限，至少自己实现一个最小 CNN 并跑一次分类任务，这会让后面的检测、分割等内容更容易接上。

在线预览

卷积神经网络.pdf

新窗口打开下载 PDF

如果手机上内嵌预览仍无法正常纵向滚动，请使用“新窗口打开”或“下载 PDF”。

这讲主要讲什么
适合怎么学
在线预览