跳到主要内容

6-深度学习应用(计算机视觉)

这是本系列的第 6 讲,重点不再是某一个基础模型,而是视觉方向里常见任务的整体版图。它适合作为 CNN 之后的延伸阅读,帮助你从“会做图像分类”走向“知道视觉问题还包括哪些任务,它们的输出形式和难点分别是什么”。

这讲主要讲什么

这一讲把计算机视觉中的多个子任务放在一起看,适合建立任务间的差异化理解。

  • 目标检测:介绍两阶段方法、一阶段方法以及后续演进方向,帮助区分分类和检测的本质差别。
  • 典型图像分析任务:覆盖图像分割、图像搜索和目标跟踪等常见方向。
  • 特色图像分析任务:延伸到细粒度分类、风格迁移、图像标题生成和超分辨率等更具体的专题。
  • 垂直应用与实践:把视觉方法放到医学影像分析、文字检测识别等场景中,并以目标检测作为实践案例。

适合怎么学

  • 学这一讲时,建议把每个任务的输入输出先分清楚。例如检测是框和类别,分割是像素级预测,跟踪则强调时序连续性。
  • 如果你准备做工程项目,目标检测和分割通常最值得先深入,因为它们和真实场景的联系最直接。
  • 不必试图一次掌握所有视觉专题,先建立任务地图,再按自己后续的项目方向挑一个继续深挖会更有效。

在线预览

深度学习应用(计算机视觉).pdf

如果手机上内嵌预览仍无法正常纵向滚动,请使用“新窗口打开”或“下载 PDF”。