第七讲_图像描述(图说)Image Captioning

  • 本章结构
    第七讲_图像描述(图说)Image Captioning-LMLPHP
  • 递归神经网络
    第七讲_图像描述(图说)Image Captioning-LMLPHP

  • 时序后向传播(BPTT)
    第七讲_图像描述(图说)Image Captioning-LMLPHP

朴素Vanilla-RNN

  • 基本模型
  • 用sigmoid存在严重的梯度消失
    第七讲_图像描述(图说)Image Captioning-LMLPHP

LSTM长短时记忆模型(97年提出)

  • 基本模型
    第七讲_图像描述(图说)Image Captioning-LMLPHP
  • 模型对比
    第七讲_图像描述(图说)Image Captioning-LMLPHP
  • LSTM数学模型
    第七讲_图像描述(图说)Image Captioning-LMLPHP
  • 控制门作用理解
  • LSTM结构图
    第七讲_图像描述(图说)Image Captioning-LMLPHP
    第七讲_图像描述(图说)Image Captioning-LMLPHP
    第七讲_图像描述(图说)Image Captioning-LMLPHP
    第七讲_图像描述(图说)Image Captioning-LMLPHP
    第七讲_图像描述(图说)Image Captioning-LMLPHP
    第七讲_图像描述(图说)Image Captioning-LMLPHP
    第七讲_图像描述(图说)Image Captioning-LMLPHP

  • LSTM变种:
  • Peephole
  • Coupled 忘记输入门

GRU门限递归单元(Gated Recurrent Unit)

  • 改进
    第七讲_图像描述(图说)Image Captioning-LMLPHP
  • LSTM和GRU比较
    第七讲_图像描述(图说)Image Captioning-LMLPHP

图像描述

  • 为图片生成描述语言
    第七讲_图像描述(图说)Image Captioning-LMLPHP

  • 具有多模态理解和推理;复合理解与推理等研究难点和挑战
    第七讲_图像描述(图说)Image Captioning-LMLPHP
  • 传统的分段处理策略
    第七讲_图像描述(图说)Image Captioning-LMLPHP
  • 新的点对点策略
    第七讲_图像描述(图说)Image Captioning-LMLPHP
  • 模型组成
    第七讲_图像描述(图说)Image Captioning-LMLPHP

Show and tell 模型

  • 概述
    第七讲_图像描述(图说)Image Captioning-LMLPHP
    第七讲_图像描述(图说)Image Captioning-LMLPHP

  • 具有attention机制模型
    第七讲_图像描述(图说)Image Captioning-LMLPHP
    第七讲_图像描述(图说)Image Captioning-LMLPHP

数据集

  • MSCOCO标注集
    第七讲_图像描述(图说)Image Captioning-LMLPHP
05-19 12:59