注意力机制—Attention、local Attention、self Attention、Hierarchical attention

  • Post author:
  • Post category:其他


一、编码-解码架构

目的:解决语音识别、机器翻译、知识问答等输出输入序列长度不相等的任务。

C是输入的一个表达(representation),包含了输入序列的有效信息。

  • 它可能是一个向量,也可能是一个固定长度的向量序列;
  • 如果C是一个向量序列,则它和输入序列的区别在于:序列C是定长的、较短的;而输入序列是不定长的、较长的。

二、注意力机制

1.attention

2.local attention

3.self attention

4.Hierarchical attention

转载于:https://www.cnblogs.com/nxf-rabbit75/p/11555683.html