TensorFlow深度学习实战(21)——Transformer架构详解与实现
TensorFlow深度学习实战(21)——Transformer架构详解与实现
0. 前言
1. Transformer 架构
1.1 关键思想
1.2 计算注意力
1.3 编码器-解码器架构
1.4 Transformer 架构
1.5 模型训练
2. Transformer 类别
2.1 解码器(自回归)模型
2.2 编码器(自编