深度拆解transformer第02章:Transformer架构全景图——Encoder、Decoder与三种Attention的数据流
第02章:Transformer架构全景图——Encoder、Decoder与三种Attention的数据流
论文链接:Attention Is All You Need (Vaswani et al., NIPS 2017) 本章对应:Section 3.1, Section 3.2.3, Figure 1
核心困惑Transformer的整体

