Transformerによる翻訳システム自作; part6 word embedding

Transformer自作

本稿ではword embeddingとしてFastTextを導入してみます。 Pretrained Word Embeddings コードまとめ他の記事 Pretrained Word Embeddings 学習済のword embeddingによる変換を試してみましょう。 pytorchで公開されているfastTextを使ってみます。これは…

2022-06-24

Transformerによる翻訳システム自作; part5 multi layer block

Transformer自作

本稿ではEncoderとDecoderをmulti-block化します。これでTransformerの基本的な構造は実装できたことになります。 Encoderでは、Attention → FeedForwardを一つのブロックとして、これを複数個積み上げます。このブロックでは入力と出力の次元は同じなので、…

2022-06-22

Transformerによる翻訳システム自作; part4 FeedForward & Residual Connection

Transformer自作

本稿ではFeedForward層とResidual connection（残差接続）、正規化層を導入します。Transformerはattention機構とFeedForward機構から構成されており、それぞれに対して残差接続が行われています。実装 FeedForward FeedForwardとは循環構造を持たないニュ…

2022-06-20

Transformerによる翻訳システム自作; part3 Multi-head Attention

Transformer自作

本稿ではMulti-head Attentionについて実装を行います。 Multi-head Attention Q, K, Vを分割してそれぞれでscaled dot-product attentionを実行、結果を集約(concat) こちらの方が精度が良い(理由は分からんけども; 複数の文脈を取り出せるという効果も) そ…