2025-12-31から1日間の記事一覧

【Transformer】AIで重要な深層学習モデルの基本まとめ6【M-MHA編】

本記事ではAIの基礎となったTransfomerで使われるMasked Multi Head Attentionについてご紹介しています。処理自体は簡単ですが、どうしてMaskしているのか、なぜMaskしているのかまでご紹介しているので、疑問に思っている方はぜひご覧ください。