GPTはtransformerのdecoderのみ使っているらしい。
https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf
Decoderのみのtransformerの元論文。こちらでは長い入力を扱うために入力を分割したり複数のkeyとvalueを圧縮したりしてる。
GPTはtransformerのdecoderのみ使っているらしい。
https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf
Decoderのみのtransformerの元論文。こちらでは長い入力を扱うために入力を分割したり複数のkeyとvalueを圧縮したりしてる。
No replies yet.