らんだむな記憶

blogというものを体験してみようか!的なー

1x1 畳み込み

たまに 1x1 畳み込みを使っているモデルがあるけど、これって何の意味が?と思っていた。画像認識 | 書籍情報 | 株式会社 講談社サイエンティフィク によると、1 枚のカーネルで $[b, c, h, w]$ を $[b, 1, h, w]$ へとチャネル数を変更するので、$c^\prime$ 枚のカーネルを用意すると $[b, c^\prime, h, w]$ になる。つまり、深さ(チャネル数)を変換する層であるとのこと。言われてみれば確かに。