CNN も使わず、注意機構も使わない、従って Transformer
系ではない画像分類モデルとして Google Brain から最新のモデルが出た。EfficientNetV2
とほぼ同時期なので興味深い。
- 論文: MLP-Mixer: An all-MLP Architecture for Vision
- 実装 (timm): https://github.com/rwightman/pytorch-image-models/blob/master/timm/models/mlp_mixer.py
論文に気づいたら既に timm
に実装があるって速度感が凄すぎる・・・
ただ・・・もう後発の研究として以下が数日前に出ているという・・・