拡散モデル

machine_learning

DDPM https://github.com/cloneofsimo/minDiffusion を使用。 MNIST, KMNIST 共に a2-highgpu-1g で 8494MiB 程度の VRAM を使用。 batch_size < 8 で、VRAM の使用量が 1GB 程度まで落ちる。batch_size = 8 で 6GB 程度。何故急に増えるかは未調査。 1 epoc…

2023-03-15

WSL2 上で PyTorch を使いたい

machine_learning WSL2 GPU Windows

基本的には WSL2 上で CUDA を使いたい - らんだむな記憶を済ませて PyTorch をインストールするだけである。ところで、cuDNN を導入していなくて以下のような値が返ってくる: >>> import torch >>> torch.backends.cudnn.version() 8500 >>> torch.backend…

2023-02-19

CelebA のダウンロード

machine_learning

ちゃんと自分でダウンロードしたことがないらしく、CelebA (Large-scale CelebFaces Attributes) データセットのダウンロードを参考にさせてもらう。

2023-02-08

CPU と MPS で推論結果に差が出る

machine_learning Mac

CPU and MPS floating point math is different (in a significant way) · Issue #84936 · pytorch/pytorch · GitHub わりと悲しい。

2023-02-02

DDPM と DDIM

machine_learning

minDiffusion/mindiffusion at master · cloneofsimo/minDiffusion · GitHub GitHub - ermongroup/ddim: Denoising Diffusion Implicit Models が参考になるはず。

2022-12-12

Diffusion Model

machine_learning

次世代生成モデル、Diffusion Modelの紹介 - GMOインターネットグループグループ研究開発本部（次世代システム研究室）暇な時にでもやってみるかと思って twitter に投稿して埋もれてしまっていた・・・。どこに書いたか分からなくなるんだよなぁ・・・。

2022-09-11

Stable Diffusion

machine_learning

https://github.com/CompVis/stable-diffusion https://github.com/harubaru/waifu-diffusion/ https://huggingface.co/hakurei/waifu-diffusion 話題のStable Diffusionがオープンソース化されたのでローカルで動かしてみる Google Colab ではじめる Waifu…

2022-08-06

torchinfo

machine_learning

torchsummaryよりtorchinfoがいいよという話 - Qiita たまに使うのに torchinfo の備忘録を残してなかった。PyTorch で summary を叩きたい時用。

2022-07-14

tqdm のプログレスバー

machine_learning

python - How to remove progressbar in tqdm once the iteration is complete - Stack Overflow ちゃんと覚えてないけど、この内容を覚えておきたかったことだけ覚えている。

2022-07-13

ML と QC の論文

machine_learning quantum_computing

ML も QC も論文を見ても何が何やら分からない。ML は意味は分からないけど、まぁまぁやりたいことは分かる。分かるが、教師データなりを放り込んでゴリゴリ回したらどうして各モジュールがその役割を担うようにパラメータが収束していくことを期待できるの…

2022-07-01

機械学習エンジニアのためのTransformers

machine_learning book

機械学習エンジニアのためのTransformers ―最先端の自然言語処理ライブラリによるモデル開発論文読んでも結局よく分からない・・・というか自分で使える気がしないところにいい感じの本が出そう。ということでポチる。

2022-06-20

TensorFlow と JAX

machine_learning

小川雄太郎 on Twitter: "Google全体として、TensorFlowからJAXへと移行する気配です。今後のTFのメンテはどうなるんだろう確かにJAXは使いやすい部分もあり、PyTorchもJAXの機能を取り込んでいます（FUNCTORCH：https://t.co/lENjbbzgHt）2階微分のヘシア…

2022-05-26

OpenCVではじめようディープラーニングによる画像認識

machine_learning

https://github.com/ghmagazine/opencv_dl_book が対応するコードみたい。実装を見ると訓練済みウェイトを読み込むパターンが多いのかなぁ・・・。

2022-05-19

自己注意の可視化

machine_learning

GitHub - sayakpaul/probing-vits: Probing the representations of Vision Transformers. なんかこれそういうことができそう。

2022-05-01

ボルツマン分布

machine_learning

テンソルネットワークの基礎と応用 - 株式会社サイエンス社株式会社新世社株式会社数理工学社を買ってみた。*1ボルツマン分布 (或いはギブス・ボルツマン分布) の話が少し触れられていたので、その関係で深層学習改訂第2版 | 書籍情報 | 株式会社講談…

2022-04-30

NDLOCR

machine_learning

OCR処理プログラム及び学習用データセットの公開について | NDLラボを触ってみた系の記事を結構見かけるようになったので、一応メモ的に残しておこう。GitHub - ndl-lab/pdmocrdataset-part1: デジタル化資料OCRテキスト化事業において作成されたOCR学習用…

2022-04-23

ゼロから作るDeep Learning ❹ 強化学習編

machine_learning

GitHub - oreilly-japan/deep-learning-from-scratch-4 え・・・全然知らなかった。流石にもう続刊は出ないでしょって思ってた・・・。いまとても量子コンピュータに全振りしたいのにコレも気になるという・・・。どっかで時間を見つけてまた写経せねば・・…

2022-04-22

Panoptic segmentation

machine_learning

記録を残していると思ったら全然残してなかった・・・。AI最新論文読み会2021年10月 - Speaker Deck に参加した時に聞いたのであった。論文としては、[2109.03814] Panoptic SegFormer: Delving Deeper into Panoptic Segmentation with Transformers が紹介…

2022-04-21

完全畳み込み

machine_learning

Learning to Simplify: Fully Convolutional Networks for Rough Sketch Cleanup ふと見ると、ダウンサンプリングとアップサンプリングの層の数が U-Net によく似ている。そしてスキップ接続を除けば Pix2pix に似ているし、線画とラフスケッチというドメイ…

2022-04-20

残差ブロック (1)

machine_learning

よく分からないけど ResNet の論文を読んでみる。深層ネットワークでは訓練精度が劣化してくるが、もしも超イケてるブロックだったら解決できると仮定してこれを $\mathcal{H}(\mathrm{x})$ としてみているようだ。何でかよく分からないけど、恒等写像 $\mat…

2022-04-10

勾配ブースティング木 (5)

machine_learning

ここ数年は「〇〇を使わなくても SOTA に近い性能が出せる」というモデルをよく見かける気がする。例えば、Vision Transformer は CNN を使わなくても、CNN を使った SOTA モデルに近い性能を出せると謳っていたと思う。LightGBM の論文を読むと、既存の勾配…

2022-04-07

JAX

machine_learning

自動微分に特化した NumPy とか言われる JAX。https://colab.research.google.com/github/google/jax/blob/main/docs/notebooks/quickstart.ipynb として Colab 用のサンプルがあった。 size = 3000 x = random.normal(key, (size, size), dtype=jnp.float32…

2022-04-03

論文翻訳サービス

machine_learning

【1paper】英語論文を自然な日本語に一瞬で翻訳したいなら、論文翻訳AI 1paperにお任せくださいというのを見つけたけど、どれくらいの精度なのだろう？

2022-04-01

タイタニック (5)

machine_learning

for fam_name, passengers in families.items(): for p in passengers: print(p['Ticket'], get_n_members(p)) で確認すると分かるのだが、苗字が同じ場合に間違って別の家族の一員扱いされて SibSp や Parch がコピペされているケースがあるようだ。実際の…

2022-03-31

タイタニック (4)

machine_learning

家族という情報は何かしら特徴量になりそうな気がする。 train_df = pd.read_csv('train.csv') test_df = pd.read_csv('test.csv') df_concat = pd.concat([train_df, test_df]) def get_surname(item): return item['Name'].split(',')[0] def get_n_member…

2022-03-30

タイタニック (3)

machine_learning

比例尺度の年齢同乗した兄弟姉妹・配偶者の数同乗した親と子供の数運賃および「チケットのクラス」と「性別」の数値化、「乗船した港」の one-hot エンコーディングをしてみた 9 つの数量を特徴量として決定木と簡単なニューラルネットワークで 2 クラ…

2022-03-29

タイタニック (2)

Kaggle machine_learning

タイタニックのデータセットの特徴量は年齢, 同乗した兄弟姉妹・配偶者の数, 同乗した親と子供の数, 運賃, チケットのクラス, 性別, チケット番号, 客室の番号, 乗船した港, 名前である。これを名義尺度, 順序尺度, 間隔尺度, 比例尺度に分類してみよう。名…

2022-03-28

SVM と GBM

machine_learning

『実践ＤａｔａＳｃｉｅｎｃｅシリーズＰｙｔｈｏｎではじめるＫａｇｇｌｅスタートブック』（石原祥太郎，村田秀樹）｜講談社BOOK倶楽部に Kaggle ではロジスティック回帰や SVM よりも GDM 系のほうが良さそうという感じのコラムが書かれている。なん…

2022-03-28

タイタニック (1)

Kaggle machine_learning

2019 年の夏〜冬のどっかで登録した Kaggle のアカウントに久しぶりに入ってみる。コンペがやりたいのではなく、タイタニックのデータセットが欲しいからなんだけど。決定木と勾配ブースティング木を適用して iris データセットよりはもう少しマシな結果を見…

2022-03-27

勾配ブースティング木 (4)

machine_learning

Greedy function approximation: A gradient boosting machine. の概要を読むと以下のようなことが書かれている: 関数の推定・近似を，パラメータ空間ではなく，関数空間における数値最適化の観点から捉える．段階的加法展開と最急降下法による最小化との間…