らんだむな記憶

blogというものを体験してみようか!的なー

pdf のテキスト読み取り

pdfminer.six で pdf を読みとってみる。pythonでPDFからテキストを抽出してみる(PyPDF2, pdfminer.six) | DevelopersIO をチラ見して実行。

pip install pdfminer.six

して https://github.com/pdfminer/pdfminer.six/blob/develop/tools/pdf2txt.py を使ったらよく分からないエラーが出て、

pip uninstall pdfminer.six
pip install pdfminer

したら別のエラーが出て、どうもこっちのほうが古そうということで、もう一度

pip uninstall pdfminer
pip install pdfminer.six

したら動いた・・・。なんか依存関係だろうけどちゃんとメモってなかった・・・。