MacでPDFを画像ファイル(jpg)に一括変換する方法
目的
Macで大量のPDF形式の画像ファイルをjpgに変換できるようになる。
全体の流れ
- コマンド類のインストール
- コマンドの実行
手順
1.コマンド類のインストール
pdfimagesをインストール
brew install homebrew/x11/xpdf
ghostscriptをインストール
brew install ghostscript
2.PDFから画像ファイル(jpg)に変換する
jpgファイルに変換する
pdfimages -j hoge-001.pdf hoge-001
>hoge-001-0000.jpgファイルが作られます
3.ループ処理で大量のPDFを画像ファイル(jpg)に変換する
hoge-001.jpgからhoge-002.jpgのように連番でPDFファイルがある場合
for i in $(seq -w 1 100); do echo $i; pdfimages -j hoge-${i}.pdf ${i}; done
結果
001-0000.jpg
002-0000.jpg
003-0000.jpg
...
連番の0000を除去したい時はこんな感じでゴリゴリ変えちゃう
for i in $(seq -w 1 100); do echo $i; pdfimages -j hoge-${i}.pdf ${i}; mv ${i}-0000.jpg ${i}.jpg; done
PDFの元がグレースケールのモノクロデータだった時
pdfimagesでjpgに変換しようとするとpbmファイルになります。これだとダメなのでImageMagickでpbmからjpgに変換します。ただし、グレースケールの場合は白黒が反転する仕様なので、元に戻さないといけません。
ImageMagickのインストール方法
brew install imagemagick
pbmからjpgへの白黒反転とJPG変換方法
convert -negate 001.pbm 001jpg
PDFの元がPPMファイルだった時
これまたスキャナによってはたまにあるppmファイルですが、Imagemagickで同じように変換します。ImageMagickが拡張子から自動で判別してくれるので以下のようにコマンドを叩きます。
ppmからjpgへの変換方法
convert 001.ppm 001.jpg
JPGじゃなくてPNGや他のにしたい時
ImageMagickは拡張子を自動で判別して変換してくれるので変換先を変えれば変わります。ただし変換するごとにJPG,PNG,GIFなどの不可逆圧縮は画質が劣化していくので注意が必要です。逆にTIFFファイルなんかは可逆圧縮なので劣化することはありません。
PNGに変換する方法
convert 001.jpg 001.png
まとめ
pdfimagesとImageMagickでPDFから画像ファイルに変換することができる。一括変換ツールは有料でいくつかあるけれど、フリーのコマンドだけでかんたんに変換できます。かんたん!