MacでPDFを画像ファイル(jpg)に一括変換する方法

目的

Macで大量のPDF形式の画像ファイルをjpgに変換できるようになる。

 

全体の流れ

  1. コマンド類のインストール
  2. コマンドの実行

 

手順

1.コマンド類のインストール

pdfimagesをインストール

brew install homebrew/x11/xpdf

 

ghostscriptをインストール

brew install ghostscript

 

2.PDFから画像ファイル(jpg)に変換する

jpgファイルに変換する

pdfimages -j hoge-001.pdf hoge-001

>hoge-001-0000.jpgファイルが作られます

 

3.ループ処理で大量のPDFを画像ファイル(jpg)に変換する

hoge-001.jpgからhoge-002.jpgのように連番でPDFファイルがある場合

for i in $(seq -w 1 100); do echo $i; pdfimages -j hoge-${i}.pdf ${i}; done 

 

結果

001-0000.jpg

002-0000.jpg

003-0000.jpg

...

 

連番の0000を除去したい時はこんな感じでゴリゴリ変えちゃう

for i in $(seq -w 1 100); do echo $i; pdfimages -j hoge-${i}.pdf ${i}; mv ${i}-0000.jpg ${i}.jpg; done 

 

PDFの元がグレースケールのモノクロデータだった時

pdfimagesでjpgに変換しようとするとpbmファイルになります。これだとダメなのでImageMagickでpbmからjpgに変換します。ただし、グレースケールの場合は白黒が反転する仕様なので、元に戻さないといけません。

 

ImageMagickのインストール方法

brew install imagemagick

 

pbmからjpgへの白黒反転とJPG変換方法

convert -negate 001.pbm 001jpg

 

PDFの元がPPMファイルだった時

これまたスキャナによってはたまにあるppmファイルですが、Imagemagickで同じように変換します。ImageMagickが拡張子から自動で判別してくれるので以下のようにコマンドを叩きます。

 

ppmからjpgへの変換方法

convert 001.ppm 001.jpg

 

JPGじゃなくてPNGや他のにしたい時

ImageMagickは拡張子を自動で判別して変換してくれるので変換先を変えれば変わります。ただし変換するごとにJPG,PNG,GIFなどの不可逆圧縮は画質が劣化していくので注意が必要です。逆にTIFFファイルなんかは可逆圧縮なので劣化することはありません。

 

PNGに変換する方法

convert 001.jpg 001.png

 

まとめ

pdfimagesとImageMagickでPDFから画像ファイルに変換することができる。一括変換ツールは有料でいくつかあるけれど、フリーのコマンドだけでかんたんに変換できます。かんたん!