JPEG to PDF быстрая оцифровка книг

Версия для печатиВерсия для печати

jpeg to pdf
Понадобилось мне оцифровать книгу, то есть отсканировать ее в формате jpeg, обработать в приемлемое качество и сохранить одним файлом в формате pdf. Все операции ведутся на ноутбуке, управляемом Linux Gentoo в командном интерпретаторе, то бишь, никаких окошек и карамельных программ мы запускать не будем.

Все страницы книги я сканировал на обычном сканере в grey формате, при этом качество скана занижать не стал, книга старая, листы пожелтевшие и ветхие. Под конец сканирования в директории оказалась сотня файлов jpeg формата, пронумерованых и прошнурованных (:

Огорчение вызвал общий размер директории, она была тяжелее Годзиллы. В среднем каждый файл имел объем 130 - 150 Kb и собранная из него книга весила бы 15 - 18 Mb.

Придется заняться с файлами жестким фитнесом. Помогать нам будет imagemagick.

Для начала перейдем в директорию, содержащую наши сканы и создадим в ней директорию "2" в которую впоследствии будут помещены обработаные снимки и выполним суровую команду

convert *.jpeg -quality 50 2/%04d.jpeg

В переводе звучит так - найти все файлы с расширением jpeg, уменьшить качество до 50, произвести конвертирование в директорию "2", пронумеровать полученные файлы, начиная с 0000.jpeg и далее. Пока что это все наши желания.

Команда выполнена, переходим в директорию "2"

cd 2

Проверяем размер файлов, он уменьшился в два раза, как мы и просили. Теперь мы конвертируем все файлы с расширением jpeg, по порядку и соберем из них один файл с названием hris_m.pdf

convert *.jpg hris_m.pdf

Проверим результат

ls -lh hris_m.pdf
-rw-r--r-- 1 anatoly users 8,3M Окт 23 02:29 hris_m.pdf

Ну вот и все, как говорится, just for fun!

Если есть желание, можно почитать саму книгу.