March 7, 2016

конвертируем PDF с разворотами на отдельные странички

Вы не поверите каким удивительным задротством я занимался сегодня вечером (и судя по часам потратил на это не менее 240 минут!!!)

Короче тема старая как мир - нужно было порезать на странички сканированную книжку в PDFе, которую отсканировали разворотами по 2 странички и, если я буду ее смотреть на своем kindle (который сцука несмотря шо амазон не умеет смотреть по половинкам, так как не предполагает что на нем будут чутать не превосходно и качественно сделанные электронные книги, а скачанные с торрентов сканы), - в общем на киндле это будет крайне неудобно, поэтому лучше заранее поерзать развороты на отдельные странички.

С когда-то проприетарным PDF всегда было все плохо (спасибо за это Adobe). И оказалось что сделать столь простую операцию в нашем 21 веке все также сложно (не имея адоби акробата и плагинов).

Вот на это и ушло время - чтобы почитать форумы и убедиться что в мире PDF такая же жопа как и 10 лет назад, потом найти какие-то программы которые работают и потом уже из принципа пройти весь этот ад хотя бы с этой собственно книжкой, ради которой все и затевалось (путеводитель по мексике).

Короче последовательность такая:

1) c помощью PDFSAM Basic превращаем исходный большой PDF кучу мелких PDF отдельных страничек (потому что это одоробло, написанное на Java в тифы конвертить не умеет в базовой версии)

2) с помощью XNConver конвертируем эти пидиэфы страничек в TIFF (нужно найти в настройках пункт где задается с каким разрешением конвертить эти пидиэфы - по умолчанию там 72 dpi и это очень мало - нужно ставить хотя бы 300 dpi). В итоге получаем папочку с тифами страничке (некоторые из которых - это развороты, состоящие из 2х страниц)

3) Дальше берем волшебный Scan Tailor, которые является просто охеренным полуавтоматическим тулом для постпроцессинга отсканированных книжек перед тем как паковать их в пдф или дежавю. И проходим там все предусмотренные пункты по нарезанию, выделению областей интереса, выставлению отступов, коррекции текстов и пр.

В конце выставляем разрешение в которое нужно вывалить результаты работы - я решил пойти на повышение и поставил 400 dpi (а для тифов выставил сжатие джейпег, хотя не уверен что это было разумно) - получаем папку новых тифок

4) потом XNConver  - снова загоняем TIFF в PDF отдельных страничек (я выставил режим сжатия джейпег 80 процентов)

5) PDFSAM Basic мержит все обратно в отдельный файл.

Пабаааам

https://dl.dropboxusercontent.com/u/17015210/%D0%9C%D0%BE%D0%BD%D0%B0%20%D0%9A%D0%B8%D0%BD%D0%B3%20-%20%D0%9C%D0%B5%D0%BA%D1%81%D0%B8%D0%BA%D0%B0%20-%20%D0%9F%D1%83%D1%82%D0%B5%D0%B2%D0%BE%D0%B4%D0%B8%D1%82%D0%B5%D0%BB%D0%B8%20%D0%A2%D0%BE%D0%BC%D0%B0%D1%81%D0%B0%20%D0%9A%D1%83%D0%BA%D0%B0%20-%202010.400dpi.pdf