Поради три способи відрізати поля у pdf-документа
Мова піде про те, як відрізати поля (і взагалі змінити розмір сторінок) в PDF-документі. Після того, як у мене з'явилася Новомосковсклка на електронному чорнилі, робити це доводиться досить часто.
Втім, у багатьох випадках можна легко зі звичайного PDF зробити PDF, легко Новомосковскемий на екрані Новомосковсклкі. Справа в тому, що значну частину площі сторінки зазвичай займають поля. Вони потрібні для паперової версії, але без них цілком можна обійтися на електронній Новомосковсклке. І якщо обрізати поля (а в деяких випадках можна обрізати і колонтитули), то часто змістовна частина сторінки буде виглядати цілком Новомосковскемой і на маленькому екрані Новомосковсклкі.
На сьогоднішній день я знайшов і спробував три способи обрізати поля у PDF-файлу.
1. Обрізка полів за допомогою pdfcrop
Є скрипт pdfcrop на Перл (не плутати з однойменною скриптом на Python), який вміє обрізати поля автоматично. В Debian він входить до складу пакету texlive-extra-utils.
Раджу завжди все одно залишати невелике поле (--margin 5), інакше стосуються краю букви можуть не відображатися на екрані Новомосковсклкі.
Загалом, все просто. Переваги: простий автоматичний спосіб, за отриманим таким способом PDF зберігається можливість пошуку. Недоліки такого способу: pdfcrop дуже повільно працює з великими документами (сотні сторінок), не можна автоматично відрізати колонтитули і замітки на полях (в деяких випадках простіше обійтися без номерів сторінок і назви глави зверху, зате отримати більш велике зображення основного тексту), конкретно моя Новомосковсклка іноді аварійно перевантажується на отриманих таким способом PDF, на деяких файлах pdfcrop неправильно визначає межі тексту, на деяких псує шрифти.
2. Растеризация і обрізка сторінок в ImageMagick
Пару раз мені довелося вдатися до написання саморобного скрипта, заточеного під певний вихідний PDF. Загальна схема така:
Вихідний PDF → растеризувати зображення сторінок (використовую pdftoppm) → розрізання сторінок на частини і обрізка полів (використовую convert з ImageMagick) → збірка нового PDF або DjVu з обрізаних сторінок.
Ось приклад такого скрипта, яким користуюся (він не тільки дозволяє розрізати сторінки на кілька колонок, але також відрізати поля і перетиснути, відкинувши порожні сторінки) - pdf-trim-to-djvu:
Як користуватися - має бути зрозуміло з його довідки:
Автоматична обрізка полів досить добре реалізована в команді -trim ImageMagick, але можна задати параметри обрізки і вручну (доводилося). Наприклад, щоб примусово обрізати по 3% з кожного боку, в опції convert можна вставити -shave 3% x3% + repage.
Якщо хочеться не DjVu, а саме PDF, то зібрати з зображень PDF можна так (про створення PDF за допомогою IM см. Тут): Якщо сторінок багато, такий спосіб буде дуже повільним (і ненажерливим), краще конвертувати кожну окремо (можна тим же convert. якщо якість влаштовує, можна спеціально для цих цілей призначеним sam2p), а потім об'єднувати сторінки разом. Для об'єднання PDF-сторінок в PDF-документ я використовую pdftk.
Переваги цього способу: можна розрізати і обрізати сторінки саме так, як треба. Недоліки: можливість пошуку по тексту безповоротно втрачається, розмір файлу зазвичай збільшується, добитися нормальної растеризации шрифту важко, ну і сам скрипт іноді доводиться міняти під конкретну книжку.
3. Зміна меж сторінки в PDFedit
