Pdf. Обработка. pdfcpu

Библиотека и программа pdfcpu для манипуляций с pdf.

Содержание

1 Информация

2 Установка

2.1 Linux

  • Gentoo (оверлей kermit):
    emerge -v app-text/pdfcpu-bin
    

3 Использование

3.1 Примечания

  • При чтении документов в формате pdf можно делать примечания, которые сохраняются как Annotation.
  • После работы может возникнуть желание удалить их.
  • Для этого можно использовать команду:
    pdfcpu annotations remove [-p(ages) selectedPages] inFile [outFile] [objNr|annotId|annotType]
    
  • Удалить аннотацию с номером объекта 575, взятую из вывода pdfcpu annotation list:
    pdfcpu annot remove test.pdf 575
    
  • Удалить аннотации для первых 5 страниц:
    pdfcpu annot remove -pages 1-5 test.pdf
    
  • Удалить все аннотации:
    pdfcpu annot remove test.pdf
    

3.2 Водяные знаки

  • Водяные знаки можно накладывать друг на друга.
  • Это позволяет создавать более сложные штампы страниц — смесь текста, изображений и стороннего содержимого PDF-страниц.
  • Водяной знак — это текст или изображение, которое появляется перед или позади существующего содержимого документа.
  • Водяной знак интегрирован в страницу PDF как фиксированный элемент.
  • В pdfcpu выделяется два вида водяных знаков:
    • stamp: появляется перед существующим содержимым страницы, располагаясь поверх всего остального на странице в фиксированном положении;
    • watermark: появляется за существующим содержимым страницы и находится на фоне страницы в фиксированном положении.
  • Применение:
    pdfcpu watermark add    [-p(ages) selectedPages] -m(ode) text|image|pdf -- string|file description inFile [outFile]
    pdfcpu watermark update [-p(ages) selectedPages] -m(ode) text|image|pdf -- string|file description inFile [outFile]
    pdfcpu watermark remove [-p(ages) selectedPages] inFile [outFile]
    
  • Можно сделать на первой странице пометку как на arxiv.org:
    pdfcpu stamp add -mode text -p 1 -- "Text for mark" 'color:0.4 0.4 0.9, rot:90, pos:l, fontname:Courier, points:13, scalefactor:1 abs, offset:20 0' in.pdf out.pdf
    
  • При просмотре информации о файле можно увидеть свойство Watermarked: Yes:
    pdfcpu info out.pdf
    

Links to this note

Дмитрий Сергеевич Кулябов
Дмитрий Сергеевич Кулябов
Профессор кафедры теории вероятностей и кибербезопасности

Мои научные интересы включают физику, администрирование Unix и сетей.

Похожие