Pdf. Обработка. pdfcpu

Pdf. Обработка. pdfcpu

2023-12-02 · 2 мин. для прочтения

Библиотека и программа pdfcpu для манипуляций с pdf.

Содержание

1 Информация

2 Установка

2.1 Linux

  • Gentoo (оверлей kermit):
    1emerge -v app-text/pdfcpu-bin
    

3 Использование

3.1 Примечания

  • При чтении документов в формате pdf можно делать примечания, которые сохраняются как Annotation.
  • После работы может возникнуть желание удалить их.
  • Для этого можно использовать команду:
    1pdfcpu annotations remove [-p(ages) selectedPages] inFile [outFile] [objNr|annotId|annotType]
    
  • Удалить аннотацию с номером объекта 575, взятую из вывода pdfcpu annotation list:
    1pdfcpu annot remove test.pdf 575
    
  • Удалить аннотации для первых 5 страниц:
    1pdfcpu annot remove -pages 1-5 test.pdf
    
  • Удалить все аннотации:
    1pdfcpu annot remove test.pdf
    

3.2 Водяные знаки

  • Водяные знаки можно накладывать друг на друга.
  • Это позволяет создавать более сложные штампы страниц — смесь текста, изображений и стороннего содержимого PDF-страниц.
  • Водяной знак — это текст или изображение, которое появляется перед или позади существующего содержимого документа.
  • Водяной знак интегрирован в страницу PDF как фиксированный элемент.
  • В pdfcpu выделяется два вида водяных знаков:
    • stamp: появляется перед существующим содержимым страницы, располагаясь поверх всего остального на странице в фиксированном положении;
    • watermark: появляется за существующим содержимым страницы и находится на фоне страницы в фиксированном положении.
  • Применение:
    1pdfcpu watermark add    [-p(ages) selectedPages] -m(ode) text|image|pdf -- string|file description inFile [outFile]
    2pdfcpu watermark update [-p(ages) selectedPages] -m(ode) text|image|pdf -- string|file description inFile [outFile]
    3pdfcpu watermark remove [-p(ages) selectedPages] inFile [outFile]
    
  • Можно сделать на первой странице пометку как на arxiv.org:
    1pdfcpu stamp add -mode text -p 1 -- "Text for mark" 'color:0.4 0.4 0.9, rot:90, pos:l, fontname:Courier, points:13, scalefactor:1 abs, offset:20 0' in.pdf out.pdf
    
  • При просмотре информации о файле можно увидеть свойство Watermarked: Yes:
    1pdfcpu info out.pdf