Стандарт PDF/A

Стандарт PDF/A

2021-07-30 · 3 мин. для прочтения

PDF/A (Portable Document Format/A) есть стандарт для долгосрочного архивного хранения электронных документов.

Содержание

1 Общая информация

  • Является подмножеством формата PDF (см. Формат PDF), из которого исключены некоторые особенности, не подходящие для долгосрочного архивного хранения.

1.1 Версии

1.1.1 PDF/A-1

  • Стандарт: ISO 19005-1:2005 https://www.iso.org/standard/38920.html.
  • На основе PDF 1.4.
  • Опубликован 1 октября 2005 г.
  • Не поддерживает:
    • JPEG 2000;
    • слои;
    • вложения;
    • прозрачность.
  • Уровни соответствия: a, b.

1.1.2 PDF/A-2

  • Стандарт: ISO 19005-2:2011 https://www.iso.org/standard/50655.html.
  • На основе PDF 1.7 (ISO 32000-1:2008 https://www.iso.org/standard/51502.html).
  • Версия PDF/A-2 разработана в 2011.
  • PDF/A-2 обратно совместим с PDF/A-1.
  • Дополнения:
    • слои;
    • улучшенное сжатие изображений (JPEG 2000 и JBIG2);
    • вложения (только формата PDF/A);
    • прозрачность.
  • Уровни соответствия: a, b, u.

1.1.3 PDF/A-3

  • Стандарт: ISO 19005-3:2012 https://www.iso.org/standard/57229.html.
  • На основе PDF 1.7 (ISO 32000-1:2008 https://www.iso.org/standard/51502.html).
  • Дополнения:
    • вложение файлов любого типа.
  • Недостатки:
    • Стандарт не может гарантировать возможность обработки произвольных вложенных файлов в будущем.
      • Это позволяет обойти архивные ограничения на разрешенные форматы.
  • Уровни соответствия: a, b, u.

1.1.4 PDF/A-4

  • Стандарт: ISO 19005-4:2019.
  • На основе PDF 2.0 (ISO 32000-2:2017 https://www.iso.org/standard/63534.html).
  • Дополнения:
    • стандарт требует сопоставления Unicode для всех шрифтов.
  • Уровни соответствия: e, f.

1.2 Уровни соответствия

1.2.1 Уровень b (Basic)

  • Цель: обеспечение надёжного воспроизведения внешнего вида документа.
  • PDF/A-1b, PDF/A-2b, PDF/A-3b.

1.2.2 Уровень а (Accessible)

  • Цель: обеспечение возможности поиска и преобразования содержимого документа.
  • Включает все требования уровня b и дополнительно требует, чтобы была включена структура документа.
  • PDF/A-1a, PDF/A-2a, PDF/A-3a.
  • Требования:
    • Содержимое должно быть помечено деревом иерархической структуры, что означает, что такие элементы, как порядок чтения, рисунки и таблицы, явно идентифицируются с помощью метаданных.
    • Должен быть указан естественный язык документа.
    • Изображения и символы должны иметь альтернативный описательный текст.
    • Файл должен включать сопоставление символов с Unicode для надежного поиска и копирования.

1.2.3 Уровень u (Unicode)

  • PDF/A-2u, PDF/A-3u.
  • Требуется сопоставление символов с Unicode.
  • Изменения:
    • отбрасываются требования уровня a, включая встроенную логическую структуру (т. е. теги и дерево структур).

1.2.4 Уровень f (Format)

  • PDF/A-4f.
  • Изменения:
    • позволяет встраивать типы файлов любого другого формата.

1.2.5 Уровень e (Engineering)

  • PDF/A-4e.
  • Изменения:
    • поддержка аннотаций типов RichMedia и 3D.

2 Требования для соответствия стандарту

  • запрещён аудио- и видеоконтент;
  • запрещено внедрение кода на javascript и команд на запуск исполняемых файлов;
  • все шрифты должны быть внедрены, а также они должны быть легально внедряемы для неограниченного универсального отображения. Это также касается и так называемых стандартных шрифтов Postscript, таких как Times или Helvetica;
  • цветовые пространства определяются независимым от устройства способом;
  • шифрование не разрешено;
  • предписывается использование основанных на стандартах метаданных.

3 Программная реализация

3.1 LaTeX