Zum Inhalt

PDF-Metadaten lesen

Der Service Task „PDF-Metadaten lesen" liest strukturelle Informationen und Metadaten aus einer PDF-Datei aus. So lassen sich Eigenschaften wie die Seitenanzahl, der Titel oder der Autor ermitteln – z. B. als Entscheidungsgrundlage für nachfolgende Prozessschritte.


Input-Parameter

Die folgenden Felder werden als Eingabe für den Task benötigt:

{
  "pdf": {
    "referenceId": "...",
    "filename": "jahresbericht.pdf",
    "contentType": "application/pdf"
  }
}

Erläuterung:

  • pdf: Die Datei-Referenz der PDF-Datei, deren Metadaten ausgelesen werden sollen (Pflichtfeld).

Output

Der Task gibt die verfügbaren Metadaten als Objekt zurück.

{
  "pageCount": 12,
  "title": "Jahresbericht 2025",
  "author": "Max Mustermann",
  "subject": null,
  "creator": null,
  "producer": "pdf-lib",
  "creationDate": "2025-01-15T10:30:00.000Z",
  "modificationDate": null,
  "filename": "jahresbericht.pdf"
}

Erläuterung:

  • pageCount: Anzahl der Seiten im Dokument.
  • title: Titel des Dokuments (falls im PDF hinterlegt).
  • author: Autor des Dokuments (falls hinterlegt).
  • subject: Betreff des Dokuments (falls hinterlegt).
  • creator: Anwendung, mit der das Dokument erstellt wurde.
  • producer: Software, die die PDF-Datei erzeugt hat.
  • creationDate: Erstellungsdatum im ISO-8601-Format.
  • modificationDate: Datum der letzten Änderung im ISO-8601-Format.
  • filename: Der Dateiname aus der Eingabe.

Fehlende Metadaten

Nicht alle PDF-Dateien enthalten vollständige Metadaten. Felder ohne Wert werden als null zurückgegeben.


JSONata-Beispiele

Seitenanzahl als Gateway-Bedingung verwenden:

{
  "pdf": $.dokument
}

Anschließend kann im Prozess z. B. über $.pageCount > 10 eine Verzweigung gesteuert werden.


Hinweise

  • Der Task verändert die PDF-Datei nicht – es wird nur gelesen.
  • Die Ergebnisse können in nachfolgenden Schritten als Bedingung oder zur Anzeige verwendet werden.

Tipp

Die Seitenanzahl eignet sich besonders gut als Gateway-Bedingung: z. B. „Wenn das Dokument mehr als 20 Seiten hat → automatisch komprimieren" oder „Einzelseitige PDFs direkt weiterleiten, mehrseitige zuerst zur Prüfung".