PDF-Metadaten lesen
Der Service Task „PDF-Metadaten lesen" liest strukturelle Informationen und Metadaten aus einer PDF-Datei aus. So lassen sich Eigenschaften wie die Seitenanzahl, der Titel oder der Autor ermitteln – z. B. als Entscheidungsgrundlage für nachfolgende Prozessschritte.
Input-Parameter
Die folgenden Felder werden als Eingabe für den Task benötigt:
{
"pdf": {
"referenceId": "...",
"filename": "jahresbericht.pdf",
"contentType": "application/pdf"
}
}
Erläuterung:
pdf: Die Datei-Referenz der PDF-Datei, deren Metadaten ausgelesen werden sollen (Pflichtfeld).
Output
Der Task gibt die verfügbaren Metadaten als Objekt zurück.
{
"pageCount": 12,
"title": "Jahresbericht 2025",
"author": "Max Mustermann",
"subject": null,
"creator": null,
"producer": "pdf-lib",
"creationDate": "2025-01-15T10:30:00.000Z",
"modificationDate": null,
"filename": "jahresbericht.pdf"
}
Erläuterung:
pageCount: Anzahl der Seiten im Dokument.title: Titel des Dokuments (falls im PDF hinterlegt).author: Autor des Dokuments (falls hinterlegt).subject: Betreff des Dokuments (falls hinterlegt).creator: Anwendung, mit der das Dokument erstellt wurde.producer: Software, die die PDF-Datei erzeugt hat.creationDate: Erstellungsdatum im ISO-8601-Format.modificationDate: Datum der letzten Änderung im ISO-8601-Format.filename: Der Dateiname aus der Eingabe.
Fehlende Metadaten
Nicht alle PDF-Dateien enthalten vollständige Metadaten. Felder ohne Wert werden als null zurückgegeben.
JSONata-Beispiele
Seitenanzahl als Gateway-Bedingung verwenden:
{
"pdf": $.dokument
}
Anschließend kann im Prozess z. B. über $.pageCount > 10 eine Verzweigung gesteuert werden.
Hinweise
- Der Task verändert die PDF-Datei nicht – es wird nur gelesen.
- Die Ergebnisse können in nachfolgenden Schritten als Bedingung oder zur Anzeige verwendet werden.
Tipp
Die Seitenanzahl eignet sich besonders gut als Gateway-Bedingung: z. B. „Wenn das Dokument mehr als 20 Seiten hat → automatisch komprimieren" oder „Einzelseitige PDFs direkt weiterleiten, mehrseitige zuerst zur Prüfung".