Zum Inhalt

Seiten aus PDF entfernen

Der Service Task „Seiten aus PDF entfernen" entfernt gezielt einzelne Seiten aus einer PDF-Datei. So lassen sich z. B. Deckblätter, leere Seiten oder nicht benötigte Anhänge vor der Weiterverarbeitung entfernen.


Input-Parameter

Die folgenden Felder werden als Eingabe für den Task benötigt:

{
  "pdf": {
    "referenceId": "...",
    "filename": "vertrag.pdf",
    "contentType": "application/pdf"
  },
  "pages": [1, 5, 8]
}

Erläuterung:

  • pdf: Die Datei-Referenz der PDF-Datei, aus der Seiten entfernt werden sollen (Pflichtfeld).
  • pages: Ein Array mit den Seitennummern, die entfernt werden sollen (Pflichtfeld). Die Angabe ist 1-basiert – Seite 1 ist die erste Seite des Dokuments.

Output

Der Task gibt eine Datei-Referenz der neuen PDF-Datei zurück (ohne die entfernten Seiten).

{
  "referenceId": "...",
  "filename": "vertrag.pdf",
  "contentType": "application/pdf",
  "removedCount": 3,
  "remainingCount": 9
}

Erläuterung:

  • referenceId: Datei-Referenz der neuen PDF-Datei.
  • filename: Dateiname (wird aus dem Original übernommen).
  • contentType: MIME-Typ der Datei.
  • removedCount: Anzahl der tatsächlich entfernten Seiten.
  • remainingCount: Anzahl der verbleibenden Seiten.

JSONata-Beispiele

Erste Seite (Deckblatt) entfernen:

{
  "pdf": $.dokument,
  "pages": [1]
}

Erste und letzte Seite entfernen:

{
  "pdf": $.dokument,
  "pages": [1, $.metadaten.pageCount]
}

Hinweise

  • Seitennummern, die nicht im Dokument existieren (z. B. Seite 20 bei einem 10-seitigen PDF), werden ignoriert.
  • Es muss mindestens eine Seite im Dokument verbleiben – andernfalls wird ein Fehler zurückgegeben.
  • Die Originalreihenfolge der verbleibenden Seiten bleibt erhalten.

Tipp

In Kombination mit dem Service „PDF-Metadaten lesen" kann die Seitenanzahl vorab ermittelt werden. So lässt sich z. B. dynamisch die letzte Seite entfernen, ohne die Gesamtseitenzahl fest im Prozess hinterlegen zu müssen.