KI: Dokument klassifizieren

Der Service Task „KI: Dokument klassifizieren" ordnet einen beliebigen Text automatisch einer der vorgegebenen Kategorien zu. Die Klassifizierung erfolgt per KI (OpenAI) und liefert neben der erkannten Kategorie einen Konfidenzwert zwischen 0 und 1 zurück.

Typische Einsatzszenarien sind die automatische Sortierung eingehender Dokumente (z. B. Rechnung, Angebot, Mahnung) oder die Vorqualifizierung von Support-Anfragen.

Input-Parameter

Die folgenden Felder werden als Eingabe für den Task benötigt:

{
  "text": "Sehr geehrte Damen und Herren, anbei erhalten Sie unsere Rechnung Nr. 2024-001 über 1.500,00 EUR.",
  "categories": ["Rechnung", "Angebot", "Mahnung", "Bestellung", "Sonstiges"]
}

Erläuterung:

text: Der zu klassifizierende Text. Kann direkt aus einem Dokument, einer E-Mail oder einem Formularfeld stammen.
categories: Ein Array mit mindestens zwei Kategorien. Die KI wählt genau eine davon aus.

Output

Der Task gibt die erkannte Kategorie und einen Konfidenzwert zurück:

{
  "category": "Rechnung",
  "confidence": 0.95
}

Erläuterung:

category: Die erkannte Kategorie – immer exakt einer der im Input definierten Werte.
confidence: Zahl zwischen 0 und 1, die angibt, wie sicher die Zuordnung ist (1 = sehr sicher).

JSONata-Beispiele

// Beispiel: Text aus einem vorherigen Schritt klassifizieren
{
  "text": schrittErgebnis.extractedText,
  "categories": ["Rechnung", "Angebot", "Mahnung", "Reklamation", "Sonstiges"]
}

// Beispiel: Nur bei hoher Konfidenz weiterverarbeiten (Gateway-Condition)
result.confidence > 0.8

Hinweise

Es werden mindestens zwei Kategorien benötigt.
Die Kategorien können frei gewählt werden – es gibt keine Einschränkung bei der Benennung.
Längere und aussagekräftigere Texte führen zu besseren Ergebnissen.
Der Konfidenzwert eignet sich gut als Bedingung in einem nachfolgenden Gateway (z. B. bei niedriger Konfidenz eine manuelle Prüfung einleiten).

Tipp

Die Kombination mit dem Service Task „PDF-Text extrahieren" ist besonders effektiv: Zuerst wird der Text aus einem PDF extrahiert und anschließend automatisch klassifiziert.