Zum Inhalt

KI: Dokument klassifizieren

Der Service Task „KI: Dokument klassifizieren" ordnet einen beliebigen Text automatisch einer der vorgegebenen Kategorien zu. Die Klassifizierung erfolgt per KI (OpenAI) und liefert neben der erkannten Kategorie einen Konfidenzwert zwischen 0 und 1 zurück.

Typische Einsatzszenarien sind die automatische Sortierung eingehender Dokumente (z. B. Rechnung, Angebot, Mahnung) oder die Vorqualifizierung von Support-Anfragen.

Input-Parameter

Die folgenden Felder werden als Eingabe für den Task benötigt:

{
  "text": "Sehr geehrte Damen und Herren, anbei erhalten Sie unsere Rechnung Nr. 2024-001 über 1.500,00 EUR.",
  "categories": ["Rechnung", "Angebot", "Mahnung", "Bestellung", "Sonstiges"]
}

Erläuterung:

  • text: Der zu klassifizierende Text. Kann direkt aus einem Dokument, einer E-Mail oder einem Formularfeld stammen.
  • categories: Ein Array mit mindestens zwei Kategorien. Die KI wählt genau eine davon aus.

Output

Der Task gibt die erkannte Kategorie und einen Konfidenzwert zurück:

{
  "category": "Rechnung",
  "confidence": 0.95
}

Erläuterung:

  • category: Die erkannte Kategorie – immer exakt einer der im Input definierten Werte.
  • confidence: Zahl zwischen 0 und 1, die angibt, wie sicher die Zuordnung ist (1 = sehr sicher).

JSONata-Beispiele

// Beispiel: Text aus einem vorherigen Schritt klassifizieren
{
  "text": schrittErgebnis.extractedText,
  "categories": ["Rechnung", "Angebot", "Mahnung", "Reklamation", "Sonstiges"]
}
// Beispiel: Nur bei hoher Konfidenz weiterverarbeiten (Gateway-Condition)
result.confidence > 0.8

Hinweise

  • Es werden mindestens zwei Kategorien benötigt.
  • Die Kategorien können frei gewählt werden – es gibt keine Einschränkung bei der Benennung.
  • Längere und aussagekräftigere Texte führen zu besseren Ergebnissen.
  • Der Konfidenzwert eignet sich gut als Bedingung in einem nachfolgenden Gateway (z. B. bei niedriger Konfidenz eine manuelle Prüfung einleiten).

Tipp

Die Kombination mit dem Service Task „PDF-Text extrahieren" ist besonders effektiv: Zuerst wird der Text aus einem PDF extrahiert und anschließend automatisch klassifiziert.