KI: Dokument klassifizieren
Der Service Task „KI: Dokument klassifizieren" ordnet einen beliebigen Text automatisch einer der vorgegebenen Kategorien zu. Die Klassifizierung erfolgt per KI (OpenAI) und liefert neben der erkannten Kategorie einen Konfidenzwert zwischen 0 und 1 zurück.
Typische Einsatzszenarien sind die automatische Sortierung eingehender Dokumente (z. B. Rechnung, Angebot, Mahnung) oder die Vorqualifizierung von Support-Anfragen.
Input-Parameter
Die folgenden Felder werden als Eingabe für den Task benötigt:
{
"text": "Sehr geehrte Damen und Herren, anbei erhalten Sie unsere Rechnung Nr. 2024-001 über 1.500,00 EUR.",
"categories": ["Rechnung", "Angebot", "Mahnung", "Bestellung", "Sonstiges"]
}
Erläuterung:
text: Der zu klassifizierende Text. Kann direkt aus einem Dokument, einer E-Mail oder einem Formularfeld stammen.categories: Ein Array mit mindestens zwei Kategorien. Die KI wählt genau eine davon aus.
Output
Der Task gibt die erkannte Kategorie und einen Konfidenzwert zurück:
{
"category": "Rechnung",
"confidence": 0.95
}
Erläuterung:
category: Die erkannte Kategorie – immer exakt einer der im Input definierten Werte.confidence: Zahl zwischen 0 und 1, die angibt, wie sicher die Zuordnung ist (1 = sehr sicher).
JSONata-Beispiele
// Beispiel: Text aus einem vorherigen Schritt klassifizieren
{
"text": schrittErgebnis.extractedText,
"categories": ["Rechnung", "Angebot", "Mahnung", "Reklamation", "Sonstiges"]
}
// Beispiel: Nur bei hoher Konfidenz weiterverarbeiten (Gateway-Condition)
result.confidence > 0.8
Hinweise
- Es werden mindestens zwei Kategorien benötigt.
- Die Kategorien können frei gewählt werden – es gibt keine Einschränkung bei der Benennung.
- Längere und aussagekräftigere Texte führen zu besseren Ergebnissen.
- Der Konfidenzwert eignet sich gut als Bedingung in einem nachfolgenden Gateway (z. B. bei niedriger Konfidenz eine manuelle Prüfung einleiten).
Tipp
Die Kombination mit dem Service Task „PDF-Text extrahieren" ist besonders effektiv: Zuerst wird der Text aus einem PDF extrahiert und anschließend automatisch klassifiziert.