KI: Text anonymisieren (DSGVO)
Dieser Service Task erkennt und ersetzt personenbezogene Daten (PII) in einem Text durch konsistente Platzhalter.
Die Zuordnung zwischen Originalwert und Platzhalter wird als Replacement-Liste zurückgegeben und kann für eine spätere De-Anonymisierung verwendet werden.
Technischer Name: prio_aiAnonymize
Eingabe
| Feld |
Typ |
Pflicht |
Beschreibung |
text |
String |
Ja |
Der zu anonymisierende Text. |
entitiesToMask |
String[] |
Nein |
Einschränkung auf bestimmte Entitätstypen. Ohne Angabe werden alle maskiert. |
Unterstützte Entitätstypen
| Typ |
Beschreibung |
name |
Personennamen |
email |
E-Mail-Adressen |
phone |
Telefonnummern |
address |
Physische Adressen |
iban |
IBANs / Bankverbindungen |
date |
Geburtsdaten u. Ä. |
company |
Firmennamen |
id_number |
Steuer-IDs, Passnummern |
Eingabe-Beispiel
{
"text": "Herr Max Müller, wohnhaft in Musterstr. 12, 80331 München, erreichbar unter max.mueller@gmail.com und +49 171 1234567.",
"entitiesToMask": ["name", "email", "phone", "address"]
}
Ausgabe
| Feld |
Typ |
Beschreibung |
anonymizedText |
String |
Der vollständige Text mit ersetzten PII-Platzhaltern. |
replacements |
Object[] |
Liste der Ersetzungen mit original, replacement und type. |
Ausgabe-Beispiel
{
"anonymizedText": "[NAME_1], wohnhaft in [ADDRESS_1], erreichbar unter [EMAIL_1] und [PHONE_1].",
"replacements": [
{ "original": "Herr Max Müller", "replacement": "[NAME_1]", "type": "name" },
{ "original": "Musterstr. 12, 80331 München", "replacement": "[ADDRESS_1]", "type": "address" },
{ "original": "max.mueller@gmail.com", "replacement": "[EMAIL_1]", "type": "email" },
{ "original": "+49 171 1234567", "replacement": "[PHONE_1]", "type": "phone" }
]
}
Hinweise
- Tritt dieselbe Entität mehrfach im Text auf, wird stets derselbe Platzhalter verwendet.
- Die Replacement-Liste ermöglicht eine nachträgliche De-Anonymisierung, z. B. beim Versand an berechtigte Empfänger.
- Wird
entitiesToMask nicht angegeben, werden alle unterstützten PII-Typen maskiert.
- Der Service unternimmt bis zu drei Versuche, eine valide Anonymisierung zu erstellen.