Brücken über die Textflut bauen

Die Datenschutzgrundverordnung hat viel Unsicherheit ausgelöst: Welche der Regelungen betreffen Vereine, welche Firmen? Stefanie Rinderle-Ma und Karolin Winter von der Fakultät für Informatik der Uni Wien haben ein Programm entwickelt, welches das Verstehen umfangreicher Gesetzeswerke vereinfacht.

Neue Gesetze und Verordnungen bereiten nicht nur JuristInnen Kopfzerbrechen. Die im Mai 2018 in Kraft getretene Datenschutzgrundverordnung (DSGVO) der EU zum Beispiel betrifft all jene, die ihre privaten Daten schützen bzw. Personendaten verarbeiten wollen – dazu gehören Firmen, Vereine, Einzelpersonen oder auch Universitäten.

Aller Anfang ist schwer

"Gerade am Anfang, wenn eine neue Regelung kommt, ist oft unklar, was genau geschehen muss. Alle lesen sich ein und interpretieren – das ist nicht nur bei der DSGVO der Fall", weiß Stefanie Rinderle-Ma, die mit ihrer Forschungsgruppe "Research Group Workflow Systems and Technology" an der Fakultät für Informatik an der Schnittstelle von Wissenschaft und unternehmerischer Praxis forscht.

"Viele Unternehmen stehen vor Herausforderungen, wenn sie regulatorische Vorgaben umsetzen", so Rinderle-Ma. Denn häufig sind sie mit einem Bündel an Normen, Regelungen und umfangreichen juristischen Dokumenten konfrontiert. Längst nicht alles ist für eine Firma relevant; das Prüfen der Unterlagen kostet Zeit und Ressourcen. "Wir forschen seit Jahren daran, wie man Firmen dabei unterstützen kann", betont die Informatikerin.

Ein schneller Überblick

Zusammen mit Nachwuchsforscherin Karolin Winter hat sie eine Text Mining-Methode entwickelt und prototypisch umgesetzt, die Laien wie Unternehmen den Schrecken juristischer Dokumente nehmen kann. "Wir haben uns die Frage gestellt, wie sich aus diesen Texten automatisch wertvolle Informationen herausziehen lassen. BenutzerInnen wollen sich schnell einen Überblick verschaffen oder – wenn sich Regelungen ändern – unterschiedliche Textdokumente unkompliziert vergleichen", erläutern die Wissenschafterinnen. Gemeinsam forschen sie im vom Wiener Wissenschafts-, Forschungs- und Technologiefonds (WWTF) geförderten Projekt CRISP.

Warum InformatikerInnen eine Legofabrik bauen: Von der Pflege bis hin zur Logistik – effektive Arbeit basiert auf geregelten Abläufen. InformatikerInnen der Universität Wien entwickeln im Rahmen des WWTF-Projekts CRISP eine neue Software, um solche Abläufe zu vereinfachen, sie möglichst flexibel und gleichzeitig kontrollierbar zu machen. Zum Forschungsartikel (© Universität Wien)

Das neu entwickelte Programm macht ein rasches Verständnis komplexer Inhalte möglich. Wie eine Suchmaschine filtert es Texte nach darin enthaltenen Themen oder Anweisungen an bestimmte NutzerInnen. Ein Beispiel: Abschnitte aus der DSGVO, die Nationalstaaten betreffen, sind für eine Firma nicht interessant. Das Unternehmen möchte nur wissen, was von ihm konkret erwartet wird – aber diese Informationen sind über das gesamte Dokument verteilt und damit schwer erfassbar.

Automatisierte Unterstützung 

Mit Hilfe dieses Text Mining-Verfahrens lässt sich die DSGVO nach den angesprochenen Personengruppen und Organisationen strukturieren. "NutzerInnen finden die relevanten Anweisungen auf einen Blick – der Leseaufwand reduziert sich deutlich", betont Karolin Winter. "Das Programm markiert die jeweils relevanten Sätze, die wiederum mit den entsprechenden Textstellen im Dokument verlinkt sind." Wer also nachlesen möchte, in welchem Zusammenhang eine Regel beschrieben wird, braucht das Dokument nicht zu durchsuchen.

Ähnlich einfach ist es, wenn sich NutzerInnen lediglich über eine bestimmte Frage informieren wollen: Indem sie Textstellen mit dem Programm thematisch gruppieren, erhalten sie die gewünschten Informationen mit verhältnismäßig geringem Aufwand. "Mit maschineller Unterstützung lassen sich auch mehrere Texte gleichzeitig bearbeiten", ergänzt die Informatikerin.

Vergleichen ohne Aufwand

Die neue Methode des Text Minings leistet aber noch mehr: "Die Textmenge kann nicht nur reduziert werden. Das Programm kann darüber hinaus auch Verknüpfungen zwischen Textstellen herstellen", so die Forscherinnen. Vielfach finden sich in einem Dokument ähnliche Passagen, die das Programm als solche kennzeichnet und zusammenfasst – NutzerInnen können sie nacheinander durchsehen und vergleichen. Auch Konflikte werden angezeigt. So erkennen NutzerInnen schnell widersprüchliche Regeln oder auch Veränderungen von einer früheren Version des Dokuments zur nächsten.


Wie werden wir morgen arbeiten?
Stefanie Rinderle-Ma
: "Konkret trägt unsere Forschung hier an der Fakultät für Informatik zur Unterstützung und Vereinfachung von Arbeit bei. Auf vielfältige Art und Weise. Ein Beispiel ist die Reduktion von 'Papierkram', mit dem sich viele ArbeitnehmerInnen herumschlagen müssen, beispielsweise zur Dokumentation. Für den Pflegebereich zeichnet sich hier eine Reduktion des zeitlichen Aufwands um etwa 60 Prozent bei gleichzeitiger Steigerung der Qualität ('nichts kann vergessen werden') ab. Wenn Pflegekräfte weniger Zeit für die Dokumentation aufwenden müssen, haben sie mehr Zeit für die PatientInnen. Ähnliche Schätzungen sehen wir beim Leseaufwand für regulatorische Dokumente: Dieser reduziert sich, wenn man sich z.B. beim Lesen der DSGVO nur auf Sätze, die sich auf ein bestimmtes Thema (etwa 'controller') beziehen, konzentrieren kann." Alle Infos zur Semesterfrage 2019

Neue Wege des Text Minings

Indem sie in ihrem Verfahren die ursprüngliche Struktur der eingespeisten Dokumente auflösen und einen Vergleich von Regeln und Textpassagen untereinander per Mausklick ermöglichen, betreten die Forscherinnen Neuland. Aber auch mit der Möglichkeit, Text Mining auf große und komplex strukturierte Einzeldokumente anzuwenden, gehen sie über bisherige Methoden hinaus."Wir nutzen zwar bestehende Verfahren, aber die Aufbereitung des Dokuments ist neu", freuen sich die Forscherinnen.

Nach dem Durchdringen des Dschungels juristischer Texte steht nun die Suche nach weiteren Anwendungsmöglichkeiten in Wirtschaft und Wissenschaft auf dem Programm. Die Informatikerinnen wollen die Methode kontinuierlich erweitern. Denn letztlich ist der alltägliche Kampf mit der Textflut nicht nur auf Rechtsdokumente beschränkt. (jr)

Univ.-Prof. Dipl.-Math. oec. Dr. Stefanie Rinderle-Ma und Praedoc Karolin Winter, M.Sc. B.Sc. von der Forschungsgruppe Workflow Systems and Technology an der Fakultät für Informatik der Universität Wien forschen gemeinsam im Projekt "Life Cycle Support of Instance-spanning Constraints in flexible Process-Aware Information Systems" (CRISP), das vom Wiener Wissenschafts-, Forschungs- und Technologiefonds (WWTF) gefördert wird. CRISP startete am 1. Jänner 2016 und läuft bis zum 31. Dezember 2019.