"Informatik sollte Pflichtschulfach sein"

Ohne digitale Bildung verlieren wir in Österreich den Anschluss an die Automatisierungsgesellschaft. Das prognostizieren die Data Scientists Claudia Plant und ihre MitarbeiterInnen. Im Interview zur Semesterfrage erklären sie außerdem ihren Job und was Data Mining mit Alzheimer-Forschung zu tun hat.

uni:view: Digitale Daten werden auch als das "Öl der Zukunft" bezeichnet. Wie verändert dieser Rohstoff unsere Zukunft?
Claudia Plant:
Daten bergen noch viel ungenutztes Potenzial. Durch die heutige Forschung entscheiden wir, wie die digitale Zukunft von morgen aussieht – und in unserer Forschungsgruppe konkret, indem wir neue Data Mining-Methoden entwickeln. Unsere Techniken treiben z.B. die medizinische Forschung voran und unterstützen ExpertInnen bei der Beantwortung komplexer Fragestellungen.

uni:view: Welche Fragestellungen sind das?
Plant:
Als Data Scientists arbeiten wir mit ganz unterschiedlichen Anwendungen und FachexpertInnen zusammen – von den Umweltwissenschaften bis hin zu den Neurowissenschaften – und schneiden die Lösungen speziell auf verschiedene Anwendungen zu. Aktuell erforschen wir gemeinsam mit Kooperationspartnern aus der Medizin die Alzheimer-Krankheit. Anhand großer Datenmengen erfahren wir etwas über die Ursachen. So haben wir herausgefunden, dass die Entwicklung von Alzheimer der natürlichen Alterung des Gehirns entspricht, was Hinweise auf verbesserte Behandlungsmöglichkeiten gibt: Demnach empfiehlt sich bei beginnendem Alzheimer eine intensive Rehabilitation mit kognitivem und ergonomischem Training, um den Prozess zu verlangsamen. Unsere Forschung ist also sehr praxisnah.

Masterstudentin Theresa Fruhwürth beschäftigt sich mit einem anwendungsorientierten Aspekt von Data Mining: "Mein Ziel ist es, WissenschafterInnen, die in Massenspektren nach Periodizitäten suchen, um z.B. auf Isotopengruppen oder andere interessante Sachverhalte hinzuweisen, bei ihrer Analyse zu unterstützen. Dafür adaptiere ich Zeitreihenanalysen, die normalerweise für wirtschaftliche Zeitreihen verwendet werden."

uni:view: Besprechen Sie mit ihren Kooperationspartnern dabei auch ethische Fragen?
Plant:
Natürlich. Technik ist ja an sich weder gut noch böse – wir Menschen haben es in der Hand, wie wir sie sinnvoll nutzen wollen. Wir diskutieren in jedem Projekt mit dem Partner und informieren uns über die Rahmenbedingungen. Ich bin vor allem im Bereich Life Sciences und Biomedizin tätig, und bei Projekten in diesem Bereich werden ethische Fragen im Vorfeld geklärt und an Ethikkommissionen herangetragen. Wir stellen die Techniken nicht einfach zur Verfügung, sondern entwickeln sie gemeinsam.

uni:view: Besteht die Gefahr, dass diese Techniken für andere Zwecke missbraucht werden?
Benjamin Schelling
: In unserem Bereich ist diese Gefahr relativ gering. Wir schneiden die Algorithmen auf bestimmte Varianten von Datensätzen zu. So ist z.B. ein Algorithmus, der Distanzmaße von Proteinen analysiert, nicht 1:1 auf das Nachlesen von Spuren im Internet anwendbar.

uni:view: Sie werten anhand von Algorithmen riesige Datenmengen aus. Wie gewinnen Sie aus den Daten Wissen?
Theresa Fruhwürth: Wir versuchen, die Daten zu clustern, also in Gruppen zu teilen. Clustering ist eine gängige Strategie, wie wir mit unserer Welt zurechtkommen und tief in der menschlichen Kognition verankert. Erlebnisse, Erfahrungen, Objekte und Daten werden stets in bekannte Kategorien eingeteilt. Bereits ganz kleine Kinder wissen, in welche Gruppe z.B. das Bild von einem Hund oder Baum einzuordnen ist, obwohl sie noch gar nicht das Wort dafür kennen. Und genau das wollen wir für große Datenmengen automatisieren.

Plant: Alle Daten, mit denen ein Computer arbeitet, erscheinen als eine Folge von Nullen und Einsen, also Bits. Wir messen, wie lang dieser Bits-Ring ist und versuchen durch Algorithmen Muster, Strukturen, Zusammenhänge und Regelmäßigkeiten zu erkennen. Je besser diese Muster sind, desto kompakter kann ich die Daten repräsentieren und damit das Datenvolumen verkleinern. Die Kompressionsrate ist ein Maß für den Gehalt an gefundenen Wissen – was letztlich immer das Ziel ist. Bisher gibt es aber noch wenige Algorithmen, die mit den komplexen Datenbeständen wirklich umgehen können.

Doktorand Benjamin Schelling ist auf Datensätze spezialisiert, die viel neue – und auch irrelevante – Information enthalten: "Ich teste Clustering-Möglichkeiten, um die wichtigen von den unwichtigen Daten zu trennen. Ich arbeite an einem Algorithmus, der quasi auf dem tierischen Jagdverhalten basiert: Der Algorithmus gibt den Auftrag, nach relevanten Aspekten zu jagen. Macht der 'Datenjäger' an einem bestimmten Punkt viel Beute, bleibt er länger dran, ist die Ausbeute enttäuschend, wandert er woanders hin."

uni:view: Was wären solche komplexe Datenbestände?
Plant: Zum Beispiel soziale Netzwerke: Die einzelnen Personen sind unsere Knoten und über diese gibt es viel zusätzliche Information – also alles, was die Person von sich preisgibt: Bilder, Postings usw. Das ergibt ein komplexes Netzwerk mit einer großen Vielfalt an Information und unterschiedlichen Datentypen. Bisher gibt es fast ausschließlich Algorithmen, die entweder die Netzwerke oder die Verbindungsstruktur als Eingabe verwenden – und es gibt Algorithmen für numerische oder kategorische Daten. Es gibt aber keinen, der alle Datentypen gleichzeitig unterstützt. Daran arbeiten wir aktuell.

uni:view: Wie schnell wächst "unser" Datenberg?
Plant:
Er wächst exponenziell und verdoppelt sich in einem immer schnelleren Rhythmus. Viele Daten entstehen durch mobile Geräte und das Internet of Things – also durch alle möglichen Geräte, die mit Sensoren oder einer Netzwerkanbindung ausgestattet sind. Bereits im Jahr 2008 gab es mehr vernetzte Geräte als Menschen auf der Welt – im Jahr 2020 sollen es bereits 40 Milliarden vernetzte Dinge sein: All diese Daten können wir nutzen, um unsere Lebensqualität zu steigern – wir müssen nur die entsprechenden Techniken dafür entwickeln.

uni:view: Viele befürchten, dadurch zu "gläsernen Menschen" zu werden ...
Plant: Ja, aber Technologien bergen immer Chancen und Risiken. Dessen muss man sich bewusst sein und das muss öffentlich diskutiert werden. Letztendlich ist ein Algorithmus nichts anderes als ein Kochrezept, sprich eine Folge von Anweisungen, die dazu dienen, riesige Datenmengen auf eine verständliche Größe zu destillieren und verwertbar zu machen. Ein Algorithmus ist nichts Geheimnisvolles, sondern eine Technologie – und sei sie auch noch so ausgefeilt. Algorithmen werden niemals den Menschen ersetzen. Digitale Bildung würde helfen, solche Ängste abzubauen.

Algorithmen werden niemals den Menschen ersetzen. Digitale Bildung würde helfen, solche Ängste abzubauen.


uni:view: Digitale Bildung würde auch zu einem anderen Umgang mit Daten führen ...
Fruhwürth: Ja, denn viele Menschen wissen nicht, was mit ihren Daten passiert und gehen zu sorglos damit um. Kaum jemand fragt sich, ob es dafür steht, so viele Daten von sich preiszugeben, nur um z.B. mit WhatsApp gratis Nachrichten versenden zu können. Die meisten sehen nur die Vorteile, sind sich aber der Risiken nicht bewusst.

Schelling: Die gesetzlichen Rahmenbedingungen müssen angepasst werden, damit jeder selbst bestimmen kann, welche Daten gesammelt werden dürfen und was damit gemacht wird. Die Unternehmen versuchen natürlich möglichst alle Daten, auf die sie irgendwie Zugriff haben, auszuwerten.

Fruhwürth: Digitale Bildung in der Schule wäre aber auch aus einem ganz anderen Aspekt sehr wichtig, nämlich damit mehr Frauen technologische Berufe ergreifen. Ein großes Problem in der universitären Informatik-Ausbildung sind die unterschiedlichen Vorkenntnisse. Im Moment kommen Frauen – im Gegensatz zu ihren männlichen Kollegen – oft ohne Programmierkenntnisse an die Uni. Das ist für sie meist frustrierend und schwer aufzuholen. Verpflichtender Informatik-Unterricht für alle SchülerInnen würde diesen Unterschied beheben. Da wir auf eine Automatisierungsgesellschaft zusteuern, wäre es auch wichtig, zusätzliche Ressourcen bzw. Plätze für Informatik-Studierende zu schaffen – sonst verlieren wir in Europa den Anschluss.

uni:view: Und wie gehen Sie persönlich mit Ihren Daten um?
Fruhwürth: Ich bin nicht auf Facebook!

Schelling: Ich versuche, so wenig Spuren wie möglich im Internet zu hinterlassen. Wenn ich aber aus familiären Gründen gezwungen bin, einer WhatsApp-Gruppe beizutreten, muss ich irgendwie damit leben (lacht).

Plant: Die sozialen Netzwerke sind an sich nicht schlecht. Sie bieten tolle Möglichkeiten und erlauben es, mit Leuten weltweit in Kontakt zu bleiben. Ich nutze diese Medien – aber nur in Maßen und nur dort, wo ich es sinnvoll finde.

VERANSTALTUNGSTIPP:

uni:view: Zum Schluss noch zu unserer Semesterfrage: Wie leben wir in der digitalen Zukunft?
Fruhwürth: Wir werden mit vielen intelligenten Devices leben, die alle mit Daten gefüttert werden. Diese Daten müssen prozessiert werden, um künstliche Intelligenz möglich zu machen – ein Computer muss kategorisieren können, um die richtige Aktion zu setzen. Mit dem Begriff künstliche Intelligenz assoziieren heutzutage viele Roboter, die den Menschen irgendwann unterjochen, aber in Wirklichkeit ist auch eine Heizung, die versteht, wie heiß es für eine bestimmte Person sein soll, eine künstliche Intelligenz. Ich glaube nicht, dass Maschinen die Macht übernehmen (schmunzelt).

Plant:
Es wird in Richtung Smart Cities gehen. Wir werden z.B. bessere Vorschläge bekommen, wie wir unseren Arbeitsweg an einem bestimmten Tag zu einer bestimmten Zeit schnell und umweltfreundlich zurücklegen können. Verschiedene Systeme werden miteinander vernetzt sein und unser Navi wird mit Informationen der öffentlichen Verkehrsmittel gespeist, sodass wir unterschiedliche Transportmittel besser miteinander kombinieren und intelligenter verwenden können. Auch im Bereich Energiemanagement oder Gesundheit – Stichwort personalisierte Medizin – wird viel passieren. Wir werden gar nicht bewusst wahrnehmen, wo im Alltag wir überall durch intelligente Systeme unterstützt werden. Veränderungen, die fast unmerklich passieren, sind häufig die intelligentesten.

Q&A mit Claudia Plant:
Am 9. und 13. Januar wird Claudia Plant auf "derStandard.at/Semesterfrage" erklären, warum Informatik Pflichtschulfach sein sollte und was Data Mining mit Alzheimer-Forschung zu tun hat. In einem Kommentar sowie einem Q&A-Artikel stellt sie sich den Fragen der Community. Diskutieren Sie mit!

Schelling: Es wird graduelle Fortschritte geben, aber im Endeffekt ist der Mensch ein Gewohnheitstier und will keine dramatischen Änderungen. Unser Alltag wird sich schrittweise fortschrittlicher und angenehmer gestalten – und zwar in derselben Geschwindigkeit, wie es in den letzten Jahrzehnten passiert ist. Wir werden uns in Zukunft nicht vorstellen können, dass es früher einmal anders war.

Plant: Es wird einerseits mehr qualitativ hochwertige Jobs geben und andererseits werden uns die einfachen repetitiven Arbeiten von Maschinen abgenommen werden. Es gibt auch in Zukunft noch viele Probleme auf der Welt zu lösen und die neuen Technologien bieten das Potenzial dafür. Damit wir diese entwickeln und nutzen können, müssen die Menschen entsprechend ausgebildet werden: Die Arbeit wird der Gesellschaft sicherlich nicht ausgehen – sie wird sich nur in der Qualität ändern.

uni:view: Vielen Dank für das Gespräch! (ps)


Mehr über Claudia Plant:

Claudia Plant ist seit Jänner 2016 Professorin für Data Mining und Leiterin der Forschungsgruppe Data Mining an der Fakultät für Informatik der Universität Wien. Zu ihren Forschungsschwerpunkten gehören Parameterfreies Data Mining auf informationstheoretischer Basis, Integratives Data Mining von heterogenen Datenbeständen, Effizienz und Skalierbarkeit durch Indexstrukturen und Einsatz moderner Hardware, Anwendungsorientiertes Data Mining in der Biomedizin, in den Neurowissenschaften und den Umweltwissenschaften.