Forschen mit und über KI: Universität Wien bei WWTF-Calls erfolgreich

Neue "Vienna Research Group" im Bereich Computerlinguistik und 3 neue Projekte im Call "Understanding Biology with AI/ML"

Die Universität Wien war beim Life Sciences 2023 Call "Understanding Biology with AI/ML" des Wiener Wissenschafts-, Forschungs- und Technologiefonds WWTF erfolgreich: Jonas Ries (Molekulare Biologie), Ivo Hofacker (Bioinformatik) und Manuel Zimmer (Neurowissenschaften) erhalten eine hochdotierte Förderung für ihre Projekte. Ebenfalls mit KI beschäftigt sich eine neue, mit 1,6 Mio. Euro geförderte "Vienna Research Group for Young Investigators": Sebastian Schuster, derzeit UCL London, wird ab 2025 eine Forschungsgruppe im Bereich Computerlinguistik an der Universität Wien aufbauen.


Ziel des WWTF-Programms "Vienna Research Groups for Young Investigators (VRG)" ist es, junge, exzellente Wissenschafter*innen aus dem Ausland nach Wien zu holen, um hier an einer Wiener Forschungsstätte ihre erste eigene Gruppe aufzubauen. Die Vienna Research Groups for Young Investigators (VRG) Leiter*innen erhalten substantielle Mittel (bis zu 1,6 Mio. € pro Gruppe) für 6-8 Jahre sowie eine langfristige Karriereperspektive an den Wiener Institutionen.

Einer von drei Vienna Research Group Leaders 2023 ist Sebastian Schuster, der derzeit am University College London (UCL) im Bereich Computerlinguistik lehrt und im Rahmen der neuen WWTF-Förderung ab 2025 an die Universität Wien kommen wird. Schuster war Postdoc an der Universität des Saarlandes und der New York University und hat sowohl seinen Master als auch seinen PhD an der Stanford University absolviert. Die Bewerbung für eine VRG erfolgt jeweils im Tandem mit einer Wissenschafter*in einer Wiener Forschungsinstitution: Host für das Projekt von Sebastian Schuster ist Benjamin Roth, Professor für Digitale Textwissenschaften an der Fakultät für Informatik und der Philologisch-Kulturwissenschaftlichen Fakultät.

Die neue Forschungsgruppe von Sebastian Schuster wird sich mit dem Thema Understanding Language in Context beschäftigen.

Projektbeschreibung:

KI-Assistenten wie ChatGPT haben im letzten Jahr viele Potentiale von automatisierter Sprachverarbeitung aufgezeigt. Unter anderem können sie in vielen Fällen einfache Texte verfassen oder Programmcode automatisch generieren. Wenn man Large Language Models (LLMs, die Haupttechnologie aktueller KI-Assistenten) jedoch einer systematischeren Analyse unterzieht, stellt sich heraus, dass die generierten Antworten immer noch oft unzuverlässig sind.

Das Ziel dieses Forschungsprojekts ist es, die Verständnisfähigkeiten von LLMs zu verbessern. "Im Rahmen dessen werden wir neue Modelle entwickeln, die besser dafür geeignet sind lange Texte und indirekte Sprache zu verstehen", erklärt Sebastian Schuster: "Zudem werden wir neue Evaluationsmethoden entwickeln, bei denen wir sicherstellen, dass Modelle keine 'Abkürzungen' nehmen können und somit nur den Anschein wahren Texte zu verstehen." Dies hilft den Forscher*innen dabei zu verstehen, welche Fähigkeiten und Limitierungen aktuelle und zukünftige LLMs tatsächlich haben und wie diese verbessert werden können.

3 neue Projekte im Call "Understanding Biology with AI/ML"

Im Call "Understanding Biology with AI/ML" fördert der WWTF exzellente, interdisziplinäre Projekte aus Biologie, Biomedizin oder klinischen Wissenschaften, die innovative Methoden der künstlichen Intelligenz (AI) oder des maschinellen Lernens (ML) auf große Datensätze anwenden. Drei der insgesamt neun in diesem Call geförderten Forschungsvorhaben gehen an die Universität Wien.

Projekt: "Dynamic nanoscale reconstruction of endocytosis with high-throughput superresolution microscopy and machine-learning"

Projektbeschreibung:

Zelluläre Prozesse sind häufig zu klein und zu schnell, um sie mit Mikroskopen visualisieren zu können. Ein Beispiel hierfür ist Endozytose, durch welche Zellen Moleküle aus der Umgebung aufnehmen. Derzeit kann keine Technologie die genaue Position der Proteine, welche die endozytische Maschinerie bilden, bestimmen, was ein mechanistisches Verständnis erschwert.

Um diese technologische Lücke zu überwinden, wird in diesem vom WWTF geförderten Projekt ein internationales Team aus Computerwissenschafter*innen, Physiker*innen und Biolog*innen einen Ansatz entwickeln, um die zeitaufgelöste Struktur von Endozytose aus hunderttausenden Schnappschüssen zu rekonstruieren, die in fixierten Zellen aufgenommen wurden. "Wir werden höchstauflösende Mikroskopie mit neuen Methoden des maschinellen Lernens kombinieren, um die Schnappschüsse nach der Zeit zu sortieren, zu überlagern und zu einem Film zusammen zu fügen", erklärt Projektleiter Jonas Ries vom Department für Strukturbiologie und Computational Biology.

Das Projekt wird zu detaillierten Einblicken in die Struktur und Dynamik der Endozytose sowie zu einem auf maschinellem Lernen basierenden Arbeitsablauf führen, der verschiedene zelluläre Prozesse zeitaufgelöst rekonstruieren kann.


Projekt: "Determinants of mRNA Lifetime and Translation Efficiency"

Projektbeschreibung:

Menschliche Zellen müssen die Menge der aus jedem Gen produzierten Proteine präzise regulieren. Zum Teil geschieht dies direkt durch spezifische Eigenschaften der Boten-Ribonukleinsäure (mRNA). Allerdings wurden nur wenige dieser Eigenschaften im Detail untersucht. Dieses Projekt verwendet Deep Learning, um neue und relevante RNA-Merkmale zu identifizieren, die die Translation und Stabilität beeinflussen.

Deep-Learning-Modelle werden darauf trainiert, die Lebensdauer einer mRNA und ihre Proteinexpression aus mRNA-Sequenz- und Strukturinformationen vorherzusagen. Die Modelle werden dann mithilfe von Techniken aus dem Bereich der erklärbaren Künstlichen Intelligenz analysiert, um zu extrahieren, welche mRNA-Merkmale entscheidend für die Vorhersage waren. Neue Merkmale werden experimentell validiert, um die zugrunde liegenden biologischen Mechanismen aufzudecken.

"Das Projekt wird unser Verständnis der Genregulation vertiefen und kann zu praktischen Anwendungen im Zusammenhang mit Mutationen bei Krankheiten wie Krebs sowie für die Optimierung synthetischer mRNAs für medizinische und biotechnologische Zwecke führen", so Projektleiter Ivo Hofacker vom Institut für Theoretische Chemie.


Projekt "An interdisciplinary approach to learn and test the causal mapping between neural network dynamics and behavior"

Projektbeschreibung:

Das Projekt untersucht, wie Gehirne Entscheidungsprozesse und unser Verhalten generieren. Mehrere Studien in verschiedensten Tierarten konnten bisher zeigen, dass große Gruppen von Nervenzellen in enger Koordination zusammenarbeiten, um z.B. den Bewegungsapparat zu steuern. Wir verstehen jedoch immer noch nicht, wie die Koordination solch großer Gruppen von Nervenzellen überhaupt zustande kommt und wie Nervenzellverbände dann im Kollektiv Entscheidungen zwischen alternativen Optionen, d.h. verschiedenen Verhalten-Antworten, treffen können.

Um dieses Problem zu lösen, wurde ein internationales Team aus Expert*innen für künstliche Intelligenz, Computerbiologie und Neurobiologie zusammengestellt. Als Modellorganismus dient ein kleiner Fadenwurm namens C. elegans: Dieser hat nur 302 Nervenzellen und kann daher besser im Detail untersucht und verstanden werden. So ist es zum Beispiel möglich, die gesamte Hirnaktivität einschließlich aller seiner einzelnen Nervenzellen in Einzelzellauflösung zu visualisieren.

"Wir werden neue Computertechniken einsetzen, um aus der Gehirnaktivität zu lernen und zu simulieren, wie die Nervenzellen kommunizieren", erklärt Projektleiter Manuel Zimmer vom Department für Neurowissenschaften: "Wir werden buchstäblich lernen, die Gedanken dieser Tiere zu lesen und zu verstehen! Anschließend werden wir verschiedene daraus resultierende Hypothesen testen, indem wir mit speziellen genetischen Tricks die Hirnaktivität mit Licht manipulieren, um bestimmte Gruppen von Nervenzellen zu kontrollieren und dann zu beobachten, wie dies die Entscheidungsfindung des Wurms beeinflusst." Die Forscher*innen gehen davon aus, dass man von simplen Fadenwürmern generelle Prinzipien der Gehirnfunktion lernen kann, die auf größere Tiere wie dem Menschen übertragbar sind.