Bioinformatik als Schlüsseldisziplin

Bioinformatik ist eine noch junge Forschungsrichtung, hinter der sich ein breitgefächertes, anwendungsorientiertes Tätigkeitsfeld verbirgt. In seiner Antrittsvorlesung am Mittwoch, 30. Juni 2010, gab Thomas Rattei, Professor für "In Silico Genomics" und Leiter des neuen Departments für Computational Systems Biology, einen Einblick in die Möglichkeiten und Perspektiven des Forschungsbereichs. Seine Antrittsvorlesung zum Thema "Bioinformatik als Schlüsseldisziplin im Zeitalter der molekularen und systemorientierten Biologie" hat er in einem Gastbeitrag zusammengefasst.

Die Entwicklung von Methoden zur Sequenzierung von DNA hat eine neue Ära in der Biologie eingeleitet, in welcher sowohl Genome als auch die darin kodierten Biomoleküle umfassend auf molekularer Ebene untersucht werden können. Die heutige Verfügbarkeit zahlreicher kompletter Genomsequenzen unterstützt eine Vielzahl biologischer Forschungsdisziplinen. In den letzten Jahren wurden Methoden zur "Metagenomik" etabliert, welche die Sequenzierung von DNA selbst aus nicht aufgereinigten Umweltproben erlauben wie z.B. kompletter mikrobieller Gemeinschaften.

Die Prozesse der Gewinnung genomischer und metagenomischer DNA sowie deren Interpretation sind in hohem Maß auf Computermethoden angewiesen. Die Bioinformatik ist daher in den letzten Jahren zu einer Schlüsseldisziplin der molekularen und systemorientierten Biologie geworden. Als neue Forschungsrichtung ist sie ganz besonders auf eine enge Verbindung zwischen Lehre und Forschung angewiesen. Dieser Entwicklung Rechnung tragend, wurden im März 2010 die Professur für "In silico Genomik" und das neue "Department für Computational Systems Biology" gegründet.

Information in biologischen Sequenzen

Alle Lebewesen bestehen aus kleinen Einheiten, den Zellen. Diese sind entweder eigenständig überlebensfähig oder bilden größere Organismen. Wenn wir ein Mikroskop auf Zellen richten, wird bei hoher Vergrößerung die innere Struktur der Zellen erkennbar. Sowohl in Zellen mit Zellkern (z.B. menschliche Zellen), als auch ohne diesen (z.B. Bakterien-Zellen), finden wir lange Ketten eines besonderen Molekültyps. Die Desoxy-Ribonukleinsäureketten (DNS) bestehen aus vier Bausteinen (genannt A, C, G, T), deren Abfolge in sog. Sequenzen die Erbinformation der Zellen darstellt. Dieses Erbgut wird von den Zellen bei deren Teilung verdoppelt und an die Tochterzellen weitergegeben. Während des Bestehens einer Zelle dient es als beständige "Kopiervorlage" für die Abschrift der funktionellen Abschnitte, die wir als Gene bezeichnen.

Komplexe Gebilde aus verschiedenen Eiweißen und weiteren Molekülen realisieren diese Kopiervorgänge mit hoher Präzision. Die bestehenden Gen-Kopien werden als Transkripte bezeichnet und entweder direkt in der Zelle wirksam oder benötigen eine weitere Verarbeitung. Diese besteht meist in der Übersetzung der Gene in Eiweiße (Proteine), wobei jeweils 3 DNS-Bausteine, die Information für einen der 20 möglichen Eiweißbausteine (die Aminosäuren) liefern. Dieser Übersetzungsvorgang erfordert ebenfalls eine komplexe molekulare Maschine, die selbst aus zahlreichen Eiweißen und anderen Molekülen besteht und als Ribosom bezeichnet wird. Nach der Übersetzung der Gene in Eiweiße falten sich diese und nehmen die verschiedensten Aufgaben in der Zelle wahr, von der Ausbildung stabiler Raumstrukturen bis zum Stoffwechsel.

Das menschliche Genom

Wieviel Information steckt nun im Erbgut (dem Genom) einer Zelle? Verdeutlichen wir uns dies am Beispiel einer menschlichen Zelle, z.B. aus unserer Haut. Die DNS-Moleküle in den verschiedenen Chromosomen enthalten ca. drei Milliarden Paare von DNS-Bausteinen. Würden wir diese Paare jeweils mit einem Buchstaben bezeichnen (A, C, G oder T) und in typischer Schriftgröße auf Buchseiten drucken, so benötigten wir dafür 1,5 Millionen Seiten. Diese würden ca. 50 große Bucherschränke füllen. Wohlgemerkt, dies ist die Information die das Erbgut einer einzigen menschlichen Zelle repräsentiert. Nicht alle Teile dieser Information sind jedoch einzigartig - es gibt zahlreiche Wiederholungen im menschlichen Genom. Es wäre also möglich, diese wiederholten Abschnitte zu katalogisieren und im Text durch Verweise zu ersetzen. Dies würde die Anzahl benötigter Bücherregale erheblich reduzieren.

Der menschliche Organismus enthält ca. 10.000 Milliarden Zellen, welche alle nahezu identische Erbinformation besitzen. Darüber hinaus ist der menschliche Körper jedoch von ungefähr der gleichen Menge an Bakterienzellen besiedelt. Normalerweise helfen uns diese Bakterien, gesund zu bleiben und unsere Nahrung gut verdauen zu können. Nur selten gerät unsere Bakterienflora aus dem Gleichgewicht und verursacht Erkrankungen.

Die Untersuchung der Bakterien in unserem Organismus steckt zwar noch in den Anfängen, aber aus der Analyse des Erbguts dieser Bakterien wissen wir, dass es sich um zahlreiche verschiedene Arten handelt. Die Information dieser Genome ist viel kompakter als diejenige der menschlichen Zellen und würde beim o.g. Druck nur wenige Bücher benötigen. Aufgrund der Bakterienvielfalt stellt deren Genominformation jedoch eine erhebliche Erweiterung der menschlichen Genomdaten dar. Es liegt auf der Hand, dass diese gewaltigen Informationsmengen nur mit Hilfe von Computern analysiert werden können.

Die Gesamtversion des Gastbeitrags von Thomas Rattei finden Sie unter Downloads.

Univ.-Prof. Mag. Dr. Thomas Rattei ist seit März 2010 Professor für "In Silico Genomics" und Leiter des neu gegründeten Departments für Computational Systems Biology an der Fakultät für Lebenswissenschaften.