Sonderprojekte zwischen Bayern und Florida

Dr. F. Theis

Institute for Bioinformatics and Systems Biology
Helmholtz-Zentrum


Prof. Dr. A. Meyer-Baese

Department of Computational Sciences
Florida State University

Moderen Verfahren des Data Mining zur Analyse von Gene Expression und Polar Lipid Daten von Glioblastomazelltypen U87 MG

Glioblastoma stellen diffuse und extrem invasive maligne Tumoren dar. Herkoemmliche Behandlungsmethoden erweisen nur einen begrenzten Erfolg. Es ist wissenschaftlich begruendet, dass Transfizieren von Gliomazellen mit dem Wildtypprotein p53 (wt p53) zu einer schnellen Apoptosis fuehren werden falls der Zelltyp den Mutanten p53 beherbergt, waehrend das Transfizieren von Zellen, die den Widtypen p53 wie z.B. U87 enthalten, zu einer Reduktion oder Elimination von Invasion und Motilitaet fuehren werden. Eine recht neue Studie verglich Polarlipidveraenderungen in derart behandelten Zellen and Kontrollzellen und enthuellte modulierte Regulation sowie distinkte strukturale Unterschiede in Glycosphingolipids (GSLs), Sulfatide und Phospholipide.
Die resultierende Menge an experimentellen Daten muss mathematisch analysiert und interpretiert werden.

Das Ziel unseres Projektes besteht darin, moderne Verfahren der multivariaten Analyse zur Interpretation, Visualisierung und Klassifizierung von Experimentdaten anzuwenden, die Polarlipid-, proteomische und gene array Veraenderungen in behandelten und Kontrollzellen nachweisen. Unsere Untersuchungen werden den Nutzwert von neuen, spezifischen lipidomicangepassten Verfahren beweisen, die potentielle Wirkungsbereiche in der Glioblastomakrebstherapie suchen und identifizieren, indem spezifische Tumorreaktionen zu verschiedenen Therapien ausgewertet werden.

Abschlussbericht

Hintergund

Trotz grosser Anstrengungen in Therapie und durch chirurgische Eingriffe ist die Glioblastoma Multiform, ein bösartiger Primärtumor, fast immer tödlich. As Modell für Glioblastoma Gehirntumore werden die Zelllinien U87 GM verwendet. Heutige Forschungen zeigen, dass die Kombination aus Gentransfektion vor Chemoterapiebehandlung erfolgreich angewendet werden kann um den Zelltot für die untoten Glioblastoma Zellen zu erzielen. Die U87 Zelllinie trägt das wildtyp (wt) p53 Tumor Suppressor Gen und keine Mutantenversion davon. As Haupteigenschaft sind die Tumorzellen resistent gegen Apotose (programmierter Zelltot). Zellen die mit dem Tumorsuppressor Gen p53 transfiziert werden vor der Behandlung mit dem SN38 Chemotherapeutikum begehen Apoptose, wobei Chemotherapie alleine diesen gewünschten Phenotypen nicht hervorrufen kann. In U87 mit wt p53 Zellen resultiert die Adenovirustransfektion mit p53 und SN38 Behandlung in moderate Apoptose und G2 Zellzyklus Arrest. Die umgekehrte Reihenfolge von SN38 Behandlung vor p53 Transfektion resultiert in fast komplette Apoptose und komplettem G2 Arrest.

Zelllysate von allen manipulierten Zelllinien wurden analysiert im Hinblick auf ihre Variationen in Lipid Levels. Massenspektrometrie (MS) gewinnt Lipidkonzentrationen für die Wildtyp Zelllinien und den vielfältigen Kombinationen aus Transfektionen/Behandlungen. Die MS/MS Technik, die fähig ist die komplexen Lipide zu separieren, ist die Fourier-Transformations Ion-Cyclon-Resonanz (FT-ICR) MS. Lipidkonzentrationen von 167 Lipiden wurden zweimal gemessen für insgesamt acht Kombination von Transfektionen/Behandlungen. Als Ergebnis, hät die Matrix die hier analysiert werden soll die Konzentrationen der Lipide jeder Zellinie mit und ohne Transfektionen/Behandlungen.

Ziel

Biologisch relevante Variante ist die Kombination aus wt p53 Adenovirus-Transfektion mit SN38 einzig im Vergleich mit der (Kontroll-)Zelllinie die mit leerem Vektor (DI312) transfiziert wurden vor SN38 Behandlung. Um nur die Lipide zu identifizieren die auf die kombinierte Behandlung reagiert, wurden einige Kontrollbehandlungen durchgeführt um folgende Schlüsselfrage zu beantworten: Welche Lipide, Lipidklassen oder Lipid-Stoffwechselwege sind betroffen von dem p53 Behandlung vor Chemotherapie die bei Tumorzellen Apoptopse auslösen ?

Wir beabsichtigten die partiellen Korrelationen der Lipidkonzentrationen zu identifizieren die gleichermaßen von der Behandlung von betroffen sind während wir die biologische interpreation der Ergebnisse beachten. Wir wenden mehrere Methoden an: Mittels eines Korrelationsnetzwerkes wird ein Gaussian Graphisches Modell berechnet daß auf partiellen Korrelationen basiert. Untergruppen des Netzwerkes werden dann mit Hilfe einer Datenbank über Lipid-Stoffwechselwegen validiert, die dafür manuell erstellt wurde.

Methode

Traditionell werden Korrelations-Netzwerke generiert, um Informationen über die Co-Regulierung irgendeines Moleküles zu erhalten, daß in irgendwelchen Proben gemessen wurde. Im Falle des vorliegenden Metaboliten Datensatzes gibt die Korrelation Information über die paarweisen Korrelationen für jedes gemessenes Lipid (das Molekül). Die Korrelation wird dabei auf Grund der gemessenen Proben - die Zelllinien mit verschiedenen Transfektionen/Behandlungen - ermittelt. Zur Ermittlung der Korrelation wird die Pearson-Korrelation angewendet. Allerdings haben die (Pearson) Korrelationsnetzwerke zwei große Nachteile. Erstens kann die Korrelation entweder durch eine direkte (biologischen) Ko-Regulierung oder durch eine indirekte Assoziationen enstehen. Zweitens muss das Korrelationsnetzwerk willkürlich mittels eines Schwellenwertes zurückgeschnitten werden, um eine vernünftige Auswertung zu bekommen. Auf grund dieser Nachteile haben wir uns für Gauss-Grafische-Modelle (GGM) entschieden, die nicht nur direkten Zusammenhänge aus den Messungen extrahiert, sondern auch vermeidet einen beliebigen Schwellwerten zu finden. Ein GGM enthält Informationen über paarweise partielle Korrelationskoeffizienten, nur wenn ein direkter Zusammenhang besteht, der anschließend durch statistische Tests validiert wird. Dabei werden nur die wesentlichen Teilkorrelationen gefunden ohne ein willkürliches setzten eines Schwellenwertes.

Partielle Korrelationskoeffizienten sind einfach zu berechnen, wenn die Zahl der Proben n die Anzahl der Variablen p im Datensatz übersteigt. Im Falle des vorliegenden Lipid-Datensatzes, haben wir den umgekehrten Fall von p > n, wo wir n = 16 Proben und p = 157 haben. Eine einfache Berechnungen ist damit nicht mehr möglich, da die Korrelation / Kovarianz-Matrizen nicht gut konditioniert sind. Zur Lösung des GGM für p > n führte Strimmer und Kollegen ein All-in-one Bootstrapping Ansatz ein der aus einer Matrix die signifikante Kanten in einem GGM selbst findet. Sie verwenden eine Bootstrapping Aggregations Technik zusammen mit einer SVD der Korrelationsmatrix, bevor Sie mit Bayes ein optimales Netzwerk schätzen.

Die Berechnung des GGM geht davon aus, dass alle Proben unabhängig sind, da im Falle von abhängigen Proben die Schätzungen der Kovarianzen nicht mehr optimal sind: die Standardabweichung der Schätzung steigt monoton mit größeren Korrelationskoeffizienten.
In der vorliegende Lipidome Datenmenge beobachten wir eine allgemein hohe Korrelation zwischen den Proben. Obwohl Korrelation zwischen den wiederholten Messung höher waren als zu anderen Transfektionen/Behandlungen ist insgesamt die Korrelation von Krankheit und Kontrollproben sehr hoch (> 0,95). Diese Ergebnisse deuten bereits darauf hin, dass die erfolgreiche Behandlung von Zellen mit wt p53 transfizierten vor SN38 Chemotherapie nur starke Auswirkungen ein paar der Lipide hat und nicht die Lipide im Allgemeinen beeinträchtigt.
Um für die hohen Abhängigkeiten aller Proben auf zu kommen, berechneten wir die GGM mit der Einstellung daß alle Proben Replikate von einander sind. Da sieben der acht Proben nur als Kontrollen gemessen werden, ist dieser Ansatz für unsere Studie anwendbar.

Um schließlich Teilkorrelationen von Lipiden zu identifizieren, die nur aus der biologisch relevanten Behandlung und nicht aus anderen Nebeneffekt der Transfektionen / Behandlungen im einzelnen entsteht, haben wir folgende Idee umgesetzt. Der Einfachheit halber nennen wir die biologisch relevanten Behandlung `` Krankheit'' im Bezug auf die Kontrollen, obwohl diese Kombination von Transfektion / Behandlung die Tumorzellen eigentlich vor weiterem Wachstum/Verbreitung hindert.
Stellen Sie sich eine signifikante Korrelation des gesamten Datensatzes vor (sieben Kontroll-Duplikate und einem erkrankten Duplikat). Die auftretende signifikante Korrelationen auf den gesamten Datenbestand kann daher das Ergebnis einer perfekten Korrelation der Kontrollen (die nicht hauptsächlich von den kranken Proben kommt) sein oder aber auch ein Ergebnis das in erster Linie durch die Krankheits-Proben induzieren wird. Mit anderen Worten: wenn eine Korrelation nur auf den Kontrollen besteht aber keine besondere Bedeutung für die Krankheit hat, würden wir immer noch einen Zusammenhang in einem GGM erkennen das lediglich aus Kontrollproben aufgebaut wurde.
Wir erhalten also die Krankheits-relevanten Teilkorrelationswerte durch den Vergleich der GGM der gesamten Datenmenge und der GGM aller sieben Kontrollproben.
Zusätzlich zu dem beschriebenen Szenario, müssen wir für den umgekehrten Fall auch aufkommen. Wenn ein Zusammenhang besteht auf der Kontrollproben, die aber unterdrückt wird sobald die Krankheits-Probe mit in den Daten ist, werden der gesamte Datensatz unkorreliert für das entsprechende Lipid, und ist damit auch Krankheits-relevant.
Wir erhielten diese unterdrückten Korrelationen durch die Extraktion der Korrelationen, die auf den Kontrollen vorkommen aber nicht auf den gesamten Datenbestand.
Als Ergebnis erzeugt wir ein Netzwerk von GGM nur Lipid-Lipid-Korrelation (Ko-Regulierung) nur der Kombination von wt p53-Transfektion vor SN38 Chemotherapie zuzuschreiben ist.

Mit der krankheitsrelevanten GGM waren wir jetzt in der Lage dieses GGM-Netzwerke zu Lipid-Stoffwechelwegen in Beziehung zu setzten. Wir kombinierten Stoffwechselwege der Lipid-Kopfgruppen mit solchen die den Umbau der Lipidketten beschreibt. Da die GGM direkte Interaktionen erfasst wird mit dieser Methode die regulierten Stoffwechselwege nachweisbar. Wir analysierten die GGM zusammen mit den Lipistoffwechselwelgen, die durch die Kombination von wt p53 Transfektion und SN38 Chemotherapie auf Glioblastom-Zelllinien.

 

Impressum

Datenschutzerklärung