Small-Sample Analysis and Inference of Networked Dependency Structures from Complex Genomic Data
Beschreibung
vor 18 Jahren
Die vorliegende Arbeit beschäftigt sich mit der statistischen
Modellierung und Inferenz genetischer Netzwerke.
Assoziationsstrukturen und wechselseitige Einflüsse sind ein
wichtiges Thema in der Systembiologie. Genexpressionsdaten weisen
eine hohe Dimensionalität auf, die geringen Stichprobenumfängen
gegenübersteht ("small n, large p"). Die Analyse von
Interaktionsstrukturen mit Hilfe graphischer Modelle ist demnach
ein schlecht gestelltes (inverses) Problem, dessen Lösung Methoden
zur Regularisierung erfordert. Ich schlage neuartige
Schätzfunktionen für Kovarianzstrukturen und (partielle)
Korrelationen vor. Diese basieren entweder auf Resampling-Verfahren
oder auf Shrinkage zur Varianzreduktion. In der letzteren Methode
wird die optimale Shrinkage Intensität analytisch berechnet. Im
Vergleich zur klassischen Stichprobenkovarianzmatrix besitzt
speziell diese Schätzfunktion wünschenswerte Eigenschaften im Sinne
von gesteigerter Effizienz und von kleinerem mittleren
quadratischen Fehler. Außerdem ergeben sich stets positiv definite
und gut konditionierte Parameterschätzungen. Zur Bestimmung der
Netzwerktopologie wird auf das Konzept graphischer Gaußscher
Modelle zurückgegriffen, mit deren Hilfe sich sowohl marginale als
auch bedingte Unabhängigkeiten darstellen lassen. Es wird eine
Methode zur Modellselektion vorgestellt, die auf einer multiplen
Testprozedur mit Kontrolle der False Discovery Rate beruht. Dabei
wird die zugrunde liegende Nullverteilung adaptiv geschätzt. Das
vorgeschlagene Framework ist rechentechnisch effizient und
schneidet im Vergleich mit konkurrierenden Verfahren sowohl in
Simulationen als auch in der Anwendung auf molekulare Daten sehr
gut ab.
Modellierung und Inferenz genetischer Netzwerke.
Assoziationsstrukturen und wechselseitige Einflüsse sind ein
wichtiges Thema in der Systembiologie. Genexpressionsdaten weisen
eine hohe Dimensionalität auf, die geringen Stichprobenumfängen
gegenübersteht ("small n, large p"). Die Analyse von
Interaktionsstrukturen mit Hilfe graphischer Modelle ist demnach
ein schlecht gestelltes (inverses) Problem, dessen Lösung Methoden
zur Regularisierung erfordert. Ich schlage neuartige
Schätzfunktionen für Kovarianzstrukturen und (partielle)
Korrelationen vor. Diese basieren entweder auf Resampling-Verfahren
oder auf Shrinkage zur Varianzreduktion. In der letzteren Methode
wird die optimale Shrinkage Intensität analytisch berechnet. Im
Vergleich zur klassischen Stichprobenkovarianzmatrix besitzt
speziell diese Schätzfunktion wünschenswerte Eigenschaften im Sinne
von gesteigerter Effizienz und von kleinerem mittleren
quadratischen Fehler. Außerdem ergeben sich stets positiv definite
und gut konditionierte Parameterschätzungen. Zur Bestimmung der
Netzwerktopologie wird auf das Konzept graphischer Gaußscher
Modelle zurückgegriffen, mit deren Hilfe sich sowohl marginale als
auch bedingte Unabhängigkeiten darstellen lassen. Es wird eine
Methode zur Modellselektion vorgestellt, die auf einer multiplen
Testprozedur mit Kontrolle der False Discovery Rate beruht. Dabei
wird die zugrunde liegende Nullverteilung adaptiv geschätzt. Das
vorgeschlagene Framework ist rechentechnisch effizient und
schneidet im Vergleich mit konkurrierenden Verfahren sowohl in
Simulationen als auch in der Anwendung auf molekulare Daten sehr
gut ab.
Weitere Episoden
vor 11 Jahren
vor 11 Jahren
vor 11 Jahren
In Podcasts werben
Kommentare (0)