000357363 001__ 357363
000357363 005__ 20250210173114.0
000357363 0247_ $$aG:(GEPRIS)550090872$$d550090872
000357363 035__ $$aG:(GEPRIS)550090872
000357363 040__ $$aGEPRIS$$chttp://gepris.its.kfa-juelich.de
000357363 150__ $$aSkalierbares Graphen-Lernen mit Kontrolle der Falschentdeckungsrate$$y2024 -
000357363 371__ $$aProfessor Dr.-Ing. Michael Muma
000357363 450__ $$aDFG project G:(GEPRIS)550090872$$wd$$y2024 -
000357363 5101_ $$0I:(DE-588b)2007744-0$$aDeutsche Forschungsgemeinschaft$$bDFG
000357363 680__ $$aGrafische Modelle werden dank ihrer Fähigkeit, komplexe Beziehungen zwischen Variablen zu erfassen, in vielen wissenschaftlichen Bereichen eingesetzt. Aufgrund technologischer Fortschritte und der Notwendigkeit, immer komplexere Datenstrukturen zu verstehen, ist die Zahl der Variablen in zahlreichen Forschungsbereichen stark angestiegen. Besonders deutlich wird dies bei der Bestimmung biologischer Netzwerke. Gemeinsam mit Domänenexperten behandeln wir daher exemplarisch diesen praktischen Anwendungsfall. In den betrachteten Szenarien kann die Stichprobengröße in der gleichen Größenordnung oder sogar kleiner als die Anzahl der Variablen sein (z. B. Untersuchung seltener Krankheiten). Folglich übersteigt die Zahl der potenziellen Kanten eines grafischen Modells bei weitem die Anzahl der verfügbaren Messungen. Daher sind strukturelle Annahmen wie Sparsamkeit für aussagekräftige, interpretierbare und zuverlässige grafische Modelle unabdingbar. Die Bestimmung des angemessenen Maßes an Sparsamkeit, insbesondere für hochdimensionalen Daten, erfordert einen Kompromiss zwischen inkludierten falsch positiven und falsch negativen Kanten. Unser Forschungsansatz maximiert daher den Prozentsatz der richtig positiven Kanten während gleichzeitig die Falschentdeckungsrate (FDR) auf einem akzeptablen Zielniveau kontrolliert wird. Zusammengefasst erforschen wir neue Methoden zur Kontrolle der FDR für grafische Modelle, die auf hochdimensionale Daten skalierbar sind und die einen praktischen Nutzen in biomedizinischen Anwendungen demonstrieren. Bislang gibt es nur sehr wenige Methoden mit nachweisbarer FDR-Kontrolle für hochdimensionale grafische Modelle. Eine vielversprechende Vorarbeit wurde kürzlich in unserer Gruppe entwickelt. Im Rahmen dieses Forschungsprojekts bauen wir auf unserem Terminating-Random-Experiments (T-Rex) Verfahren auf, um neue FDR-kontrollierende Graphenschätzungsmethoden zu entwickeln, die i) in ihrer Rechenkomplexität auf klinisch relevante, hochdimensionale Szenarien skalieren; ii) strukturelle Abhängigkeiten zwischen Variablen erfassen (z. B. hierarchische, gruppierte); iii) geeignet für Datenverteilungen mit schweren Rändern sind (z. B. elliptische); iv) keine manuelle Parameterabstimmung erfordern, sondern eine optimale Selbstkalibrierung beinhalten, so dass die true positive rate (TPR) bei Kontrolle der FDR maximiert wird. Die vorgeschlagene Methodik kann auch auf andere statistische Fehlergarantien erweitert werden (z. B. Verbinden disjunkter Graphenkomponenten). Die Arbeit ist in fünf Arbeitspakete (AP) unterteilt. AP 1 entwickelt FDR-kontrollierende Pseudo-Likelihood-Methoden, während AP 2 Score-Matching-Ansätzen erforscht. AP 3 befasst sich mit strukturierter Variablenauswahl. AP 4 bestimmt gemeinsam mit Kooperationspartnern reproduzierbare Graphen für hochdimensionale biologische Netzwerke. WP 5 stellt gut dokumentierte Open-Source-Softwarepakete und Visualisierungswerkzeuge bereit um den Impact unserer Arbeit zu erhöhen.
000357363 909CO $$ooai:juser.fz-juelich.de:1038754$$pauthority$$pauthority:GRANT
000357363 909CO $$ooai:juser.fz-juelich.de:1038754
000357363 980__ $$aG
000357363 980__ $$aAUTHORITY