Sequence-Modelling von Sonnenspektren (SA)

Ausgangslage

Das Institut für Data Science ist in verschiedenen Sonnen-Forschungsprojekten beteiligt, deren Ziel darin besteht, ein besseres Verständnis der physikalischen Prozesse auf der Sonne zu gewinnen undum schliesslich auch Sonneneruptionen vorhersagen zu können. Ein solches Projekt besteht u.a. in der Auswertung der Daten des IRIS-Satelliten der NASA. IRIS schickt täglich 12 GB Beobachtungsdaten, welche u.a. Informationen über die zeitliche Veränderung des Zustands der Sonne liefern. Die Daten bestehen neben Bildern auch aus Spektrogrammen, welche uns Informationen über die auf der Sonne ablaufenden physikalischen Prozesse geben.

Ziel der Arbeit

Das Ziel der Arbeit ist ein besseres Verständnis über die in der Abfolge der Spektren widerspiegelten Dynamik zu gewinnen. Insbesondere sollen verschiedene Sequence Modeling – Algorithmen auf deren Eignung zur Modellierung der Zeitreihen aus Spektren untersucht werden. Typischerweise wird diese Modellierung auf Basis von geeigneten Features erfolgen, die vorgängig aus den Spektren extrahiert werden. Dazu soll eine Machine-Learning Pipeline erstellt werden inklusiv Daten-Preprocessing mit anschliessendem Se-quence-Modeling.

Problemstellung

Kurze Einarbeitung in die Fragestellung (Datensets, Spektrogramme) Preprocessing der Daten: Geeignete Indexierung zur Auswahl der Spektren. Dabei sollen v.a. Spektrenaus den aktiven Regionen (Sonnenflecken) der Sonne selektiert werden (die PhysikerInnen werden hierzu die nötigen Inputs liefern). Definition und Extraktion geeigneter Features bei den ausgewählten Spektren und Ablage in einer geeigneten Datenbank. Hier können sowohl klassische Verfahren (geeignetes Model-Fitting, FFT, etc.) oder auch Machine-Learning Verfahren (z.B. k-Means, PCA) hilfreich sein. Sequence-Modellierung: Evaluation verschiedener Sequence-Modelle (k-Means, HMM, RNN, etc.) Aufsetzen einer Daten-Analyse-Pipeline zur effizienten Evaluation verschiedener Modelle.

Link IRIS Big Data am I4DS


Raumsonde IRIS, künstlerische Darstellung