Maelstrom

Forschung für Innovation

Wir forschen an der Zukunft

Wetter- und Klimavorhersage, Hochleistungs-Computing und maschinelles Lernen

Im europäischen Forschungs- und Entwicklungsprojekt Maelstrom treibt 4cast die Innovationen beim Machine Learning und High Performance Computing konsequent voran. Der Fokus liegt auf der Erhebung von Wetterdaten. Eins der Themen: die Generierung von Live-Wetterdaten aus Social Media. Wir sind mit drei Forschungsprojekten an Maelstrom beteiligt, die sich für die Energiewende und eine nachhaltigere Energieerzeugung auszahlen werden.

Application 2 – Wettervorhersagen mit Tweets

Die Vorhersagekraft von Wettermodellen hängt von der Quantität und Qualität der Wettermessungen zur Initialisierung der Wettermodelle ab. Wir versuchen, Nutzer sozialer Medien als Bürgerwetterstationen zu nutzen, um Wettervorhersagen zu verbessern. In einer ersten explorativen Studie versuchen wir, Regen aus Tweets vorherzusagen. Wir haben einen Klassifikator auf der Grundlage der DeBERTa-Architektur entwickelt, um anhand des Textinhalts von Tweets vorherzusagen, ob es zum Zeitpunkt und am Ort des Absenders des Tweets „regnet“ oder „nicht regnet“.
Wir initialisieren unser Modell mit vortrainierten Gewichten und passen es für unsere spezifische Anwendung an. Unser bestes Modell erreicht einen f1-Score für die Minderheitenklasse (Regen) von 0,66 mit einem AUC von 0,77.

Application 6 – Großwetterlagen

Als Großwetterlagen bezeichnet man großskalige Wetterstrukturen über Deutschland. Diese können Rückschlüsse auf das lokale Wetter erlauben und somit – so die Annahme – auch auf den Energieertrag von Wind- und Solarparks. Im Rahmen von Maelstrom erforschen wir genau diesen Sachverhalt und versuchen herauszufinden, ob uns Großwetterlagen dabei helfen, unsere Vorhersagen noch weiter zu verbessern.

Machine Learning Workflow Tools für High-Performance Computing

High-Performance Computing ist eine großartige Möglichkeit, hochkomplexe Berechnungen in kürzester Zeit durchzuführen. Allerdings ist der Zugang zu Supercomputern limitiert und die Arbeitsschritte für Machine Learning Wissenschaftler sehr komplex und mühselig. Außerdem arbeiten Forscher der Wetter- und Klimaphysik mit extrem großen Datenmengen, deren Verarbeitung den Flaschenhals in der Performance von Machine Learning Prozessen bildet.

Wir arbeiten an einer Online-Plattform, die es Nutzern erlaubt, Machine Learning Projekte zu entwickeln und sich mit anderen Nutzern darüber auszutauschen. Die Plattform bietet die Möglichkeit, alle Schritte des Workflows zu überblicken: Daten, Code, Experimente und trainierte Modelle. Eine direkte Anbindung der Plattform an die Schnittstellen der Supercomputer ermöglicht es, das Training von Modellen sowie das Nutzen von trainierten Modellen für bspw. Vorhersagen direkt aus dem Browser zu starten. Die Ergebnisse von Modelltraining oder -anwendung erscheinen in Echtzeit auf der Plattform.

Maelstrom

Konsortium

ECMWF
4cast-logo
E4 computer engineering
ETH-zuerich
FZ-juelich
nmi
uni-lux

Partner

nvidia