- ACINN - Universität Innsbruck

Transcription

- ACINN - Universität Innsbruck
Das A-UMOS:
“updateable model output statistics”-System für
Europa
DIPLOMARBEIT
in Meteorologie
Eingereicht an der
FAKULTÄT
FÜR
GEO -
UND
ATMOSPHÄRENWISSENSCHAFTEN
der
UNIVERSITÄT INNSBRUCK
zur Erlangung des Titles
MAGISTER
DER
NATURWISSENSCHAFTEN
vorgelegt von
RETO STAUFFER
betreut durch
Georg J. Mayr
Innsbruck, November 2011
i
Abstract
Statistical methods based on historical observations/numerical forecasts are used to correct the direct
model output (DMO) of a numerical weather model and bring the forecasts to a finer spacial resolution. Improvements in the numerical weather model can change the statistical relation between the
observation and the DMO. A new Model Output Statistics System (MOS), which can adjust to changes
in the numerical weather prediction model was developed for the national weather service of Austria
(„Zentralanstalt für Meteorologie und Geodynamik“, ZAMG). The system is based on the Canadian
Updateable Model Output Statistics System concept (Wilson and Vallée 2002, Wilson and Vallée 2003)
adapted for the European region. Based on the ECMWF DMO, the forecasts are postprocessed twice a
day for 878 different sites. The updateable scheme allows the A-UMOS to do a semi-automatic adaption of the new model characteristic and allows the system to use the improvements of the numerical
model as soon as possible to improve the quality of the A-UMOS forecasts. A multiple linear regression
(MLR) is used for the 16 deterministic predictands. The six probabilistic predictands are based on a linear multiple discriminant analysis (LMDA, classifier). The validation shows a significant improvement
relative to the existing MOS system of the ZAMG (AUSTROMOS2) and the direct model output of the
ECMWF. An RMSE reduction of 25% against the AUSTROMOS2 and 43% against the ECMWF could be
reached over a subset of 145 stations in Austria. The percent correct for the probabilistic predictands
could be enhanced by 3.6% against the AUSTROMOS2 and 2.9% against the ECMWF. Also the Brier
score could be reduced by 35% relative to the AUSTROMOS2.
ii
Zusammenfassung
Mittels statistischen Verfahren angewandt auf historische Mess-/Vorhersagedaten wird der direkte Modelloutput (DMO) eines numerischen Modells korrigiert und auf eine höhere räumliche Auflösung
gebracht. Durch die Weiterentwicklung der numerischen Wettermodelle verändert sich jedoch die statistische Beziehung zwischen dem DMO und den Beobachtungen (Messungen). Basierend auf der Idee
des Canadian Updateable Model Output Statistics Systems (UMOS, Wilson and Vallée 2002, Wilson
and Vallée 2003) wurde ein neues Model Output Statistics (MOS) System für die Zentralanstalt für
Meteorologie und Geodynamik (ZAMG) entwickelt, welches Vorhersagen des ECMWF Globalmodells
für Europa postprozessiert. Durch das „updateable“ Schema passt sich das Austrian Updateable Model Output Statistics (A-UMOS) System semi-automatisch an die neue Charakteristik an. Die Verbesserungen der numerischen Modelle werden dadurch effizient und vor allem rasch an das A-UMOS
weigergegeben, wodurch die Vorhersagegüte gesteigert werden kann. Verwendet wird eine multiple
lineare Regression (MLR) für insgesamt 16 deterministische Prädiktanten sowie eine lineare multiple Diskriminantenanalyse (LMDA) für 6 probabilistische Prädiktanten. Verarbeitet werden 878 unterschiedliche Standorte. Die Verifikation zeigt eine klare Verbesserung für die deterministischen Grössen
gegenüber dem Referenzsystem (AUSTROMOS2, ZAMG). Der RMSE konnte gegenüber dem Referenzsystem um 25%, gegenüber dem ECMWF um 43% verbessert werden. Bei den probabilistischen Vorhersagen konnte die Gesamttrefferquote gegenüber dem Referenzsystem um 3.6%, gegenüber dem
ECMWF um 2.9% verbessert werden. Der Brier Score des A-UMOS konnte gegenüber dem AUSTROMOS2 um 35% reduziert werden.
Inhaltsverzeichnis
Inhaltsverzeichnis
v
1 Stand der Forschung und Motivation
1
1.1 Geschichte der Wettervorhersage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
1.1.1 Erste objektive/physikalische Ansätze . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
1.1.2 Bjerknes: Meteorologie ist eine exakte Wissenschaft . . . . . . . . . . . . . . . . . .
3
1.1.3 Richardson: Erste numerische Wettervorhersage . . . . . . . . . . . . . . . . . . . .
3
1.1.4 Von Neumann: Erste numerische Computermodelle . . . . . . . . . . . . . . . . . .
4
1.1.5 Entwicklung der Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
1.2 Statistische Postprozessierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.2.1 Allgemeine Funktionsweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.2.2 Perfect Prog Modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
1.2.3 Model output Statistics-Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
1.3 updateable-Konzept . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
1.3.1 Die Idee / das Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
1.3.2 Nutzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
2 Das Austrian Updateable Model Output Statistics System
15
2.1 Softwaredesign des A-UMOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
2.2 Umfang der Vorhersagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
2.2.1 Prädiktanten (Vorhersagegrössen) . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
2.2.2 Stationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
2.2.3 Vorhersagezeitschritte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
2.3 Verwendete statistische Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
2.3.1 multiple lineare Regression für deterministische Grössen . . . . . . . . . . . . . . .
20
2.3.2 lineare multiple Diskriminantenanalyse für probabilistische Grössen . . . . . . . .
25
2.4 Nachbearbeiten der MOS Vorhersagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
2.4.1 Berechnen von abgeleiteten Grössen / Ergänzen von Vorhersagen . . . . . . . . .
28
2.4.2 Grenzwertüberprüfung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
2.4.3 Konsistenzcheck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
2.5 Berücksichtigung der Jahreszeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
v
vi
INHALTSVERZEICHNIS
2.6 Anpassungen an Modelländerungen der numerischen Modelle . . . . . . . . . . . . . . . .
33
2.6.1 Trainingsdatensatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
2.6.2 Linearkombination von MOS Modellversionen: das „updateable“ Schema . . . . .
34
2.7 Verifikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
2.7.1 Datengrundlage der Verifikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
2.7.2 multiple lineare Regression: Verifikationsmasse . . . . . . . . . . . . . . . . . . . . .
38
2.7.3 multiple lineare Regression: Resultate . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
2.7.4 multiple lineare Regression: Übersichtstabelle . . . . . . . . . . . . . . . . . . . . . .
47
2.7.5 lineare multiple Diskriminantenanalyse: Verifikationsmasse . . . . . . . . . . . . .
48
2.7.6 lineare multiple Diskriminantenanalyse: Resultate . . . . . . . . . . . . . . . . . . .
51
2.7.7 lineare multiple Diskriminantenanalyse: Übersichtstabelle . . . . . . . . . . . . . .
60
2.8 Diskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
Abkürzungsverzeichnis
65
Abbildungsverzeichnis
65
Tabellenverzeichnis
69
Literaturverzeichnis
72
Anhang
74
Kapitel 1
Stand der Forschung und Motivation
Bereits seit Mitte der 1980er Jahre werden sogenannte Model Output Statistics (MOS) Systeme im täglichen Wetterdienst verwendet. MOS Systeme korrigieren und modifizieren die Vorhersagen aus dem
direkten Modelloutput des numerischen Modells (DMO). Dazu sind einerseits die Beobachtungen von
Wetterstationen notwendig, andererseits der direkte Modelloutput des numerischen Modells (DMO).
Aus diesen Daten wird ein Trainingsdatensatz aus historischen Daten erzeugt, welcher die Basis für die
statistischen Methoden in den MOS Systemen darstellt. Aufgrund des statistischen Zusammenhangs
zwischen dem DMO und den Beobachtungen korrigiert das MOS den DMO und bringt den grob aufgelössten DMO auf das feinskaligere Messnetz. Historisch lässt sich nicht genau fixieren, wann die
ersten Gehversuche mit MOS Systemen gemacht wurden. Als Vorreiter gilt jedoch die Veröffentlichung
„The Use of Model Output Statistics (MOS) in Objective Weather Forecasting“ (Glahn and Lowry 1972),
National Oceanic and Atmospheric Administration der U.S.A. (NOAA).
Das Erste operationelle System lief ab 1976 bei der NOAA, im Jahre 1983 wurde ein weiteres System bei der United States Air Force (USAF) in Betrieb genommen, welches auf dem speziell für die
Lufwaffe entwickelten dynamischen Modell “‘NOGAPS“ aufbaute. Vorläufer der MOS Systeme waren
die sogenannten Perfect Prog (PP) Modelle. Beide Verfahren arbeiten mit denselben mathematischen
Algorithmen, jedoch sind die Limitierungen sehr unterschiedlich (s. Kapitel 1.2). PP Modelle wurden
vor allem in den Anfangsphasen verwendet, wurden aber dann durch MOS Systeme stark vom Markt
verdrängt, da der Nutzen der MOS Systeme für die Wettervorhersage stärker ist als jener der PP Modelle.
Aufgrund der hohen benötigten Rechenleistung und der anfallenden Datenmengen, sowohl der dynamischen Modelle als auch der MOS Systeme, waren die Möglichkeiten in den Anfängen noch stark begrenzt. Mit den heutigen Computerkapazitäten und den hohen Datendurchsätzen des Internets lassen
sich mit modernen Systemen wesentlich mehr Daten verarbeiten und umfangreichere MOS Vorhersagen erstellen.
Heute liefern nicht mehr nur die grossen Vorhersagezentren wie etwa die NOAA oder das European
Centre for Medium-Range Weather Forecasts (ECMWF) MOS Vorhersagen, auch beinahe jeder nationale und private Wetterdienst betreibt eigene Systeme. Das Einsatzgebiet reicht mittlerweile weit über
jenes der 1980er Jahre hinaus. Wurden damals vorwiegend Vorhersagegrössen wie der Niederschlag
oder relevante Grössen für die Luftfahrt 1 − 2 Tage in die Zukunft gerechnet, so finden wir heute MOS
Vorhersagen für beinahe alle meteorologischen Grössen, die teilweise Vorhersagen bis +2 Wochen liefern.
Aufgrund des Wettbewerbs ist es schwierig zu sagen, welcher Betreiber welche mathematischen Algorithmen verwendet. Sehr verbreitet sind aber heute noch immer die linearen Regressionen, wie etwa
1
2
Stand der Forschung und Motivation
die MLR für deterministische Grössen oder die LMDA für Wahrscheinlichkeitsvohrersagen (probabilistische Vorhersagen). Im Gegensatz zu vielen nichtlinearen Regressionen ist der lineare Ansatz viel
weniger Rechenintensiv und liefert bei gängigen Trainingsdatensatzlängen qualitativ gute Vorhersagen. Wichtig ist dabei zu beachten, dass die Eingangsgrössen (Prädiktoren) und die Beobachtungen in
einer linearen Beziehung zueinander stehen (physikalisch oder durch eine Transformation).
Ein bekanntes Problem von MOS Systemen ist die Abhängigkeit vom DMO. MOS Vorhersagesysteme
basieren - wie bereits angesprochen - auf dem statistischen Zusammenhang zwischen den Beobachtungen und dem DMO. Ändert sich dieser jedoch aufgrund einer Weiterentwicklung des numerischen
Modells, so verändert sich auch die Charakteristik des DMO. Dies führt dazu, dass die statistische Beziehung basierend auf den historischen Daten nicht mehr stimmt oder “verzerrt“ wird. Verschiedene
Verfahren wurden bereits angewendet, um dieses Problem zu umgehen. Eines davon wird im Austrian
Updateable Model Output Statistics (A-UMOS) verwendet und in dieser Arbeit detailliert behandelt.
1.1
Geschichte der Wettervorhersage
Die Geschichte der Wettervorhersage ist bereits sehr alt. Da der Mensch seit jeher abhängig von der
Natur und damit auch vom Wetter ist, wurde immer wieder versucht, anhand von Wolkenbildern und
Naturphänomenen das Wetter vorherzusagen. Griechische Philosophen verbanden im 7ten Jh.v.Chr.
„das Wetter mit der Bewegung der Sterne und Planeten“. Als Begründer der modernen Meteorologie
gilt Aristoteles (384 v.Chr. - 322 v.Chr.). Obwohl er einige falsche Annahmen traf, beschrieb er erstmals
den Aufbau der Atmosphäre und einfache Prozesse, die sich in ihr abspielen.
Bis die Menschheit die komplexen Prozesse in der Atmosphäre jedoch genauer verstehen konnte, dauerte dies noch eine lange Zeit. Wettervorhersagen wurden in den vergangenen Jahrhunderten meistens
anhand des aktuellen Himmels- und Wolkenbildes abgeleitet. Aus jener Zeit stammen auch die Bauernregeln, welche auch heute beispielsweise in Europa noch stark verbreitet sind.
1.1.1 Erste objektive/physikalische Ansätze
Historisch gesehen lassen sich drei Visionäre der modernen Wettervorhersage auflisten. Dazu gehört
Vilhelm Bjerknes (1862 − 1951), ein norwegischer Physiker und Meteorologe, Lewis Fry Richardson
(1881 − 1953), britischer Meteorologe und Friedensrichter sowie John von Neumann (1903 − 1957),
ein österreichisch-ungarischser Mathematiker.
1.1.2 Bjerknes: Meteorologie ist eine exakte Wissenschaft
Die ersten objektiven und physikalischen Ansätze stammen von Vilhelm Bjerknes, der zu Beginn des
20t en Jahrhunderts einen Artikel mit dem Titel „The Dynamic Principle of the Circulatory Movements in
the Atmosphere“ veröffentlichte (Die dynamischen Grundgesetze der Zirkulationen in der Atmosphäre;
Bjerknes, 1900). Er erstellte erstmals einen mathematischen Gleichungssatz zur dynamischen Wettervorhersage. Dazu gehören der Anfangszustand, die Navier-Stokes-Gleichung als Grundgleichung für
die Bewegung eines idealen kompressiblen Gases, die Zustandsgleichung des idealen Gases, die Massenerhaltung sowie das erste Gesetz der Thermodynamik von Helmholtz. Er konnte beweisen, dass mit
diesem mathematischen Konstrukt ein dreidimensionales Feld (Temperatur, Druck, Dichte und Wind)
basierend auf dem Anfangszustand berechenbar ist.
Die Problematik, mit welcher Bjerknes zu kämpfen hatte war, dass das von Ihm aufgestellte Gleichungssystem nicht analytisch lösbar war. Bis heute ist noch keine analytische Lösung gefunden worden. Bjerknes glaubte, dass das Lösen des Gleichungssystems mittels graphischen Methoden gelingen müsste.
Dies war und ist jedoch zu komplex und lässt sich kaum umsetzen.
1.1.3 Richardson: Erste numerische Wettervorhersage
Der junge britische Wetterbeobachter Lweis Fry Richardson befasste sich ebenfalls mit dem von Bjerknes
aufgestellten Gleichungssatz und hatte - die Geschichte zeigt uns dies - einen besseren Lösungsansatz
für das genannte Problem. Er interessierte sich bereits während seines Physik- und Mathematikstudiums an der Universität von Cambridge für die diskreten Approximationen von Differenzialgleichungen
mittels finiten Differenzen (Numerik). Während seines Dienstes im I Weltkrieg schreib er an seinem
revolutionären Buch mit dem Titel „Weather Prediction by Numerical Process“ (Richardson 1965) und
lösste von Hand exemplarisch eine Wettevorhersage, um seinen Lösungsansatz zu beweisen. Die erste
numerische Wettervorhersage lieferte eine 6h-Vorhersage, ausgehend von 7U T C am 20 May 1910 und
deckte Zentraleuropa ab.
3
4
Stand der Forschung und Motivation
Ein Druckanstieg von über 145hPa über Europa war das Resultat - rund 100 mal stärker als die natürlichen Variationen des Luftdrucks. Ausserdem benötigte er für diese 6h Vorhersage rund 6 Wochen an
Rechenzeit! Obwohl das Resultat vernichtend schlecht war, konnte Richardson zeigen, dass sein Verfahren - zumindest theoretisch - funktionierte. Das Problem lag in den ungenauen Anfangsbedingungen,
wie später festgestellt wurde.
Trotz des wichtigen Teilerfolges war die Methode noch nicht praktikabel. Richardson selbst berechnete,
dass er über 64′ 000 Personen benötigen würde, welche im Team eine Vorhersage berechnen müssten
um zumindest so schnell zu sein, dass ihre Vorhersage jeweils das aktuelle Wetter beschreibt (quasi
Echtzeit-Vorhersagen).
1.1.4 Von Neumann: Erste numerische Computermodelle
In den darauffolgenden 25 Jahren wurden zwei wichtige technische Errungenschaften erlangt, welche die Theorie von Richardson anwendbar machten. So wurde für und während des I I Weltkriegs ein
ausgedehntes meteorologisches Messnetz für die Troposphäre auf- und ausgebaut. Diese Daten wurden
von den Luftstreitkräften benötigt, erhielten so ihre Akzeptanz und lösten das Hauptproblem, welches
Richardson einige Jahr davor zum Scheitern verurteilte - genauere Anfangsbedingungen. Desweiteren
wurden die Arbeiten an modernen Computersystemen vorangetrieben. John von Neumann entwickelte
eine neuartige Architektur für Rechensysteme, die nach ihm benannte Von-Neumann-Architektur. Sie
ermöglichte es erstmals, Programme und Daten auf ein und demselben Speichermedium zu sichern
und bei Bedarf in beliebiger Reihenfolge abzurufen oder zu verändern. Was wir heute alle als Festplatten, Disketten und USB-Speichersticks mit uns herumtragen, verhalf der Informatikindustrie zum
durchbruch.
Von Neumann half ebenfalls bei der Entwicklung der ersten beiden Computersysteme, dem sogenannten „ENIAC“ (Electronic Numerical Integrator and Calculator; 1946 − 1955) und dem Nachfolgemodell
mit dem Namen „EDVAC“ (1951 − 1961). Die beiden Systeme dienten der Armee zur Berechnung
von Flugbahnen ballistischer Geschosse. Nach dem Krieg wurde das Computersystem auch für andere
Aufgaben geöffnet. So berechnet ein Team um Von Neumann im Jahre 1950 die erste 24h Wettervorhersage auf dem ENIAC. Damals war es aufgrund der Rechenleistung und des begrenzten Speichers
lediglich möglich, eine einzige meteorologische Grösse (Vorticity auf der 500hPa Fläche) zu berechnen
(Charney et al. 1950). Ab 1955 wurden dann täglich Vorhersagen für den gesamten Globus gerechnet. Zur Bestimmung des Anfangszustandes wurden von überall her auf der Welt die Beobachtungen
mittels Telegraphennetz übermittelt, welche dann in die Modellanfangsbedingungen einflossen.
1.1.5 Entwicklung der Modelle
Wie bereits Fry Richardson (siehe Kapitel 1.1.3) erkannte, lassen sich die grundlegenden physikalischen Gleichungen zwar beschreiben, eine analytische (also exakte) Lösung der Gleichungssysteme
wurde jedoch bis heute nicht gefunden.
Aus diesem Grund sind wir dazu gezwungen, bei der Wettervorhersage numerische Modelle zu verwenden, welche auf „Gittern“ basieren. Das bis heute am weiten verbreitetste Gitter für globale Atmosphärenmodelle ist ein orthogonales Gitter, welches sich wie ein Schachbrett über den Vorhersagebereich
erstreckt. Abbildung 1.1 zeigt solch ein orthogonales globales Gitter mit insgesamt 1920 Gitterpunkten.
1.1 Geschichte der Wettervorhersage
Abbildung 1.1: Darstellung eines orthogonalen Gitters mit 48 Gitterpunkten entlang der Breitengrade und 40
entlang des Längengrade, ergibt insgesamt 1920 Gitterpunkte (Fig. 1 Tribbia
and Anthes 1987, P. 494).
5
Da für jeden dieser Punkte die einzelnen Variablen berechnet
werden müssen, limitiert bis heute die Computerpower die
Auflösung solcher Modelle. Aus dem Artikel „Scientific Basis
of Modern Weather Prediction“ (Tribbia and Anthes 1987) ist
zu entnehmen, dass die zu Verfügung stehende Computerleistung Mitte der 1980er Jahre die Anzahl Gitterpunkte damals
auf 8 · 105 beschränkte. Bei 16 vertikalen Levels mit jeweils
rund 5 · 104 Gitterpunkten entspricht dies einer horizontalen
Auflösung von rund 100 bis 200km auf der Erdoberfläche.
Diese „Diskretisierung“ der Modelle bringt einige wesentliche
Probleme mit sich, welche bis heute noch dieselben geblieben
sind, auch wenn die Anzahl der Rechenoperationen, welche
mit heutigen Supercomputern durchgeführt werden können,
um einige Zehnerpotenzen gestiegen sind (Eniac: rund 104
Flops; heutige (2011) Hochleistungsrechner (AICS, Japan):
8 · 1015 Flops; Faktor 1012 (top500.org 2011)). Da dies nicht
das zentrale Element dieser Diplomarbeit ist, werde ich nicht
bis ins Detail auf die numerischen Modelle eingehen und einige Aspekte vernachlässigen (Stichwort: LAM, Nesting, Datenassimilation, ...). Es ist wichtig zu verstehen, was die grundsätzlichen Probleme numerischer Modelle sind und weshalb
ein optimales Postprozessieren der Daten wichtig ist.
Problem 1: der Anfangszustand
Im frühen 20t en Jahrhundert ging Laplace davon aus, dass sich der Zustand des Kosmos und der Atmosphäre basierend auf den Newton’schen Gesetzen bis in die Unendlichkeit vorhersagen lässt. Dabei
tauchen jedoch verschiedene Probleme auf. Punkt 1: wir kennen den aktuellen Zustand nur ungenügend, wie seinerzeit auch Fry Richardson (siehe Kapitel 1.1.3) zu spüren bekam. Um die weltweiten
Messungen in den numerischen Modellen verwenden zu können, müssen diese auf die Gitterpunkte
des Modells interpoliert werden. Dieser Vorgang alleine führt schon zu einer Reduktion des Wahrheitsgehaltes. Ebenfalls ist die Repräsentierbarkeit von Messungen ein Problem. Obwohl die Messung
lediglich einen Punktwert darstellt, wird dieser Messwert in den Modellen auf grosse Flächen angewendet, um die „Lücken“ zwischen den verschiedenen Messstationen zu schliessen. Ein letztes hier
genanntes Problem ist die Tatsache, dass die Variationen auf den Gitterpunkten zu ausgeprägten numerischen Problemen führen können (Schwerewellen und Schallwellen innerhalb des Modells), weshalb
die Anfangszustände auch noch künstlich geglättet werden müssen.
Problem 2: Subskalige Prozesse
Gehen wir davon aus, dass unser Modell entlang eines Breitengrades 400 Gitterpunkte aufweist, so
ergibt dies entlang des Äquators mit einem Umfang von rund 40′ 000km lediglich 1 Gitterpunkt alle
100km. In unseren Breiten ist dieser Abstand aufgrund der Form der Erde etwas geringer. Betrachten
wir ein typisches Wärmegewitter in den Alpen, so ist der Durchmesser eines grossen Cumulonimbus
(Gewitterwolke) rund 10km. Wetterphänomene, welche kleiner sind als die Gitterweite, nennt man
„subskalige Phänomene“ und diese lassen sich mit dem beschriebenen Modell nicht direkt vorhersagen.
Aus diesem Grund müssen auch heute noch viele Phänomene wie etwa Turbulenzen, Wolkenbildung
oder Gewitterzellen in den globalen Modellen parametrisiert werden. Man versucht dabei durch so-
6
Stand der Forschung und Motivation
genannte „Schliessungsverfahren“ den mittleren Einfluss eines Phänomens innerhalb der Gitterbox zu
beschreiben. Da die beiden Grössenordnungen voneinander nicht unabhängig sind, schlagen sich die
subskaligen Prozesse aus den Parametrisierungen auf die umliegenden Gitterpunkte nieder. Bei einer
ungenauen oder fehlerhaften Parametrisierung wirkt sich der daraus resultierende Fehler wieder auf
das globale Gitter aus und beeinflusst die weitere Vorhersage.
Als Beispiel sei hier die Bildung von Eiswolken genannt, welche auf mikrophysikalischen Prozessen
basiert. Bei genügend hoher Luftfeuchtigkeit und entsprechenden Umweltverhältnissen gefrieren einzelne Wassermoleküle an sogenannten Kondensationsnuklei zu kleinen Eiskristallen. Aufgrund physikalischer Prozesse wachsen diese Eiskristalle an, bis sie schwer genug sind, um durch die Schwerkraft
getrieben langsam in Richtung Erdoberfläche zu fallen. Ist die Umgebung warm genug, so schmelzen
die einzelnen Eiskristalle, verbinden sich zu grösseren Wassertröpfchen und fallen schlussendlich als
Regentropfen der Erdoberfläche entgegen. All die in diesem Beispiel genannten Prozesse spielen sich
in der Grössenordnung von einigen Mikrometern bis 10mm ab und müssen allesamt durch Parametrisierungen angenähert werden. Selbst wenn die Auflösung der Modelle immer besser wird, wird man
auf Parametrisierungen in der nahen Zukunft nicht verzichten können.
Problem 4: das Chaossystem
Abbildung 1.2: Der Lorenz-Attraktor. (a) und (b) zeigen die Originallabildungen (Fig. 2 Lorenz 1963, P. 137), (c)
eine modernere und besser bekannte Darstellung (Wikimol 2006).
Selbst wenn wir in Zukunft Modelle mit einer immensen Auflösung besitzen, so kann der Zustand der
Atmosphäre nicht unlimitiert in die Zukunft vorhergesagt werden. Den Beweis dazu lieferten Thompson und Lorenz in den 1960er Jahren (Lorenz 1963). In einem vergleichsweise einfachen numerischen
Experiment konnten sie beweisen, dass eine winzige Störung des Anfangszustandes eine starke Divergenz der Lösung mit sich ziehen kann. Sie gelten als Begründer der Chaostheorie. Die Grafik 1.2,
welche diese Lösung zeigt, ist unter dem Namen Lorenz-Attraktor bekannt. Lorenz hielt 1972 einen
Vortrag mit dem Titel „Vorhersagbarkeit: Löst der Flügelschlag eines Schmetterlings in Brasilien einen
Tornado in Texas aus?“ (Lorenz 1972). Auch deshalb ist die Chaostheorie heute unter dem Namen
„Schmetterlingseffekt“ weithin bekannt. Dies ist ein anschauliches Beispiel für das Chaossystem - eine
winzige Änderung im Anfangszustand kann zu einer grossen Änderung des atmosphärischen Zustandes führen. Oder bei der Vorhersage: kleine Fehler im Anfangszustand können zu grossen Fehlern in
der Vorhersage führen.
Als das heute führende Globalmodell - sowohl in der Auflösung als auch in der Genauigkeit - gilt das
Modell am European Centre for Medium-Range Weather Forecasts (ECMWF). Seit dem 26. Januar
2010 lautet der offizielle Name des dort betriebenen Modells T 1279, welches in 91 vertikalen Niveaus
und einer Maschenweite von 0.125◦ rund 7, 5 · 108 Gitterpunkte umfasst. Dies sind rund 1′ 000 mal
mehr Gitterpunkte als noch vor 25 Jahren (Tribbia and Anthes 1987).
1.2 Statistische Postprozessierung
1.2
7
Statistische Postprozessierung
Das Kapitel 1.1.5 zeigt uns, dass die Modellierer der numerischen Wettermodelle seit den Anfängen
stark verbessert haben, jedoch seit jeher mit diversen Schwierigkeiten zu kämpfen haben. Um die Qualität der Vorhersagen weiter zu verbessern, können die Vorhersagen aus dem direkte Modelloutput des
numerischen Modells (DMO) mittels einer statistischen Postprozessierung korrigiert werden. Zudem
wird der DMO durch die Postprozessierung auf eine höhere Auflösung gebracht (“subskalig”) und es
lassen sich meteorologische Grössen vorhersagen, welche nicht im DMO enthalten sind. Da heutige
Modelle eine wesentlich höhere Auflösung besitzen und viel mehr Prozesse berücksichtigen als noch
vor 10−15 Jahren, könnte man sich vorstellen, dass die Postprozessierung mittlerweile überflüssig sei.
Die Zahlen zeigen jedoch, dass der RMSE (siehe Abschnitt 2.7.2) sowohl damals als auch heute durch
die Postprozessierung um rund 40 − 50% reduziert werden kann.
Eine Vorreiterrolle bei der Entwicklung von Model Output Statistics (MOS) Systemen in der Wettervorhersage spielten Glahn and Lowry (1972). Ihre Veröffentlichung aus dem Jahre 1972 mit dem Titel
“The Use of Model Output Statistics (MOS) in Objective Weather Forecasting“ gilt als eine der Ersten
in diesem Bereich. Die Grundidee von damals blieb bis heute dieselbe, jedoch sind heute aufgrund
neuer mathematischer Ansätze und verbesserter Computerleistung unzählige Variationen möglich. In
den kommenden Abschnitten wird das Grundkonzept von solchen statistischen Verfahren erklärt. Der
Abschnitt 2.3 beschäftigt sich detailliert mit den im A-UMOS verwendeten Verfahren.
1.2.1 Allgemeine Funktionsweise
Lernen: der Trainingsdatensatz
Statistische Postprozessierungsmethoden arbeiten alle nach derselben Idee. Dabei wird ein sogenannter Trainingsdatensatz angelegt, in welchem die „Vergangenheit“ gespeichert wird. Im Falle einer Wettervorhersage also beispielsweise die verschiedenen gemessenen meteorologischen Grössen (Beobachtungen) sowie die Vorhersagen aus einem numerischen Modell (z.B. den DMO aus dem ECMWF Modell).
Erarbeiten des statistischen Modells
Es gibt eine grosse Anzahl von Regressionen, die Arbeitsschritte sind jedoch bei allen Methoden, ausgehend vom Trainingsdatensatz, dieselben. Die Regression stellt die statistische Beziehung zwischen
den Beobachtungen (der „Wahrheit”) und den Prädiktoren (z.B. DMO) dar. Durch die Regressionsanalyse wird der statistische Zusammenhang gesucht, welcher durch ein Set von Regressionskoeffizienten
mathematisch beschrieben wird. Diese Regressionskoeffizienten bilden die Basis für die MOS Vorhersagen. Die meisten statistischen Modelle, die für solche Zwecke verwendet werden, basieren auf der
Annahme, dass die Beobachtungen (die „Wahrheit“) fehlerfrei sei, was nicht zutrifft. Im Gegensatz
zu vielen MOS Systemen verwendete Vannitsem (2009) ein Verfahren, welches ebenfalls Fehler der
Beobachtungen zulässt.
Anwenden: Erstellen der Vorhersagen
Zum Erstellen der MOS Vorhersagen muss die aktuelle Vorhersage des numerischen Modells (der DMO)
mit den Regressionskoeffizienten kombiniert werden. Dies liefert, ausgehend von der durch die Regression beschriebenen statistischen Beziehung, eine korrigierte MOS Vorhersage. Das Ziel ist dabei, die
Fehler des numerischen Modells zu korrigieren (z.B. Bias, lokale Besonderheiten, ...).
8
Stand der Forschung und Motivation
1.2.2 Perfect Prog Modell
Eine vor allem in den Anfängen verwendete Methode ist die sogenannte Perfect Prog (PP) Methode. Die zugrunde liegende Annahme dabei ist, dass die Modellvorhersagen selbst „perfekt“ (fehlerfrei) sind. Dadurch kann die Regression auf den Beobachtungen alleine aufgebaut werden. Zur Veranschaulichung sei dies anhand einer linearen Regression gezeigt. Der Trainingsdatensatz x = (x i j |i =
1, ..., N , j = 1, ..., K) T besteht aus allen vergangenen Beobachtungen, wobei der Index i = (1, ..., N )
die Anzahl der Fälle/Tage repräsentiert, der Index j = (0, 1, ..., K) die verschiedenen Prädiktoren (verschiedene Beobachtungen). x i0 = 1 ist zusätzlich notwendig, um die Konstante in der Regression zu
bestimmen. Zusammen mit den Beobachtungen der vorherzusagenden Grösse y = ( yi |i = 1, ..., N ) T
lassen sich alle Regressionskoeffizienten schätzen:
β = (x T x)−1 x T y
(1.1)
Geht man nun wieder von der Annahme aus, die besagt, dass die Modellvorhersagen fehlerfrei sind,
so lässt sich die PP Vorhersage mit den Modellvorhersagen errechnen. p = (p j | j = 0, 1, ..., K) T sei
dabei der Vektor mit den Modellvorhersagen, K ist die Zahl der Prädiktoren. Speziell ist zu beachten,
dass p0 = 1 notwendig ist, damit die Regressionskonstante berücksichtigt wird. Damit lässt sich die
Vorhersage ŷi ausdrücken als:
ŷi = p T β = β0 + p1 β1 + ... + pK βK
(1.2)
Man beachte, dass die Regressionskoeffizienten lediglich auf den Beobachtungen aufbauen, in der
Vorhersage jedoch auf die Prädiktoren aus dem Modell angewendet werden. Dies ist nur durch die am
Anfang getroffene Annahme möglich.
Vorteile dieser Methode
Aufgrund der Tatsache, dass der Trainingsdatensatz x lediglich aus den Beobachtungen besteht, können
alle Messungen seit dem Bestehen einer bestimmten Wetterstation verwendet werden. Dies bedeutet,
dass der Trainingsdatensatz sehr umfangreich sein kann, wodurch:
- die Regressionsgleichung sehr stabil wird
- der Trainingsdatensatz auch seltene Ereignisse berücksichtigt, sofern diese in der Vergangenheit
an der Station registriert wurden
Nachteile dieser Methode
Da der Trainingsdatensatz lediglich aus Beobachtungen besteht, sind die unabhängigen Grössen (Prädiktoren) auf jene Grössen beschränkt, welche gemessen werden. Ebenfalls ist es nicht notwendig, die
vom numerischen Modell gelieferten Grössen über die PP Methode vorherzusagen, da das numerische
Modell bereits „fehlerfreie“ Vorhersagen liefert. PP wurde entwickelt, um Grössen vorherzusagen, welche gemessen/beobachtet werden, jedoch nicht im DMO des numerischen Modells vorhanden sind.
Aufgrund der grossen Anzahl an Variablen, welche von den heutigen Modellen zur Verfügung gestellt
werden, hat die PP Methode im Gegensatz zu den 1970/1980-er Jahren stark an Nutzen verloren.
Das elementarste Problem ist jedoch, dass die Modellvorhersagen nicht perfekt sind. Die Modelle haben
- je nach Region - starke Fehler, welche durch die PP Methode nicht eliminiert werden können.
9
1.2 Statistische Postprozessierung
Verwendung von Perfect Prog Methoden
Durch die erwähnten Nachteile ist die PP Methode heute nicht mehr stark verbreitet. Es gibt jedoch
Ideen, die PP Vorhersagen ebenfalls als Prädiktoren in andere statistische Postprozessierungsmethoden
einzubinden (Vislocky and Young 1989).
1.2.3 Model output Statistics-Systeme
Eine zweite Methode der Postprozessierung sind die sogenannten Model Output Statistics (MOS) Systeme. Als Vorreiter dieser Technik gelten Klein, Lewis, and Enger (1959) sowie Glahn and Lowry (1972).
Grundsätzlich funktioniert die Methode ähnlich wie die PP Methode, jedoch basiert der Trainingsdatensatz nun nicht mehr rein auf den Beobachtungen, sondern auf der numerischen Modellvorhersagen
(dem direkte Modelloutput des numerischen Modells (DMO)) und den Beobachtungen der vorherzusagenden Grösse. Bei einer MOS Methode wird nicht mehr angenommen, dass die Modellfehler des
DMO gleich Null sind, weshalb die statistische Beziehung zwischen dem DMO und den Beobachtungen
erstellt werden muss.
Nehmen wir wieder das lineare Modell als Beispiel (s. Formel 1.1), so ergibt sich folgende Form zur
Berechnung der Regressionskoeffizienten:
β = (x T x)−1 x T y
(1.3)
Wie man erkennen kann, ist diese Form identisch mit jener aus dem Perfect Prog (PP) Modell. Der
Unterschied liegt lediglich im Aufbau des Trainingsdatensatzes. Dabei ist x = (x i j | i = 1, ..., N , j =
0, 1, ..., K) T , wobei x i0 = 1 ist und x i j | i = 1, ..., N , j = 0, 1, ..., K die Vorhersagen aus dem DMO
(Prädiktoren), x i0 = 1 ist wiederum zur Bestimmung der Konstante der Regression notwendig.
yi | i = 1, ..., N sind die Beobachtungen der vorherzusagenden Grösse (Prädiktant). β enthält nun
also die Koeffizienten, welche die statistische Beziehung zwischen dem DMO und den Beobachtungen darstellen. Oder anders ausgedrückt: die statistische Beziehung zwischen dem Modell und der
Wahrheit. Die Formel für die Vorhersage ist ebenfalls identisch mit der PP Methode (s. Formel 1.2):
ŷi = p T β = β0 + β1 p1 + ... + βK pK
(1.4)
Dabei ist p = (p j | j = 0, 1, ..., K) T wieder die aktuelle Modellvorhersage, wobei p0 = 1 und K die
Anzahl der Prädiktoren.
Vorteile dieser Methode
Zusätzlich zu den lokalen Phänomenen, welche bereits im PP Modell korrigiert werden, korrigiert die
MOS Methode nun auch systematische Modellfehler. MOS Vorhersagen sind deshalb im Normalfall
Bias-frei (s. Abschnitt 2.7.2), das heisst, dass der Mittelwert der Beobachtungen identisch mit dem
Mittelwert der MOS Vorhersagen ist. Der Mittelwert des DMO für eine bestimmte Grösse kann ebenfalls
identisch sein, weicht aber oft stark vom Mittelwert der Beobachtungen ab und wird nun durch das
Postprozessing korrigiert.
Nachteile dieser Methode
Der Trainingsdatensatz besteht nun nicht mehr alleine aus Beobachtungen, sondern jeweils aus einem
Paar „Modell/Beobachtung”. Es müssen also jeweils die Modellvorhersagen (DMO) sowie die Beobach-
10
Stand der Forschung und Motivation
tungen vorhanden sein, um diese Fälle in den Trainingsdatensatz speichern zu können. Dies führt zu
einer Reihe neuer Probleme, da die Modelle ständig weiterentwickelt und verbessert werden.
Problem: Update der numerischen Modelle
Wie bereits beschrieben, wird durch die Regression ein statistischer Zusammenhang zwischen dem
DMO und den Beobachtungen gesucht. Verändert sich die Charakteristik des DMO, so passt die durch
die Regression errechnete Beziehung nicht mehr.
Basierend auf neuen wissenschaftlichen Erkentnissen, genaueren Parametrisierungen, neuen Daten
über die Oberflächenbeschaffenheit der Erde, leistungsstärkeren Computersystemen und so weiter
werden die numerischen Modelle laufend angepasst. Die Änderungen können sehr klein sein, also
beispielsweise lediglich eine leichte Adjustierung eines Konvektionsschemas, aber auch gravierend,
indem die Anzahl der Gitterpunkte verdoppelt wird oder neue Vertikalniveaus in die Berechnungen
einfliessen.
Kleine Anpassungen modifizieren die Fehlercharakteristik meist nur minimal, grosse Änderungen wie
eine Verdoppelung der Gitterpunktanzahl kann jedoch zu einer starken Anpassung der Fehlercharakteristik führen. Um dieses Problem zu lösen, entwickelten Wilson and Vallée (2002) ein “updateable“
Schema, welchem das Kapitel 1.3 gewidmet ist.
11
1.3 updateable-Konzept
1.3
updateable-Konzept
Eine durch ein Update des numerischen Modells ausgelösste Anpassung der Fehlercharakteristik kann
zu einer Verschlechterung der Model Output Statistics (MOS) Performance führen, wie dies bereits Abschnitt 1.2.3 genauer erklärt wurde. Viele Systeme ignorieren diese Modellumstellungen und speichern
alle Daten der verschiedenen Versionen der numerischen Modelle in ein und denselben Trainingsdatensatz. Der Vorteil dabei ist ein rasch anwachsender Trainingsdatensatz sowie ein geringer Wartungsaufwand. Der grosse Nachteil ist jedoch, dass die MOS Gleichungen auf einem Datensatz verschiedenster
Fehlercharakteristika basieren, was die Genauigkeit der MOS Vorhersagen beeinträchtigt. εal t sei der
Fehler einer Regression, welche lediglich auf auf dem Trainingsdatensatz einer „alten“ Modellversion
basiert. Wird im Regressionsmodell als Schätzer die Methode der kleinsten Quadrate verwendet, so ist
der Erwartungswert des Fehlers gleich 0 (Satz v. Gauss-Markow). Dasselbe gilt für den Fehler εneu eines
Regressionsmodelles, welches ausschliesslich auf dem Trainingsdatensatz der aktuellen oder „neuen“
Modellversion basiert.
E(εal t ) = 0 = E(εneu )
(1.5)
Ignorieren wir jedoch die Änderung der Fehlercharakteristik und erstellen ein Regressionsmodell, welches alle bisherigen Trainingsdatensätze berücksichtigt, ergibt sich für den Erwartungswert des Fehlers:
E(εal t + εneu ) 6= 0
(1.6)
Ein praktikabler Ansatz um dieses Problem zu umgehen, ist, dass für die verschiedenen Modellversionen verschiedene Trainingsdatensätze angelegt werden. Solange die Anzahl der Fälle im aktuellen
Trainingsdatensatz noch unter einem gewissen Limit liegt, basieren die Vorhersagen auf den Gleichungen aus dem alten Trainingsdatensatz. Der Grund dafür ist, dass eine Regression bei einer zu geringen
Anzahl an Fällen im Trainingsdatensatz keine stabilen Koeffizienten liefern kann, was die Qualität der
MOS Vorhersagen stark beeinträchtigt. Sobald der aktuelle Trainingsdatensatz genügend Fälle beinhaltet, werden neue Gleichungen auf dem neuen Trainingsdatensatz berechnet und zur Vorhersage
genutzt. Das Problem dabei: bis die für stabile Regressionskoeffizienten notwendigen 300 − 350 Fälle vorhanden sind (Carter 1986), müssen bei zwei Saisonen (s. Abschnitt 2.5) rund 2 Jahre Daten
gesammelt werden. Bis zu diesem Zeitpunkt werden die MOS Vorhersagen mit den alten Regressionsgleichungen berechnet, jedoch bereits mit dem aktuellen direkten Modelloutput des numerischen
Modells (DMO). Die Fehlercharakteristik des DMO ist somit eine andere wie jene, welche durch die
Regressionsanalyse beschrieben wird, was zu starken Einbussen der Qualität der MOS Vorhersagen
führen kann.
Diesem Problem widmeten sich Wilson and Vallée (2002, 2003) und entwickelten ein neues Verfahren.
Das Resultat aus dieser Arbeit ist das „Canadian updateable model output statistics system“, kurz UMOS. Wie viele gängige MOS Systeme basiert das Canadian Updateable Model Output Statistics (UMOS)
im Kern auf linearen Regressionsmodellen, besitzt jedoch ein Update-Schema, welches die wechselnde Fehlercharakteristik der dynamischen Modelle berücksichtigt und sich selbstständig an die neue
Fehlercharakteristik anpasst.
12
Stand der Forschung und Motivation
1.3.1 Die Idee / das Verfahren
(a) Nur Modellversion 1
(b) Zwei Modellversionen
(c) Nur Modellversion 2
SSCP1
SSCP2
SSCP1
SSCP2
SSCP1
SSCP2
MV 1
N=531
MV 2
N=0
MV 1
N=531
MV 2
N=132
MV 1
N=531
MV 2
N=368
Trainingsdatensatz
70%
30%
Trainingsdatensatz
Trainingsdatensatz
Abbildung 1.3: Konzeptioneller Ablauf des updateable-Ansatzes. Achtung: alle Werte sind lediglich exemplarisch!
Die verschiedenen Charakteristika der numerischen Modelle werden in eigene Trainingsdatensätze
(SSCPs) gespeichert. Solange es lediglich eine Modellversion gibt, wird die SSCP1 als Trainingsdatensatz herangezogen. Nach der Umstellung auf eine neue Version (im Beispiel Modellversion 2) wird
eine neue SSCP angelegt. Solange die neue SSCP noch nicht genügend Fälle beinhaltet, die Anzahl der
Fälle N also kleiner einem definierten Schwellwert ist (in der Praxis ca. 300 − 350 Fälle, Carter (1986)
), so wird die aktuelle SSCP mit der Vorgängerversion über ein Gewichtungsschema zum schlussendlichen Trainingsdatensatz kombiniert. Dieser wird von den den Regressionsmodellen verwendet, um die
Gleichungen zu erstellen, aus welchen die MOS Vorhersagen gewonnen werden.
Da täglich neue Fälle hinzukommen, wächst N in der aktuellen SSCP (in diesem Fall der
Trainingsdatensatz (SSCP)2) stetig an. Wird der Schwellwert für die Anzahl der Fälle in der aktuellen SSCP erreicht, so ist der Umfang der Daten in der aktuellen SSCP genügend gross, um stabile
Regressionsgleichungen aus der neuen Modellversion zu erstellen. Die vorherige Modellversion wird
nun nicht mehr benötigt und aus dem System eliminiert. Das Schema selbst ist in Abschnitt 2.6.2 genau
erklärt.
1.3.2 Nutzen
Durch das „upateable“ Schema kann also das A-UMOS „laufend“ an die sich verändernde statistische
Charakteristik des DMO angepasst werden. Die Vorteile des Verfahrens liegen auf der Hand:
• vollautomatisches Verfahren, dadurch starke Kostenreduktion (Entwicklungs- und Wartungskosten)
• kein Vermischen der unterschiedlichen Fehlercharakteristika
• rasche Berücksichtigung der neuen Charakteristik
• vollständiger Übergang auf den aktuellen Trainingsdatensatz, sobald im neuen Trainingsdatensatz genügend Fälle vorhanden sind, um eigenständige stabile Gleichungen zu erhalten
• bewahren der statistischen Stabilität während der Umstellung auf eine neue MOS Modellversion
Da der Umfang der im Trainingsdatensatz gespeicherten historischen Daten für stabile MOS Vorhersagen bei > 300 Fällen liegen muss, die Modelländerungen aber häufiger erfolgen, enthalten auch
die Trainingsdaten im „updateable“ System eine Mischung aus verschiedenen Modellversionen. Einen
anderen Zugang für dasselbe Problem wählten Hamill, Whitaker, and Mullen (2006). Auf einer nicht
mehr ganz aktuellen Version des Global Forecast System (GFS), dem numerischen Modell am National
Center for Environmental Prediction (NCEP), wurde ein 30 Jahre langer Vorhersagedatensatz erstellt.
1.3 updateable-Konzept
13
Da diese 30 Jahre zum Zeitpunkt der Erstellung bereits in der Vergangenheit lagen, spricht man in
diesem Fall von Reforecasts („retrospective forecasts“). Das GFS Modell stammt aus dem Jahre 1998
und besitzt den Versionsnamen T 62 mit einer Horizontalauflösung von rund 200km. Der ursprüngliche Reforecast-Datensatz deckte die Jahre 1979 − 2009 ab, wird seitdem jedoch operationell täglich
erweitert. Der grosse Nutzen resultiert daraus, dass zu den täglichen Vorhersagen ein mittlerweile über
32 Jahre langer Trainingsdatensatz mit ein und derselben Modellversion besteht. Die Kombination des
Trainingsdatensatzes mit den Vorhersagen des aktuellen Tages bietet eine umfangreiche Ausgangslage
für MOS Systeme und andere Methoden (z.B. Analogsysteme, neuronale Netzwerke, Boosting, ...). Die
Auflösung und Qualität des verwendeten numerischen Modells ist ohne Zweifel geringer als diejenige
der aktuellen Modelle (GFS, ECMWF, ...), jedoch liefert keines der aktuellen Modelle einen historischen Trainingsdatensatz mit vergleichbarem Umfang.
Ein „Reforecast“-MOS benötigt also kein „updateable“ Schema, da ein Modellwechsel ausgeschlossen
ist. Dadurch kann die Vorhersagegüte eines Reforecast basierten MOS Systems stark verbessert werden (Hamill et al. 2006). Vor allem für Klassifikationsalgorithmen für seltene Ereignisse ist dieser
Reforecast-Datensatz sehr hilfreich. Das A-UMOS basiert jedoch gemäss den Projektanforderungen auf
dem aktuellen Modell des ECMWF, ein Reforecast MOS mit dem erwähnten GFS Datensatz liegt im
Moment zur Verifikation leider nicht vor.
14
Stand der Forschung und Motivation
Kapitel 2
Das Austrian Updateable Model
Output Statistics System
In diesem Kapitel wird das Austrian Updateable Model Output Statistics (A-UMOS) System ausführlich behandelt. Das A-UMOS ist eine Adaption des UMOS Systemdesigns und wurde am Institut für
Meteorologie und Geophysik der Universität Innsbruck (IMGI) für die Zentralanstalt für Meteorologie
und Geodynamik (ZAMG) entwickelt. Dabei wurden die grundlegenden Ideen von Wilson and Vallée
(2002) übernommen und an die Anforderungen der ZAMG angepasst. Die folgenden Abschnitte zeigen
einige der wichtigsten Komponenten und Verfahren des A-UMOS. Aufgrund des immensen Umfangs
(mehr als 30′ 000 Zeilen Code, zusätzlich mehr als 15′ 000 Zeilen Kommentare, dazu unzählige Steuerfiles, ...) kann das System natürlich nicht bis ins Detail erklärt werden.
Softwaredesign des A-UMOS
2.1
Beobachtungen aus der
ZAMG Datenbank
B
Update der SSCPs
täglich mit 6d Verzögerung
(benötigt alle Beobachtungen bis +144h )
Beobachtungen
Interpolierter DMO
für Vorhersage + SSCPs
SSCP
D
ECMWF
Erstellen der MLR und
LMDA Resultate
Legende
B
D
R
V
Beobachtungen
Daten aus dem DMO
Resultate MLR/MDA
A-UMOS Vorhersagen
Täglicher Prozess
Wöchentlicher Prozess
Vorhersage aller MOS
Grössen (MLR & LMDA)
R
v
Abbildung 2.1: Konzeptioneller Aufbau des Austrian Updateable Model Output Statistics (A-UMOS) Systems
15
16
Das Austrian Updateable Model Output Statistics System
Wie bereits in Kapitel 1.3 erläutert wurde, handelt es sich bei einem MOS um eine Postprozessierung
des direkten Modelloutputs (DMO) eines numerischen Wettervorhersagemodells. Um diese Verfahren
anzuwenden, benötigen wir zwei grundlegende Informationen
1. Beobachtungen der Wetterstationen, an welchen die MOS Vorhersagen erstellt werden sollen
2. den DMO eines numerischen Modells, welcher alle gewünschten Wetterstations-Standorte überspannt
Das A-UMOS nutzt dazu die Beobachtungen aus den ZAMG Datenbanken sowie den DMO des ECMWF
Modells (European Centre for Medium-Range Weather Forecasts). Beide Informationen müssen jeweils
paarweise in den Trainingsdatensatz eingespielt werden, welcher hier durch die SSCP dargestellt ist.
Da das paarweise Vorhandensein zwingend notwendig ist, kann der aktuelle DMO nicht direkt in den
Trainingsdatensatz einfliessen, da die passenden Beobachtungen noch nicht vorhanden sind. Aufgrund
der maximalen Vorhersagezeit im A-UMOS von +6 Tagen werden die Datenpaare mit einem Zeitversatz
von 6 Tagen in die SSCPs gespielt.
Einmal pro Woche werden aus den aktuellen Trainingsdaten die Gleichungen für die verschiedenen
Vorhersagegrössen gerechnet. Ein tägliches Update der Gleichungen ist nicht sinnvoll, da nur wenige
neue Fälle im Trainingsdatensatz (max. 7 pro Woche) kaum Einfluss auf die Gleichungen haben.
Mit den so erstellten Gleichungen und dem aktuellen DMO des ECMWF lassen sich nun die Vorhersagen erzeugen. Dazu müssen die Prädiktoren aus dem DMO in die Gleichungen eingesetzt werden.
Die rohen Vorhersagen aus den Gleichungen durchlaufen im A-UMOS noch einige weitere Prozeduren
(Konsistenzprüfung, Grenzwertüberprüfung, s. Abschnitt 2.4), bevor die endgültige Ausgabedatei erstellt wird, welche in die Vorhersagedatenbank einfliesst. Diese Datenbank wird von den Synoptikern
im alltäglichen Betrieb verwendet.
2.2
Umfang der Vorhersagen
Das A-UMOS rechnet täglich rund 2,8 Millionen Vorhersagewerte. Diese Zahl setzt sich aus der Anzahl
der Stationen, der Vorhersagezeitschritte, Modelläufe und Vorhersagegrössen zusammen. Nachstehend
wird aufgeführt, welche Vorhersagen im A-UMOS berechnet werden und welchen räumliche und zeitlichen Bereich sie abdecken.
2.2.1 Prädiktanten (Vorhersagegrössen)
Das System umfasst insgesamt 22 Prädiktanten, wobei 16 davon deterministische Grössen sind und die
restlichen 6 probabilistische Grössen. Die deterministischen Prädiktanten werden mittels einer multiple lineare Regression (MLR) (s. Abschnitt 2.3.1) berechnet und liefern quantitative Werte (z.B. 5.8◦
Celsius; Windgeschwindigkeit 4.2ms−1 ). Im Gegensatz dazu liefern die 6 probabilistischen Grössen
Wahrscheinlichkeitswerte zwischen 0% und 100%. Die zugrundeliegende Methode ist eine multiple
Diskriminantenanalyse (MDA) (s. Abschnitt 2.3.2) und die Prädiktanten sind teilweise in mehrere
Sub-Klassen aufgeteilt. Während die Wahrscheinlichkeit für Gewitter (wgew) lediglich eine binäre Entscheidung darstellt (Nein/Ja), so werden bei der Niederschlagsvorhersage die Wahrscheinlichkeiten
für mehrere Schwellwerte vorhergesagt (Niederschlagsmenge > 1.0mm, > 2.0mm, ..., > 20mm). Tabelle 2.1 zeigt die vollständige Liste aller Vorhersagegrössen.
17
2.2 Umfang der Vorhersagen
Kurz-
Name
Einheit
Typ
name
Stat-
Klassen
Typ
ff10
10m Windgeschwindigkeit
1/10 m s−1
MLR
ffx
10m Windböe
1/10 m s−1
MLR
S+T
pre
Niederschlagsmenge
1/10 mm
MLR
S+T
rh
Relative Feuchte
%
MLR
S+T
◦
S+T
spot
2m Temperatur
1/10 C
MLR
S+T
ssd
Sonnenscheindauer
1/10 h
MLR
S+T
td
2m Taupunktstemperatur
1/10 ◦ C
MLR
S+T
◦
tmax
Maximimtemperatur
1/10 C
MLR
S+T
tmin
Minimumtemperatur
1/10 ◦ C
MLR
S+T
u10
10m u-Wind Komponente
1/10 m s−1
MLR
S+T
v10
10m v-Wind Komponente
−1
MLR
S+T
glo
Globalstrahlung
W m−2
MLR
T
t5cm
5cm Temperatur
1/10 ◦ C
MLR
T
mclo
Bedeckungsgrad mittelhohe und tiefe Wolken
[0/8 − 8/8]
MLR
S
tclo
Bedeckungsgrad gesamt
[0/8 − 8/8]
MLR
S
siw
Sichtweite
1/10 km
MLR
S
wconv
Wahrscheinlichkeit für ausgedehnte Konvektion
% für Klassen
LMDA
S
2
wfesns
Wahrscheinlichkeit für festen Niederschlag
% für Klassen
LMDA
S
2
wgew
Wahrscheinlichkeit für Gewitter
% für Klassen
LMDA
S
2
aktww
Aktuelles Wetter
% für Klassen
LMDA
S
10
pop
wsp
1/10 m s
aktww1, Gesamtbedeckung 0 − 4/8
(#1)
aktww2, Gesamtbedeckung zeitweise ≤ 4/8, zeitweise > 4/8
(#2)
aktww3, Gesamtbedeckung 5 − 8/8
(#3)
aktww4, Staubsturm, Sandsturm oder Schneetreiben
(#4)
aktww5, Nebel oder starker Dunst
(#5)
aktww6, Sprühregen
(#6)
aktww7, Regen
(#7)
aktww8, Schnee oder Schneeregen
(#8)
aktww9, Schauer
(#9)
aktww10, Gewitter
(#10)
Wahrscheinlichkeit für Niederschlagsklassen
% für Klassen
LMDA
S+T
6
pop0, Niederschlag < 0.1 mm
(#0)
pop1, Niederschlag ≥ 0.1 mm
(#1)
pop2, Niederschlag ≥ 1.0 mm
(#2)
pop3, Niederschlag ≥ 5.0 mm
(#3)
pop4, Niederschlag ≥ 10.0 mm
(#4)
pop5, Niederschlag ≥ 20.0 mm
(#5)
Windgeschwindigkeit
% für Klassen
LMDA
S+T
4
wsp0, Windböen < 60 km h−1
(#0)
wsp1, Windböen ≥ 60 km h−1
(#1)
−1
wsp2, Windböen ≥ 80 km h
(#2)
wsp3, Windböen ≥ 100 km h−1
(#2)
Tabelle 2.1: Liste aller im A-UMOS enthaltenen Prädiktanten. Typ: gibt an, mit welcher Methode der Prädiktant
gerechnet wird; Stat-Typ: zugrunde liegende Stationsliste (S=Synop, T=Tawes); die drei LMDA Prädiktanten
wconv, wfesns, wgew werden jeweils in zwei Klassen vorhergesagt, wobei die Klasse 0 jeweils „Ereignis Nein“ und
die Klasse 1 „Ereignis Ja“ repräsentiert.
18
Das Austrian Updateable Model Output Statistics System
2.2.2 Stationen
Breitengrad
TAWES Stationen
SYNOP Stationen
Gesamte Stationsabdeckung
56 o
N
56 o
N
48 o
N
48 o
N
40 oN
40 oN
32 oN
32 oN
49oN
48oN
47oN
46oN
0o
o
15 E
o
30 E
Längengrad
0o
o
15 E
Längengrad
o
30 E
10oE
12oE
o
14 E
o
16 E
o
18 E
Längengrad
Abbildung 2.2: Graphische Übersicht der im A-UMOS verwendeten Stationen. Links: Gesamte Stationsliste mit
1041 Stationen; Mitte: SYNOP Stationen; Rechts: TAWES Stationen. Diese teilautomatischen Wetterstationen
(TAWES) der ZAMG stehen verteilt über ganz Österreich.
Insgesamt werden im A-UMOS aktuell 1041 Stationen verarbeitet, wobei sich diese Zahl durch das
Hinzufügen von neuen Stationen beziehungsweise durch das Entfernen von Stationen verändern kann.
Diese 1041 Stationen sind in drei Gruppen eingeteilt. So gibt es 85 reine „TAWES“-Statioinen (teilautomatische Wetterstation der ZAMG), 630 reine „Synop“-Stationen (manuelle Beobachtungen) sowie
163 kombinierte Stationen. Kombinierte Stationen bestehen aus einer TAWES-Station, jedoch werden
zusätzlich noch die manuellen Wetterbeobachtungen (SYNOP’s) durchgeführt. In diesen Fällen sind die
Beobachtungen doppelt vorhanden - es können also Vorhersagen für beide Typen berechnet werden.
Der Unterschied liegt lediglich darin, dass die SYNOP-Beobachtungen jeweils Mittelwerte über die vergangene Stunde melden, während die TAWES-Meldungen 10min Mittel sind. Das A-UMOS behandelt
beide Typen als zwei unterschiedliche Stationen, wobei diese am Ende - sofern beide Vorhersagewerte
vorhanden sind - gemittelt werden. Am Ende wird lediglich ein Vorhersagewert pro Prädiktant pro Station für einen Vorhersagezeitschritt gespeichert. Dies ergibt eine am Ende Vorhersagen für insgesamt
878 unterschiedliche Standorte.
2.2.3 Vorhersagezeitschritte
Aus technischer Sicht könnten die MOS Vorhersagen bis zum Ende der ECMWF Vorhersagen gerechnet
werden, welche aktuell bis maximal +15d vorhanden sind. Die Vorhersagegenauigkeit und die Vorhersagegüte der numerischen Modelle nehmen bei Langzeitprognosen (> 6 − 7d) deutlich ab. Für diese
Zeitskalen werden Ensembleprognosen/EnsembleMOS verwendet, um probabilistische Vorhersagen zu
erstellen.
Da das A-UMOS eine Unterstützung der operationellen Wettervorhersage ist und für automatisierte
Produkte verwendet wird, beschränkt man sich auf den praxisorientierten Zeitrahmen von +0h bis
+144h (+6d). Bis auf einige Ausnahmen (siehe Tabelle 2.2) werden alle Prädiktanten zuerst 3-stündig
gerechnet, ab einer Vorhersagezeit von +72h bis +144h dann jeweils 6-stündig. Ausnahmen dieser Regel sind die Niederschlagsgrössen (pre, pop), welche durchgehend 6-stündig gerechnet werden, sowie
die 2m Minimum- und Maximumtemperatur, welche jeweils 12-stündig für 06U T C beziehungsweise 18U T C vorhergesagt werden. Diese Intervalle sind bedingt durch die Beobachtungszeiten an den
SYNOP-Wetterstationen.
19
2.3 Verwendete statistische Modelle
Prädiktant
Kurz-
A
∆1
B
∆2
C
name
Aktuelles Wetter
aktww
3
3
72
6
144
10m Windgeschwindigkeit
ff10
3
3
72
6
144
10m Windböe
ffx
3
3
72
6
144
Globalstrahlung
glo
3
3
72
6
144
Bedeckungsgrad mittelhohe und tiefe Wolken
mclo
3
3
72
6
144
Wahrscheinlichkeit für Niederschlagsklassen
pop
6
6
144
Niederschlagsmenge
pre
6
6
144
Relative Feuchte
rh
3
3
72
6
144
Sichtweite
siw
3
3
72
6
144
2m Temperatur
spot
3
3
72
6
144
Sonnenscheindauer
ssd
3
3
72
6
144
5cm Temperatur
t5cm
3
3
72
6
144
Bedeckungsgrad gesamt
tclo
3
3
72
6
144
2m Taupunktstemperatur
td
3
3
72
6
144
Maximimtemperatur
tmax
6
12
144
Minimumtemperatur
tmin
6
12
144
10m u-Wind Komponente
u10
3
3
72
6
144
10m v-Wind Komponente
v10
3
3
72
6
144
Wahrscheinlichkeit für Konvektion
wconv
3
3
72
6
144
Wahrscheinlichkeit für festen Niederschlag
wfesns
3
3
72
6
144
Wahrscheinlichkeit für Gewitter
wgew
3
3
72
6
144
Windgeschwindigkeit
wsp
3
3
72
6
144
Tabelle 2.2: Übersicht der Vorhersagezeitschritt (VSZ) der einzelnen Prädiktanten. A: erster VSZ; ∆1 : Zeitschrittintervall bis B, ∆2 : Zeitschrittintervall bis C; C: letzter VSZ; in blau-kursiv: „spezielle“ VSZ-Intervalle.
2.3
Verwendete statistische Modelle
Das A-UMOS besteht aus zwei Hauptroutinen, welche einerseits die multiple lineare Regression (MLR)
Vorhersagen (s. Abschnitt 2.3.1) für alle kontinuierlichen Prädiktanten liefert, andererseits wird die
lineare multiple Diskriminantenanalyse (LMDA) (2.3.2) zur Wahrscheinlichkeitsvorhersage verschiedener Prädiktanten verwendet.
Beide Verfahren basieren auf den in den SSCPs gespeicherten (reduzierten) Trainingsdatensätzen (s.
Abschnitt 2.6.1). Einmal pro Woche wird die Ausgangslage für die täglichen Vorhersagen erstellt. Während man bei der MLR tatsächlich von „Gleichungen“ sprechen kann, besteht diese Ausgangslage bei
der LMDA aus verschiedenen Vektoren und Skalaren, die zur Erzeugung der Vorhersagen genutzt werden.
20
Das Austrian Updateable Model Output Statistics System
2.3.1 multiple lineare Regression für deterministische Grössen
Schematischer Ablauf
β
β
Beobachtungen
i1*xi1
(c) Vorhersage
Prädiktor aus dem DMO
(b) Regression
Prädiktor aus dem DMO
Prädiktor aus dem DMO
(a) Trainingsdatensatz
pi
i0
yi ε
Beobachtungen
i
yi
Prädiktant (MOSVorhersage)
Abbildung 2.3: Konzept einer linearen Regression, lediglich 2-Dimensional. (a) zeigt die Daten im Trainingsdatensatz, welche die Basis für die Regression (b) sind. Die Regression führt zusammen mit dem DMO zur MOS
Vorhersage (c).
Alle deterministischen Grössen im A-UMOS werden mittels einer multiplen linearen Regression berechnet. Das Beispiel zeigt eine lineare Regression (lediglich in zwei Dimensionen). Dabei wird der
statistische Zusammenhang zwischen einer unabhängigen Grösse (dem sogenannten Prädiktor aus
dem DMO) und einer abhängigen Grösse (der Beobachtung) gesucht. Das Funktionsprinzip bei mehreren Dimensionen ist dasselbe, lässt sich aber spätestens ab der vierten Dimension nicht mehr darstellen.
Basierend auf der erstellten Regression lässt sich nun mit dem aktuellen DMO (aktuelle Vorhersage des
numerischen Modells) der Prädiktant (Vorhersage des A-UMOS) erstellen.
Übersicht multiple lineare Regression
Mathematisch lässt sich die multiple lineare Regression (MLR) folgendermassen beschreiben (Kapitel
6 Wilks 2006, P. 179-254), (Kapitel 3 Hastie et al. 2003, P. 43-100):
yi = p T β = β0 + p1 β1 + p2 β2 + ... + pK βK + εi
(2.1)
yi = ŷi + εi
(2.2)
Der Index i = I entspricht der aktuellen Vorhersage. p = (p j | j = 0, 1, ..., K) T sind dabei die Prädiktoren des DMO, wobei p0 = 1 zur korrekten Berechnung der Regressionskonstante sei. β = (β j | j =
0, 1, ..., K) T entsprechen den einzelnen Koeffizienten der Gleichung, β0 bezieht sich im Speziellen auf
die Regressionskonstante. K ist die Anzahl der Prädiktoren, welche in der Gleichung verwendet werden. ŷi ist die Vorhersage des A-UMOS, welche sich aus dem „wahren“ Wert yi (Beobachtung) und
einem Fehlerterm εi zusammensetzt. Durch die Methode der kleinsten quadratischen Fehlerprodukte
wird mittels der MLR versucht, durch einen Mittelwertschätzer den Fehler εi zu minimieren. Durch
den kleinsten Quadrateschätzer (OLS) ergibt sich, zusammen mit dem Satz von Gauss-Markow, der
Erwartungswert für den Fehler E(ε) = 0.
Vom Trainingsdatensatz bis zu der Vorhersage sind einige Schritte notwendig, welche nun genauer
erläutert werden.
21
2.3 Verwendete statistische Modelle
Prädiktoren Prescreening
Als einer der ersten Schritte bei der Entwicklung des A-UMOS wurde ein Prescreening der Prädiktoren durchgeführt. Aus der Fülle denkbarer Prädiktoren wurden dem System anfangs potentiell 265
verschiedene Prädiktoren zur Verfügung gestellt. Für eine eingeschränkte Anzahl an Stationen und
Vorhersagezeitschritte wurden die Trainingsdatensätze mit allen 265 Prädiktoren erstellt. Anschliessend wurden - basierend auf dem vollumfänglichen Trainingsdatensatz - die MLR Gleichungen erstellt
(analoges gilt für die LMDA Prädiktanten). Dabei durchlief das A-UMOS den Selektionsvorgang für die
Prädiktoren. Die Anzahl und die Reihenfolge, mit welcher die Prädiktoren im Selektionsalgorithmus
gewählt wurden, führten zu einer objektiven Masszahl der wichtigsten Prädiktoren. Die so generierte
„Rangliste“ wurde anschliessend manuell überarbeitet, um die Anzahl der Prädiktoren auf ein Subset
von maximal 30 einzuschränken. Dieser manuelle Eingriff ist wichtig, da durch den automatischen
Selektionsprozess oft ähnliche Prädiktoren mit dem annähernd gleichen Informationsgehalt gewählt
werden (z.B. Temperaturen in 1000 hPa, 925 hPa, 850 hPa, ...). Durch diese redundante Wahl können bei der Eingrenzung auf maximal 30 Prädiktoren wichtige Prädiktoren aus dem Subset fallen,
wodurch das Subset nur noch eine Teilinformation beinhalten würde. Dies reduziert die SSCPs (s. Abschnitt 2.6.1) von (265 + 1) · 265 · 0.5 = 35′ 245 auf (30 + 1) · 30 = 465 Elemente. Das System mit
allen 265 Prädiktanten zu betreiben, wäre aus Sicht der benötigten Rechenleistung und des benötigten Speicherbedarfs nicht sinnvoll. Im Subset mit 30 Prädiktanten steckt der Hauptteil der durch den
Selektionsprozess verwendeten Information, die restliche Prädiktanten werden nicht mehr mitgeführt.
Selektion der Prädiktoren
Das A-UMOS stellt dem Selektrionsalgorithmus das Subset aus 30 verschiedene Prädiktoren zur Verfügung, aus welchen er nun wieder frei wählen kann. Mittels einer Vorwärtsselektion mit Rückwärtselimination werden in Schritt 1, basierend auf der Korrelation, die besten Prädiktoren ausgewählt.
Aufgrund der Form des Trainingsdatensatzes (s. Abschnitt 2.6.1) sind die Formeln für Varianz (VAR),
Kovarianz (COV) und Korrelation (COR) auf die Form für auflaufende Messwerte umzustellen:
VAR(zi ) =
N
1X
N
(zi − z̄)2 =
i=1
N
1X
N
N
1X
N
i=1
(zi2 ) − 2
i=1
(zi2 ) − 2z̄z̄
2
N
1X
N
N
1X
N
+ z̄ =
(zi2 − 2zi z̄ + z̄ 2 ) =
i=1
(zi )z̄ +
i=1
N
1X
N
N
1X
N
(z̄ 2 ) =
i=1
(zi2 ) − 2z̄ 2
(2.3)
2
+ z̄ =
i=1
N
1X
N
(zi2 ) − z̄ 2
i=1
In der Formel 2.3 steht z stellvertretend für y (Beobachtungen; wahrer Wert) beziehungsweise ŷ (Vorhersage; fehlerbehafteter Wert). z̄ ist jeweils der Mittelwert der verwendeten Grösse aller im Trainings-
22
Das Austrian Updateable Model Output Statistics System
datensatz gespeicherten Fälle.
1X
1X
( ŷi yi − ŷi ȳ − ¯ŷ yi + ¯ŷ ȳ) =
N
1X
1X
1X
1X
( ŷi yi ) −
( ŷi ) ȳ − ¯ŷ
( yi ) + ¯ŷ ȳ =
( ŷi yi ) − ¯ŷ ȳ − ¯ŷ ȳ + ¯ŷ ȳ =
N
N
N
N
1X
( ŷi yi ) − ¯ŷ ȳ
N
(2.4)
P
COV ( ŷ, y)
( ŷi yi ) − ¯ŷ ȳ
COR( ŷ, y) = p
= pP
p
pP
VAR( ŷ) · VAR( y)
( ŷi 2 ) − ¯ŷ 2 ·
( yi2 ) − ȳ 2
(2.5)
COV ( ŷ, y) =
N
( ŷi − ¯ŷ )( yi − ȳ) =
Alle Unbekannten auf der rechten Seite der Gleichung 2.5 sind im Trainingsdatensatz enthalten, wie
die Matrix in Gleichung 2.18 zeigt. Die Selektion arbeitet Schrittweise „vowrärts“ mit Rückwärtselimination. Als Selektionskriterium wird die Korrelation zwischen den Prädiktoren und den Beobachtungen
im Trainingsdatensatz genutzt.
1. Wahl des Prädiktors mit der höchsten Korrelation.
2. Wahl des zweiten Prädiktors mit der höchsten Korrelation des verbleibenden Prädiktorensets.
3. Überprüfung der zusätzlichen Verbesserung durch die zweite Selektion. Dabei muss die Verbesserung I = (1 − COR(1)) · COR(2) > s einem Schwellwert (s) sein. Ist diese Bedingung nicht
erfüllt, wird der zweite Prädiktor verworfen (eliminiert) und der Selektionsvorgang beendet.
4. Wahl des nächsten Prediktors mit der höchsten Korrelation des verbleibenden Prädiktorensets.
5. Erneute Überprufung gemäss dem Schema in (3). Sollte die Bedingung erfüllt sein, so wiederholen sich die beiden Punkte 4 und 5, bis der Schwellwert (s) unterschritten wird. Ist dies der
Fall, wird der letzte gewählte Prädiktor eliminiert und die Selektion beendet. Ebenfalls wird die
Selektion beendet, wenn die Anzahl der gewählten Prädiktoren eine maximal erlaubte Anzahl
(Kma x ) überschreitet.
Die im A-UMOS verwendeten Schwellwerte sind in der Tabelle 2.11 zusammengefasst. Die folgende
Tabelle zeigt die Häufigkeit in Promille, mit welcher eine gewisse Anzahl an Prädiktoren gewählt wurde. Die Werte gelten für beide Saisonen (kalt und warm), für alle Vorhersagezeitschritte sowie den 00Z
und den 12Z Modellauf. Die Auswertung gilt für den 19.10.2011. Gut zu erkennen ist, dass für einige
Prädiktanten lediglich 1 − 2 Prädiktoren vewendet werden, während andere (z.B. rh) eine höhere Zahl
von 5 − 9 Prädiktoren verwenden. Die Anzahl hängt davon ab, wie stark die einzelnen Prädiktoren mit
den Beobachtungen korrelieren. Beschreibt der Erste gewählte Prädiktor bereits die komplette Beziehung zwischen Prädiktoren und Beobachtungen, so sind - wenn überhaupt - nur noch wenige weiter
Prädiktoren notwendig.
23
2.3 Verwendete statistische Modelle
Prädiktant
ff10
ffx
glo
mclo
pre
rh
siw
spot
ssd
t5cm
tclo
td
tmax
tmin
u10
v10
1
2
3
4
5
6
7
8
9
10
26
30
251
6
3
0
3
135
50
9
2
60
80
16
65
57
146
146
346
93
11
5
39
362
209
104
68
221
251
115
264
284
282
272
226
295
36
43
142
262
375
241
345
309
233
216
316
317
269
264
99
332
79
114
246
148
258
265
376
236
213
263
195
197
167
168
49
189
135
188
262
64
85
197
161
112
139
212
100
92
73
79
16
65
170
208
180
21
16
102
38
42
59
113
40
35
25
29
7
15
206
220
91
4
2
57
6
14
16
48
13
11
6
7
1
2
139
106
24
0
0
14
0
2
3
8
3
2
1
2
0
0
216
112
7
0
0
7
0
1
1
4
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
Tabelle 2.3: Häufigkeit [%], mit welcher eine gewisse Anzahl an Prädiktoren (1 − 10) gewählt wurde. Die maximal erlaubte Anzahl Prädiktoren Kma x = 10, wodurch maximal 10 verschiedene Prädiktoren gewählt werden
können. Diese Auswertung gilt für den 19.10.2011. Datengrundlage: Gleichungssatz beider Saisonen, beider Modellstartzeiten und aller Vorhersagezeitschritte. Die Tabelle 2.1 enthällt die Beschreibung der hier abgebildeten
Prädiktanten.
Mathematischer Algorithmus
Nachdem die Prädiktoren ausgewählt sind, erfolgt die Berechnung der Koeffizienten β = (β j | j =
0, 1, ..., K). K stellt dabei wieder die Anzahl der gewählten Prädiktoren dar und darf Kma x = 10 nicht
übersteigen. Die Konstante β0 wird unabhängig von der Anzahl der Prädiktoren immer berechnet. Zur
Erinnerung die Formel der multiplen linearen Regression:
ŷi = βp T = β0 + β1 p1 + ... + βK pK + εi
(2.6)
ŷi ist dabei die MOS Vorhersage, die erst in einem späteren Schritt explizit berechnet wird. p j ist der
jeweilige dazugehörige Vektor, welcher die Prädiktoren für der aktuellen ECMWF Vorhersage enthält.
In diesem Schritt wichtig ist dabei nur β = (β j | j = 0, 1, ..., K). x stellt den Trainingsdatensatz dar,
welcher zusätzlich den Faktor für die Konstante (1) beinhaltet.
β = (x T x)−1 x T y
(2.7)
Im A-UMOS besitzt der Trainingsdatensatz eine spezielle Form (genannt SSCP, s. Abschnitt 2.6.1).
Die SSCP ist allgemein definiert als x T x. Die im A-UMOS verwendeten SSCPs beinhalten noch einige
Zusatzinformationen! Formel 2.8 ergibt sich unter der Berücksichtigung, dass die Matrix „SSCP“ die
A-UMOS Struktur besitzt zu:
β = (SSC Pl,l )−1 SSC Pl,L | l = 2, ..., L − 1
(2.8)
24
Das Austrian Updateable Model Output Statistics System
L ist dabei die Dimension der quadratischen Matrix SSCP, l der Element-Index. SSC Pl,l | l = 2, ..., L −1
beinhaltet dabei genau x T x, SSC Pl,L enthält x T y.
Resultat / Gleichungen
Die so berechneten Koeffizienten β inklusive der Selektionsinformation werden im A-UMOS nun zwischengespeichert, um sie für den Vorhersageprozess verwenden zu können. Aufgrund der nur langsam
anwachsenden Anzahl an Fällen im Trainingsdatensatz (N ) besteht keine Notwendigkeit, die Koeffizienten täglich neu zu berechnen. Dies geschieht deshalb lediglich einmal pro Woche.
Vorhersage der Prädiktanten: multiple lineare Regression
Durch Einsetzen der korrekten Prädiktoren p aus dem DMO sowie der berechneten Koeffizienten β in
die Gleichung 2.7 erhält man die Vorhersage für eine bestimmte Station zu einem definierten Vorhersagezeitpunkt. Um eine vollständige Vorhersage des A-UMOS zu erhalten, wird dieser Schritt für alle
möglichen Kombinationen aus Stationen, Prädiktanten und Vorhersagezeitschritte wiederholt.
25
2.3 Verwendete statistische Modelle
2.3.2 lineare multiple Diskriminantenanalyse für probabilistische Grössen
Schematischer Ablauf
(a) Trainingsdatensatz
(b) Diskriminantenanalyse
Klasse 2
Klasse 2
Prädiktor B
Prädiktor B
as
Prädiktor A
Klasse 2
se
ng
re
n
ze
Klasse 1
Prädiktor A
Prädiktor B
Kl
Klasse 1
(c) Vorhersage
Klasse 1
Prädiktor A
Abbildung 2.4: Konzept einer linearen Diskriminantenanalyse, lediglich 2-Dimensional. (a) zeigt den Trainingsdatensatz, wobei beide Klassen getrennt gespeichert sind. Durch die Diskriminantenanalyse erhält man die Klassengrenze (b), welche für die MOS-Vorhersage verwendet wird.
Die probabilistischen Grössen, also die Wahrscheinlichkeiten, werden mittels einer multiplen linearen
Diskriminantenanalyse vorhergesagt. Allgemein gesprochen handelt es sich um einen Klassifizierungsalgorithmus, welcher versucht, die Vorhersagen der numerischen Modelle basierend auf einer statistischen Beziehung zwischen den Prädiktoren und den Beobachtungen einer der Klassen zuzuordnen.
Die Vorhersage des A-UMOS gibt an, wie sicher das Eintreffen (oder nicht-Eintreffen) der gewünschten
Klasse ist.
Übersicht MDA
Für die lineare multiple Diskriminantenanalyse (LMDA) wurde die sogenannte „Fisher’s lineare Diskriminantenanalyse“ verwendet - ein linearer Klassifizierungsalgorithmus (Kapitel 13 Wilks 2006, P.
538-544) (Kapitel 4 Hastie et al. 2003, P. 101-137). Dabei wird versucht, zwischen den Beobachtungen und den Prädiktoren im Trainingsdatensatz ein Zusammenhang zu erzeugen. Im Gegensatz zur
MLR stellen die berechneten "Geraden"(da linear) jedoch nicht die Funktion für die Vorhersagewerte
dar, sondern die Grenze zwischen den einzelnen „Klassen“. In der Vorhersage wird die neue ECMWF
Vorhersage aufgetragen und untersucht, in welcher Klasse der aktuelle Lauf zu liegen kommt. Anhand
der Abstände zu den durch den Klassifizierungsalgorithmus berechneten „Klassengrenzen/Geraden“
wird die entsprechende Wahrscheinlichkeit berechnet. Als Beispiel: liegen die Prädiktoren des aktuellen Laufs eines Prädiktanten genau auf dem Mittelwert der Trainignsdatensätze in der Klasse „Ereignis
Nein“ und weit entfernt von der Klassengrenze zu „Ereignis Ja“, so ist die Wahrscheinlichkeit für ein
Eintreten der Klasse „Ereignis Nein“ gross. Liegt die Vorhersage jedoch nahe bei der Klassengrenze, so ist
die Zuteilung nicht mehr ganz eindeutig und die Wahrscheinlichkeiten werden in Richtung 50 %/50 %
verschoben.
Prädiktoren Prescreening
Analog zur multiple lineare Regression (MLR) wurde auch für die LMDA Prädiktoren ein Prescreening
durchgeführt, wodurch die Anzahl der Prädiktoren pro Vorhersagegrösse auf ein Subset von jeweils
30 Prädiktoren reduziert wurde. Genauere Informationen zum Prescreening siehe Absatz „Prädiktoren
Prescreening“ im Abschnitt 2.3.1.
26
Das Austrian Updateable Model Output Statistics System
Selektion der Prädiktoren
Die Selektion der Prädiktoren in der LMDA basiert auf einer Vorwärtsselektion mit RückwärtsElimination, basierend auf der Mahalanobis-Distanz (bzw. dem Quadrat der Mahalanobis-Distanz).
Details zur Mahalanobis-Distanz siehe (Abschnitt 9.4.4 Wilks 2006, P. 431-433).
Getestet werden alle Prädiktorenkombinationen gegeneinander im Vorwärtsverfahren. Vorwärts deshalb, weil mit einem Prädiktor begonnen wird. Es wird jeweils jener Prädiktor gewählt, welcher den
grössten Beitrag zur Mahalanobis-Distanz leistet. Wird eine Wahl getroffen, so wird das neue Set (bestehend aus K Prädiktoren aus (K1 , ..., K t ot ) in Kombination mit allen übriggebliebenen Prädiktoren
getestet. K ist dabei die Zahl der gewählten Prädiktoren, Kma x die maximale Anzahl erlaubter Prädiktoren durch das Selektionsverfahren und K t ot die gesamte Menge der wählbaren Prädiktoren im
Trainingsdatensatz. Unterschreitet die Verbesserung mit K einen gewissen Schwellwert relativ zur
Mahalanobis-Distanz des bestehenden Sets mit K − 1, so wird dieser Prädiktor nicht mehr gewählt
(bzw. im Nachhinein wieder eliminiert) und die Selektion abgebrochen. Das so gewählte Set wird
zur Vorhersage verwendet. Die Abbildung 2.5 zeigt einen solchen Selektionsvorgang aus einem realen
Beispiel.
1. Wahl des Prädiktors mit dem höchsten Beitrag zur Mahalanobis-Distanz.
2. Wahl des zweiten Prädiktors mit dem höchsten zusätzlichen Beitrag zur bestehenden
Mahalanobis-Distanz (kumulative Grösse) des verbleibenden Prädiktorensets.
3. Überprüfung des zusätzlichen Beitrages durch die zweite Selektion. Dabei muss die Verbesserung
2
relativ zur bestehenden Mahalanobis-Distanz (Dcur
r ) einen gewissen Schwellwert übersteigen.
D2
r
Ist der Zuwachs I = D2 cur
> s (grösser einem Schwellwert s), so wird der zusätzliche Prä2
cur r +Dnew
diktor akzeptiert. Anderenfalls wird der neu selektierte Prädiktor verworfen (eliminiert) und der
Selektionsvorgang abgebrochen.
4. Wahl des nächsten Prediktors mit dem höchsten zusätzlichen Beitrag zur bestehenden
Mahalanobis-Distanz aus dem verbleibenden Prädiktorenset.
5. Erneute Überprüfung gemäss dem Schema in (3). Sollte die Bedingung erfüllt sein, so wiederholen sich die beiden Punkte 4 und 5, bis der Schwellwert (s) unterschritten wird. Ist dies der
Fall, wird der letzte gewählte Prädiktor eliminiert und die Selektion beendet. Ebenfalls wird die
Selektion beendet, wenn die Anzahl der gewählten Prädiktoren eine maximal erlaubte Anzahl
(Kma x ) überschritten wird.
Die im A-UMOS für die LMDA verwendeten Schwellwerte sind in Tabelle Tabelle 2.12 zusammengefasst.
Mathematischer Algorithmus
Der allgemeine dahintersteckende Algorithmus der LMDA basiert auf den folgenden Gleichungen ...
1
Fcl =
|Σ−1 | 2
h 1
i
· e x p − · (p̄i − x̄cl ) T Σ−1 (p̄i − x̄cl )
2
(2 · π)
t
2
(2.9)
... wobei Σ die sogenannte „within covariance matrix“ darstellt, p ist der Vektor mit der aktuellen
ECMWF Vorhersage (Prädiktoren) und x̄cl der Mittelwert der Prädiktoren der entsprechenden Klasse
aus dem Trainingsdatensatz (s. Abschnitt 2.6.1). t stellt die Anzahl der „discriminant functions“ dar. Auf
27
2.3 Verwendete statistische Modelle
MDA-Selektionsverfahren
Vorwärtsselektion mit Rückwärts-Elimination
250
Verbesserung (I)
Anzahl der gewählten Prädiktoren
(skaliert mit Faktor 50)
Bestes gefundenes D2
(Quadrat der Mahalanobis-Distanz)
Aktuelles D2 (D2 Test)
(Quadrat der Mahalanobis Distanz)
Gewählt: #5
Gewählt: #4
200
Gewählt: #3
150
Gewählt: #2
100
Gesamtes D2 (T)
D2 (Quadrat der Mahalanobisdistanz)
bzw. Anzahl Prädiktoren (x50)
300
Gewählt: #1
50
0
Iterationsschritte des Selektionsverfahrens
Abbildung 2.5: Diese Grafik zeigt einen Selektionsprozess für ein Prädiktorenset aus dem A-UMOS für die lineare
multiple Diskriminantenanalyse (LMDA) (Klassifizierungsalgorithmus). Grau (gestrichelt) stellt die Anzahl der
gewählten Prädiktoren dar (skaliert mit Faktor 50 zur Darstellung auf derselben Ordinate). Grün (gepunktet)
das Quadrat der Mahalanobis-Distanz des jeweiligen Test-Sets und Rot (ausgezogen) diejenige der jeweils beste
Kombination. Seitlich rechts mit T bezeichnet ist das totale Quadrat der Mahalanobis-Distanz für das Set mit 5
Prädiktoren dargestellt. Markiert mit I (Improvement) die Verbesserung durch den zuletzt gewählten Prädiktor.
Fällt
I
T
unter einen Schwellwert s, so wird dieser wieder eliminiert. Im Beispiel ist das bei Prädiktor 5 der Fall - die
Selektion endet hier also mit K − 1 = 4 Prädiktoren.
diese Weise erhält man für jede Vorhersageklasse einen skalaren Funktionswert Fcl |cl = 1, ..., G, aus
welchen die Wahrscheinlichkeiten berechnet werden. Die Werte Fcl repräsentieren dabei den „Abstand“
zur jeweiligen Klassengrenze des Classifiers.
Pcl =
Fcl
Ncl
· G
G
P
P
Ng
Fg
g=1
(2.10)
g=1
In Gleichung 2.10 findet nichts anderes als eine Normierung statt. Pcl ist die jeweilige Wahrscheinlichkeit einer Klasse cl wobei cl = 1, ..., G annehmen kann. G stellt die Anzahl der Klassen dar, im binären
Fall ist G = 2. Die Wahrscheinlichkeiten liegen im Wertebereich [0, 1]. Damit das System im A-UMOS
schlank gehalten werden kann, werden jedoch nicht alle Grössen gespeichert. Die Inverse der Matrix Σ
lässt sich über eine „Hauptachsentransformation“ beziehungsweise eine „Ähnlichkeitstransformation“
in ihre Eigenvektoren und Eigenwerte zerlegen. Die Eigenvektoren ν und die Eigenwerte λ beinhalten
dabei die komplette Information der Ausgangsmatrix Σ−1 . D ist hierbei die Eigenwertmatrix, welche
auf ihrer Diagonalen die Eigenwerte λi enthält.
d et(Σ−1 S b − λI) = 0
(2.11)
(Σ−1 S b − λ j I)ν j = 0
(2.12)
28
Das Austrian Updateable Model Output Statistics System




D=


λ1
0
..
.
0
0
λ2
..
.
0
···
···
···
0
0
..
.
λn







Σ−1 = ν T Dν
(2.13)
(2.14)
I ist die Einheitsmatrix, λ die Eigenwerte und ν j die Eivenvektoren. Die Eigenvektoren ν j sind bereits
normiert. Ihr Betrag beläuft sich also auf 1 (|ν j | = 1). Beachtet man diese Transformation aus Formel
2.14, so ergibt sich aus der Formel 2.9 die folgende Form:
1
Fcl =
|ν T Dν| 2
t
(2 · Π) 2
h 1
i
· e x p − · (ν ȳ − ν x̄cl ) T D(ν ȳ − ν x̄cl )
2
(2.15)
Resultat / Gleichungen
Gespeichert werden im A-UMOS nur die Diagonalelemente der Eigenwertmatrix D (entspricht λi | i =
1, ..., n), die Eigenvektoren νi | i = 1, ..., n sowie der bereits mit den Eigenvektoren transformierte
Vektor ν ȳ. Zusätzlich wird die Auswahl der Prädiktoren durch den Selektionsalgorithmus gespeichert,
wodurch die Ausgangslage für die Vorhersage mittels der LMDA vollständig ist.
Vorhersage der MDA-Prädiktanten
Durch Einsetzen der aktuellen ECMWF Vorhersage p = (p j | j = 1, ..., K) in die Formeln 2.15 und diese
in 2.10, lässt sich die probabilistische MOS Vorhersage erstellen. K steht dabei für die Anzahl der im
Selektionsprozess gewählten Prädiktoren.
2.4
Nachbearbeiten der MOS Vorhersagen
Am Ende der Vorhersagekette im A-UMOS steht die Nachbearbeitung der Vorhersagen. Sie durchlaufen
dabei einige verschiedene Prozesse.
2.4.1 Berechnen von abgeleiteten Grössen / Ergänzen von Vorhersagen
Das A-UMOS umfasst insgesamt 16 deterministische Grössen und 6 probabilistische Grössen (s. Tabelle
2.1). Aus diesen „direkten“ A-UMOS Grössen werden einige abgeleitete Prädiktanten berechnet. So
wird beispielsweise die Windrichtung dd10uv aus den beiden Windkomponenten u10/v10 abgeleitet.
Desweiteren werden zur Erhöhung der Verfügbarkeit einige Prädiktanten ineinander übergeleitet.
Prädiktant
dd10uv
tdrh
Typ
A
A/K
Abhängigkeiten/Ableitungsregel
Abgeleitet: aus u10 und v10.
Abhängig von: spot, td, rh. Verwende: td. Wenn nicht vorhanden: auffüllen
mit td = f(rh,spot,Stationshöhe) falls rh und spot vorhanden.
Fortsetzung auf der nächsten Seite ...
29
2.4 Nachbearbeiten der MOS Vorhersagen
Prädiktant
Typ
Abhängigkeiten/Ableitungsregel
rhtd
A/K
Verwende:
rh.
Wenn
nicht
vorhanden:
auffüllen
mit
td
=
f(td,spot,Stationshöhe) falls td und spot vorhanden.
tmaxspot
Abgeleitet: aus spot. Maximum der vergangenen 12 Stunden. Bedingung: der
A
aktuelle spot-Wert (+0h) sowie derjenige zu Beginn der Periode (−12h) muss
vorhanden sein.
tminspot
Abgeleitet: aus spot. Minimum der vergangenen 12 Stunden. Bedingung: der
A
aktuelle spot-Wert (+0h) sowie derjenige zu Beginn der Periode (−12h) muss
vorhanden sein.
Tabelle 2.4: Liste der abgeleiteten Prädiktanten. Typ A steht für abgeleitete Prädiktanten, K für kombinierte
Prädiktanten. Eine Kombination von A und K ist ebenso möglich.
Die Klassen pop0, wsp0, w f esns0, wconv0 sowie w g ew0 sind hier nicht aufgeführt, da diese Klassen
jeweils die Gegenwahrscheinlichkeit zu den Klassen pop1, wsp1, w f esns1, wconv1 sowie w g ew1 darstellen. w g ew0 (die Wahrscheinlichkeit, dass keine Gewitter eintreten) ist beispielsweise w g ew0 =
100% − w g ew1.
2.4.2 Grenzwertüberprüfung
Gu
Korrektur
erlaubt!
Go
Zulässiger Wertebereich der Vorhersagen
zwischen den Grenzen Gu und Go
K
Korrektur
erlaubt!
K
Abbildung 2.6: Schematische Darstellung der Grenzwertüberprüfung. Die Vorhersagen ŷi haben einen zulässigen
Wertebereich zwischen Gu und Go . Manche Prädiktanten besitzen zusätzlich einen Korrekturbereich K. Liegt ŷi
innerhalb K, so wird ŷi auf die nächstgelegene Grenze Gu oder Go korrigiert. Liegt ŷi ausserhalb K und ausserhalb
des zulässigen Wertebereiches, so wird die Vorhersage verworfen.
In einem weiteren Schritt wird eine Grenzwertüberprüfung durchgeführt. Die Abbildung 2.6 zeigt
dieses Verfahren. Für jeden Prädiktanten ist ein unterer Grenzwert Gu sowie ein oberer Grenzwert Go
gesetzt. Einige Prädiktanten besitzen zusätzlich einen Korrekturbereich K. Die Vorhersagen ŷi werden
anhand dieser Kriterien modifiziert:
ŷi = Fehlerwert wenn ŷi < (Gu − K)
ŷi = Fehlerwert wenn ŷi > (Go + K)
ŷi = Gu wenn (Gu − K) ≤ ŷi < (Gu )
(2.16)
ŷi = Go wenn (Go ) < ŷi ≤ (Go + K)
ŷi = ŷi sonst (Normalfall)
Aufgrund des verwendeten Verfahrens für deterministische Grössen (MLR) sind die Vorhersagen nicht
auf spezifische Wertebereiche eingeschränkt. So sind beispielsweise Vorhersagen für den Prädiktanten
30
Das Austrian Updateable Model Output Statistics System
rh (relative Feuchte; physikalisch begrenzt auf [0 − 100%]) möglich, die leicht ausserhalb der Grenzwerte Gu /Go liegen und somit durch die Grenzwertüberprüfung auf die äusseren Grenzen korrigiert
werden können.
Die verwendeten Grenzwerte (Gu , Go , K) basieren auf physikalischen Grundprinzipien (z.B. kann die
relative Feuchte nur Werte 0% ≤ rht d ≤ 100% annehmen), andererseits sollen sie unrealistisch hohe oder tiefe Vorhersagewerte unterbinden. Ein weiteres Kriterium für die Grenzwerte ist die Datenbankstruktur der ZAMG. Die Felder der Datenbank sind aus Performancegründen auf spezifische
Wertebereiche eingeschränkt. Werte ausserhalb dieser Bereiche können nicht gespeichert werden und
würden zu Fehlern beim Einspielen der Vorhersagen in die Datenbank führen. Der Korrekturbereich
K dient vorwiegend dazu, leichte Abweichungen der Vorhersagen zu korrigieren, ohne die Vorhersage
direkt eliminieren zu müssen (auf Fehlerwert zu setzen).
Prädiktant
Gu
Go
K
Einheit
spot
-800
550
0
1/10 m s−1
tmax
-800
550
0
1/10 m s−1
tmaxspot
-800
550
0
1/10 m s−1
tmin
-800
550
0
1/10 m s−1
tminspot
-800
550
0
1/10 m s−1
td
-800
550
0
1/10 m s−1
tdrh
-800
550
0
1/10 m s−1
t5cm
-800
600
0
1/10 m s−1
rh
5
100
10
%
rhtd
5
100
10
%
u10
-700
700
0
1/10 m s−1
v10
-700
700
0
1/10 m s−1
dd10
0
360
0
0 − 359◦
ff10
0
700
20
1/10 m s−1
ffx
0
700
20
1/10 m s−1
mclotclo
0
8
2
[0/8 − 8/8]
tclo
0
8
2
[0/8 − 8/8]
ssd
0
240
10
1/10 h
glo
0
2000
20
W m−2
pre
0
2000 30 1/10 mm
Tabelle 2.5: Grenzwerte für die Grenzwertüberprüfung. Abgebildet sind die Grenzwerte Gu , Go sowie K. Die
Tabelle 2.1 beinhaltet die vollständige Beschreibungen der Prädiktanten
Tabelle 2.5 zeigt die im A-UMOS verwendeten Grenzwerte für alle MLR Prädiktanten beziehungsweise
deren abgeleiteten Grössen (s. Abschnitt 2.4.1).
2.4.3 Konsistenzcheck
Prädiktant
Bedingungen
Wahl
tmax
wenn t ma x < t ma xspot
tmaxspot
wenn t ma x nicht vorhanden
tmaxspot
wenn t ma x < t min
tmin
Fortsetzung auf der nächsten Seite ...
31
2.5 Berücksichtigung der Jahreszeiten
Prädiktant
tmin
Bedingungen
Wahl
sonst (Normalfall)
tmax
wenn t min > t minspot
tminspot
wenn t min nicht vorhanden
tminspot
sonst (Normalfall)
wenn t d rh und spot vorhanden sowie (spot + 2 C) ≥ t d rh > spot
tdrh
mclotclo
pre
tmin
◦
spot
wenn t d rh und spot vorhanden sowie t d rh > (spot + 2◦ C)
Fehl er wer t
sonst (Normalfall)
tdrh
wenn mcl o und t cl o vorhanden sowie mcl o > t cl o
tclo
sonst (Normalfall)
mclo
wenn pop1 und pr e vorhanden sowie pop1 < 50% und pr e ≤
0.0 mm
0.5 mm
sonst (Normalfall)
pop2
pop3
pop4
pop5
wsp2
wsp3
pre
wenn pop1 und pop2 vorhanden sowie pop1 < pop2
pop1
sonst (Normalfall)
pop2
wenn pop2 und pop3 vorhanden sowie pop2 < pop3
pop2
sonst (Normalfall)
pop3
wenn pop3 und pop4 vorhanden sowie pop3 < pop4
pop3
sonst (Normalfall)
pop4
wenn pop4 und pop5 vorhanden sowie pop4 < pop5
pop4
sonst (Normalfall)
pop5
wenn wsp1 und wsp2 vorhanden sowie wsp1 < wsp2
wsp1
sonst (Normalfall)
wsp2
wenn wsp2 und wsp3 vorhanden sowie wsp2 < wsp3
wsp2
sonst (Normalfall)
wsp3
Tabelle 2.6: Bedingungen für den Konsistenzcheck der MLR Prädiktanten. Bei den Prädiktanten der LMDA (pop,
wsp) wurde eine bedingte Abhängigkeit definiert. Die Klasse mit dem höheren Schwellwert darf keine höhere
Wahrscheinlichkeit besitzen als die Klassen mit den tieferen Schwellwerten.
Der letzte Schritt in der Nachbearbeitung dient der Konsistenz der Vorhersagen. Die Kriterien der in
Tabelle 2.6 abgebildeten Konsistenzbedingungen basieren auf physikalischen Gegebenheiten. So kann
beispielsweise die Taupunktstemperatur t d rh niemals höher sein als die dazugehörige Trockentemperatur spot.
2.5
Berücksichtigung der Jahreszeiten
Ein weiterer Aspekt des A-UMOS ist die Behandlung zweier getrennter Jahreszeiten. Gemäss Abbildung
2.7 ist das System in eine kalte und eine warme Jahreszeit aufgeteilt. Für jede der Saisonen wird eine
eigene SSCP geführt. Der Grund dafür ist, dass Sommer und Winter physikalisch eine unterschiedliche
Charakteristik aufweisen, die in den numerischen Modellen unterschiedlich gut abgebildet sein können. Ein Beispiel: durch den starken Energieeintrag im Sommer wird die bodennahe Schicht oft stark
durchmischt, es entstehen Quellungen und teilweise Gewitter. Im Winter hingegen reicht die Energie
der Sonne oft nicht aus, die kalte Luft in den Tälern zu erwärmen, wodurch sich in gewissen Regionen
tagelang Inversionen halten können.
Damit diese beiden Charakteristika nicht „vermischt“ werden, wird im A-UMOS für jede der beiden
Saisonen eine eigene statistische Beziehung zwischen den entsprechenden Beobachtungen und dem
32
Das Austrian Updateable Model Output Statistics System
DMO gesucht. Diese wurde anhand der mittleren Klimatologie an den europäischen Vorhersageraum
angepasst.
Gewichtungsschema der Jahreszeiten (Winter/Sommer)
OKT
1/1
SEP
1/1
1/3
2/3
AUG
1/2
JUL
1/1
APR
Kalt
1/2
1/1
JUN
2/3
1/1
MAI
1/3
1/1
Mixed
1/1
2/3
1/3
MAR
1/1
1/2
1/2
FEB
1/3
JAN
Warm
2/3
1/1
Mixed
1/1
Kalt
NOV
DEZ
Abbildung 2.7: Gewichtungsschema zwischen der „kalten“ und „warmen“ Saison. In blau (einfarbig) ist die
„kalte“-Saison, in rot (schraffiert) die „warme“-Saison abgebildet. Die Gewichtung wechselt von 1.0/0.0 über
0.33/0.67, 0.5/0.5, 0.67/0.33 zu 0.0/1.0. Dies einmal im Frühling und einmal im Herbst.
Der Sommer-Trainingsdatensatz enthält jeweils alle Datenpaare Beobachtung/DMO zwischen dem
100-ten und dem 292-ten Tag des Jahres, der Winter-Trainingsdatensatz die verbleibenden Daten. Um
diese beiden “Stichtage” (JulDay 100 JulDay 292) befinden sich jeweils 31 Übergangstage, in welcher
die Gewichtung gemäss Abbildung 2.7 beziehungsweise Tabelle 2.7 stattfindet.
JulDay
1-89
90-99
100-120
121-130
131-272
273-282
283-303
304-313
314-366
Winter
1.0
0.67
0.5
0.33
0.0
0.33
0.5
0.67
1.0
Sommer
0.0
0.33
0.5
0.67
1.0
0.67
0.5
0.33
0.0
Tage
89
10
21
10
142
10
21
10
53
Tabelle 2.7: Die Tabelle zeigt die Abstufung der Gewichtungsfunktion der beiden Jahreszeiten im des A-UMOS in
Zahlen (äquivalent zu Abbildung 2.7). Erste Zeile: Gültigkeitsbereich (in julianischen Tagen) der Gewichtungsfaktoren (GF); zweite Zeile: GF für die kalte Jahreszeit; dritte Zeile: GF für die warme Jahreszeit; letzte Zeile: Anzahl
Tage des Gültigkeitsbereiches.
Die Gewichtung findet im Gegensatz zum „updateable“-Schema nicht zwischen den Trainingsdatensätzen, sondern zwischen den Vorhersagen statt. Befinden wir uns also in einer der Übergangsphasen
im Frühling oder im Herbst, so werden jeweils zwei Vorhersagen errechnet und mit den Gewichtungsfaktoren für die Winter- und Sommersaison multipliziert. Lediglich die resultierende Vorhersage wird
gespeichert.
ŷi = ŷi,sommer · wsommer + ŷi,wint er · w wint er
(2.17)
Wobei ŷi die finale Vorhersage ist, ŷi,sommer bzw. ŷi,wint er die Teilvorhersagen in den einzelnen Saisonen
und wsommer bzw. w wint er die Werte des Gewichtungsschemas passend zu den Saisonen. Dieses Schema
kommt nur zur Anwendung, wenn w1 · w2 6= 0.0. Zudem gilt die Bedingung, dass sowohl ŷi,sommer als
auch ŷi,wint er vorhanden sein müssen. Fehlt eine der beiden Vorhersagen, so wird auf die Gewichtung
verzichtet und der vorhandene Wert als Vorhersage ŷi verwendet.
33
2.6 Anpassungen an Modelländerungen der numerischen Modelle
2.6
Anpassungen an Modelländerungen der numerischen Modelle
Eines der Kernstücke des Austrian Updateable Model Output Statistics (A-UMOS) ist das „updateable“ Verfahren. Die Idee hinter der verwendeten Methode wurde in Abschnitt 1.3 bereits erklärt. Auf
den kommenden Seiten wird der mathematische Algorithmus hinter dem Konzept erläutert. Die Basis
des Verfahrens sind die SSCPs, aus welchen durch eine Linearkombination die Trainingsdaten für die
statistischen Methoden erstellt werden.
2.6.1 Trainingsdatensatz
Wie bereits das Canadian Updateable Model Output Statistics (UMOS) System basiert auch das Austrian Updateable Model Output Statistics (A-UMOS) System auf einer speziellen Art des Trainingsdatensatzes. Um Speicherplatz und Rechenzeit einzusparen, wird anstelle einer kompletten Zeitreihe
(alle Paare Beobachtung/DMO ) lediglich die sogenannte SSCP („sum of square and cross products
matrix“) gespeichert. Sie besteht ebenfalls aus allen Paaren Beobachtung/DMO, die Daten werden jedoch im Gegensatz zu einer herkömmlichen Zeitreihe als auflaufende Messwerte gespeichert. Für die
beiden im A-UMOS verwendeten statistischen Modelle, also die MLR und die LMDA, enthält jede SSCP
die komplette benötigte Information. x = (x i j | i = 1, ..., N , j = 1, 2, ..., M − 1) sind die Prädiktoren
(Vorhersagevariablen aus dem numerischen Modell), die Elemente x iM | i = 1, ..., N repräsentier die
Beobachtung, wobei M = Anzahl Prädiktoren +1. N ist die Anzahl der Fälle, welche im Trainingsdatensatz gespeichert sind.
Achtung: zum besseren Verständnis wird hier nicht explizit zwischen SSCP und „Trainingsdatensatz“
unterschieden. Lesen Sie dazu bitte den Abschnitt 1.3 beziehungsweise 2.6.2. Der Trainingsdatensatz
kann - basierend auf dem updateable-Schema - aus einer Kombination zweier SSCPs bestehen. Dadurch
verändern sich jedoch lediglich die enthaltenen Werte, die Systematik bleibt dieselbe.

 N

P
N

 x i1
i=1
P
N
 x i2
SSC P = 
i=1
N
P
 x i3
i=1
N
P
 x i4
i=1

..
.
N
P
N
P
x i1
i=1
N
P
2
(x i1
)
(x i2 x i1 )
i=1
N
P
i=1
N
P
(x i3 x i1 )
(x i4 x i1 )
i=1
..
.
N
P
(x i1 x i2 )
i=1
N
P
i=1
N
P
2
(x i2
)
(x i3 x i2 )
i=1
N
P
(x i4 x i2 )
i=1
N
P
x i3
..
.
N
P
i=1
N
P
(x i1 x i3 )
(x i2 x i3 )
i=1
N
P
i=1
N
P
2
(x i3
)
(x i4 x i3 )
i=1
x i4
i=1
i=1
i=1
i=1
N
P
N
P
x i2
N
P
i=1
N
P
i=1
N
P
(x i1 x i4 )
(x i2 x i4 )
(x i3 x i4 )
i=1
N
P
i=1
..
.
2
(x i4
)
..
.

· · ·



· · ·



· · ·



· · ·



· · ·


..
.
(2.18)
Allgemeiner ausgedrückt ergibt sich die Form:
N
P

 N

P
 N
x i1

SSC P = 
 i=1.
 .
 .
N
P
x iM
i=1
x i1
i=1
N
P
i=1
N
P
i=1
2
)
(x i1
..
.
(x iM x i1 )
···
···
..
.
···
N
P

x iM




(x i1 x iM )

i=1

..

.


N
P

2
)
(x iM
i=1
N
P
i=1
(2.19)
34
Das Austrian Updateable Model Output Statistics System
Aufgrund ihrer Symmetrie muss lediglich die obere Dreiecksmatrix gespeichert werden, hier blau markiert. Diese Form der Speicherung reduziert den Speicherbedarf um ein Vielfaches. Bei einem Trainingsdatensatz mit 30 Prädiktoren plus der Beobachtung (M = 31) ergibt dies für N = 300 bei einer
Zeitreihe M · N = 31 · 300 = 9′ 300 Werte. Bei einer SSCP mit demselben Umfang an Daten sind dies
jedoch lediglich (M + 1) · (M + 2) · 0.5 = (31 + 1) · (31 + 2) · 0.5 = 528 Elemente. Die SSCP benötigt bei
300 Fällen also nur rund 6% des Speicherplatzes einer vergleichbaren Zeitreihe. Die Zahl 300 resultiert
daraus, dass wir rund 300 Fälle benötigen um stabile Regressionsgleichungen zu rechnen. Diese Zahl
ist lediglich ein Beispiel und wächst täglich, wodurch der benötigte Speicherumfang einer Zeitreihe im
Gegensatz zu den SSCPs ständig wächst.
Zusätzlich wird durch die SSCP-Form auch Rechenzeit eingespart. Der sogenannte I/O (Input/Output,
das Lesen/Schreiben von Dateien auf der Festplatte) nimmt durch die SSCP-Form nur einen Bruchteil
der Zeit in Anspruch, gemessen am I/O einer kompletten Zeitreihe. Durch diese Speicherungsform
entstehen jedoch auch Nachteile. Die komprimierte Form der auflaufenden Messwerte bringt einen
gewissen Informationsverlust mit sich, wodurch nur einige wenige Regressionsmodelle angewendet
werden können.
Anzahl an Sum of Square and Cross Products Matritzen
Für jede Regressionsgleichung ist eine solche SSCP notwendig. Dies bedeutet, dass für jede Vorhersagegrösse, jede Station und jeden Vorhersagezeitschritt eine SSCP aufgebaut werden muss. Bei den
probabilistischen Vorhersagegrössen ist ausserdem pro Gruppe eine SSCP notwendig (siehe Abschnitt
2.2). Dies ergibt - unter der Berücksichtigung, dass wir unterschiedliche Gleichungen und somit unterschiedliche SSCPs für kalte und die Warme Jahreszeit berechnen - insgesamt 1′ 207′ 770·2 = 2′ 415′ 540
SSCPs.
Tägliches Ergänzen
Der Trainingsdatensatz ist vergleichbar mit dem Gehirn des Systems. Aufgrund der darin enthaltenen
Daten „lernt“ das MOS den statistischen Zusammenhang zwischen den Prädiktoren aus dem DMO
und den Beobachtungen. Deshalb ist es wichtig, dass dieser möglichst umfassende Daten behinhaltet. Es werden deshalb täglich neue Daten zum Trainingsdatensatz hinzugefügt. Da er jedoch jeweils
aus Paaren „DMO/Beobachtungen“ besteht, kann das Update erst durchgeführt werden, wenn alle Beobachtungen vorhanden sind. Im A-UMOS ist die längste Vorhersagezeit +144h oder 6d. Die SSCPs
werden deshalb mit einem Verzug von 6 Tagen erweitert.
2.6.2 Linearkombination von MOS Modellversionen: das „updateable“ Schema
Wie bereits in Abschnitt 1.3 erläutert, ist ein zentrales Element des A-UMOS das updateable-Schema.
Dabei wird der DMO aus verschiedenen Versionen des numerischen Modells in verschiedene SSCPs
gespeichert, um die Modellcharakteristik nicht zu vermischen. Das updateable-Schema kombiniert nun
- falls nötig - diese SSCPs, um den Trainingsdatensatz für die Regressionsmodelle zu erstellen.
Achtung: um die Formeln in den kommenden Kapiteln nicht unnötig aufzublasen, wird später lediglich vom Trainingsdatensatz xi j gesprochen. Gemeint ist damit der durch das updateable-Schema
erstellte Trainingsdatensatz. Da die SSCPs jedoch ausschliesslich auflaufende Messwerte enthalten und
das updateable-Schema zwei SSCPs lediglich mit skalaren Faktoren gewichtet, ist die Struktur einer
einzelnen SSCP identisch mit dem kombinierten Trainingsdatensatz.
35
2.6 Anpassungen an Modelländerungen der numerischen Modelle
Das updateabe-Schema wird über die folgenden 5 Gleichungen beschrieben:
È
ωneu = ωma x + (1 − ωma x ) ·
ωal t =
So − ωneu · Nneu
Nal t
2
1−
(Nneu − So )2
(2.20)
(Su − So )2
für Nneu ≤ So
(2.21)
ωneu = 1.0 und ωal t = 0.0 für Nneu > So
(2.22)
ωneu = 0.0 und ωal t = 1.0 für Nneu < Su
(2.23)
Trainingsdatensatz = ωneu SSC Pneu + ωal t SSC Pal t
(2.24)
Dabei stellt N die Anzahl der Fälle in den SSCPs dar, wobei Nal t die Fallanzahl in der SSCP der alten
Modellversion ist, Nneu entsprechend jene der aktuellen/neuen Modellversion. Su und So stellen den
unteren und den oberen Schwellwert für die Anzahl der Fälle dar (s. Abbildung 2.8). ωneu und ωal t
sind die gesuchten Gewichtungsfaktoren, welche auf die SSCP’s angewewendet werden um zum endgültigen Trainingsdatensatz zu gelangen. ωma x ist der Initialisierungsfaktor und steuert das Verhältnis
zwischen ωal t und ωneu . Dieser wurde aus dem Artikel von Wilson and Vallée (2002) übernommen
und beträgt im A-UMOS 1.66. Die verwendeten Schwellwerte sind in den beiden Tabellen 2.11 und
2.12 aufgeführt.
updateabe-Gewichtungsschema anhand eines Beispieles
Su
So
Relative Gewichtungsfaktoren
(ωalt, ωneu)
1.0
0.9
0.8
Mit Ansteigendem Nneu erhält
ωneu einen stärkeren Einfluss.
0.7
0.6
0.5
0.4
Mit Ansteigendem Nneu nimmt
der Einfluss von ωalt stetig ab.
0.3
0.2
0.1
0.0
0
0
50
100
150
200
250
300
Anzahl Fäle (Nneu) in der aktuellen SSCP
Abbildung 2.8: Beispiel der relativen Faktoren ωneu und ωal t . Schattiert ist die Übergangsphase zwischen zwei
Modellversionen, begrenzt durch die Schwellwerte So und Su . Achtung: Beispiel gilt für Su = 50, So = 300, Nal t =
600 und ωma x = 1.66. ωneu = f (So , Su , Nneu , ωma x ) und ωold = g(ωneu , Nal t ). Die Funktionen f (•) und g(•)
besitzen je 4 − 5 Freiheitsgrade, weshalb nicht der komplette Funktionsbereich für ωal t und ωneu abgebildet
werden kann.
Man stelle sich eine Situation vor wie im Jahre 2010, als am ECMWF die neue T 1279 Modellversion
initialisiert wurde. Die Änderungen im numerischen Modell sind nicht vernachlässigbar (Verdoppelung der Anzahl Gitterpunkte), weshalb eine Anpassung der Fehlercharakteristik angenommen werden
36
Das Austrian Updateable Model Output Statistics System
kann. Aus diesem Grund wurde im A-UMOS eine neue MOS Modellversion initialisiert. Seit diesem Tag
(26. Januar 2010) wird der DMO aus den laufenden Modellvorhersagen in neue SSCPs eingespielt. Die
Anzahl der Fälle (der entsprechend laufenden Saison) wachsen seitdem täglich an (Nneu + 1 Fall pro
Tag). Die SSCPs der alten MOS Modellversion werden gleichzeitig „eingefroren“, Nal t bleibt unverändert.
Solange Nneu noch nicht den unteren Schwellwert Su für die minimale Anzahl an Fällen erreicht hat,
bleiben die Gewichte ωal t = 1.0 und ωneu = 0.0, was bedeutet, dass der Trainingsdatensatz identisch
mit der SSCP der alten MOS Modellversion ist (gem. Formel 2.23). Wenn Su < Nneu < So + 1, wird
das updateable-Schema aktiv. Mit anwachsender Anzahl Fälle in der aktuellen SSCP wächst der Faktor
ωneu immer weiter an und erreicht bei Nneu = So den Wert 1.0. ωal t durchläuft denselben Prozess,
läuft jedoch gegen ωal t = 0.0. Ist Nneu > So so wird die alte SSCP nicht mehr benötigt (gem. Formel
2.22) und der Trainingsdatensatz ist identisch mit der SSCP der aktuellen MOS Modellversion. Dieser
Prozess ist in Abbildung 2.8 dargestellt.
37
2.7 Verifikation
2.7
Verifikation
Um objektive Aussagen über die Güte der Vorhersagen sowie der verschiedenen Test-Konfigurationen
zu erhalten, wurden verschiedenste statistische Masszahlen verwendet. In den folgenden Abschnitten
werden zuerst die Masszahlen erläutert, welche für die deterministischen und die probabilistischen
Vorhersagen verwendet wurden. Anschliessend werden einige Auswertungen gezeigt.
Es wurden jeweils die 00Z Läufe getrennt von den 12Z Läufen ausgewertet. Zur Verifikation wurde
das A-UMOS mit dem bestehenden MOS System der ZAMG (AUSTROMOS2) verglichen. Das AUSTROMOS2 liefert lediglich Vorhersagen für 12Z, weshalb in diesem Abschnitt auf die Darstellung der 00Z
Auswertungen verzichtet wurde. Die Tabellen 2.13 und 2.14 hingegen beinhalten die Verifikationsmasse aller Prädiktanten und Läufe.
Die Auswertungen basieren auf einer im Februar 2010
durch die ZAMG definierten Stationsliste, welche 145
Stationen aus dem A-UMOS umfasst. Davon sind 2 reine TAWES-Stationen, 5 reine SYNOP-Stationen und 138
kombinierte Stationen (s. Abschnitt 2.2.2). Zu beachten ist ausserdem, dass einige Prädiktanten („aktww“,
„wconv“, „wgew“ und „wfesns“) lediglich für Synopsta-
Validierungs-Stationsliste
Breitengrad
49oN
48oN
47oN
46oN
10oE
12oE
o
14 E
o
16 E
o
18 E
tionen berechnet werden können, da entsprechende Beobachtungen notwendig sind. Analoges gilt für die Prädiktanten „t5cm“ und „glo“ welche lediglich für TAWES
Stationen verfügbar sind.
Längengrad
Abbildung 2.9: Stationen aus der für die Verifikation verwendeten Stationsliste. Insgesamt 145 Stationen, davon 2 reine TAWES Stationen und 5 reine
SYNOP Stationen.
2.7.1 Datengrundlage der Verifikation
Stationsliste : verwendet wurde die Verifikations-Stationsliste, siehe Abbildung 2.9.
A-UMOS : Die ausgewerteten Vorhersagen - welche in die Scores eingeflossen sind - überspannen den
Zeitraum zwischen dem 01.02.2010 und dem 31.07.2011 (insgesamt 546 Tage). Die Vorhersagen bis zum 07.01.2011 basieren auf einem abhängigen Trainingsdatensatz, jene nach dem
07.01.2011 auf einem unabhängigen Trainingsdatensatz. Das Modell befindet sich zudem in der
Übergangsphase zwischen zwei MOS-Modellversionen („updateable“-Phase“; s. Abschnitt 2.6.2).
ECMWF : die Auswertung beinhaltet ausschliesslich die Vorhersagen der Modellauflösung T 1279L91
(ca. 16km Maschenweite horizontal; 91 vertikale Niveaus).
AUSTROMOS2 : die Verifikation basiert auf den Vorhersagen, welche uns von Gerhard Hermann
(ZAMG) zur Auswertung zur Verfügung gestellt wurden (ebenfalls 01.02.2010 - 31.07.2011).
38
Das Austrian Updateable Model Output Statistics System
2.7.2 multiple lineare Regression: Verifikationsmasse
Die Verfübarkeit
Ein wichtiges Mass ist die Verfügbarkeit der Vorhersagen (engl. „Availability“). Da die A-UMOS Vorhersagen für den täglichen Vorhersageprozess und teilweise für automatische Produkte verwendet
werden, soll die Verfügbarkeit idealerweise immer gegeben sein. Der Index p steht für einen Prädiktanten, der Index i = (1, ..., N ) für die in den Score eingeflossenen Vorhersagen, wobei N = (Anzahl
Stationen · Anzahl Vorhersagezeitschritte · Anzahl Tage). o sind die Beobachtungen, ŷ die Vorhersagen
des Untersuchten Prädiktanten.
N
P
AVAI L(p) =

(zi )
i=1
N
P
| zi =
(1)
1
wenn Vorhersage ŷip verfügbar
0
sonst
(2.25)
i=1
Im Idealfall ist zu jedem i = 1, ..., N eine Vorhersage für den Prädiktanten p vorhanden, wodurch
AVAI L(p) = 1.0 ist. Sind nie Vorhersagen vorhanden, so ist AVAI L(p) = 0.0.
Bias und Standardabweichung
Aufgrund der Annahme, dass sowohl die Beobachtungen als auch die Vorhersagen des A-UMOS Normalverteilt sind, kann deren Verteilung über ihren Mittelwert sowie ihre Standardabweichung beschrieben werden. Im Idealfall sind Mittelwert und Standardabweichung zwischen Beobachtung und Vorhersage identisch (E(ŷ) ≡ E(o) und σ(ŷ) ≡ σ(o)). Aufgrund des Vorhersagefehlers weichen diese jedoch
voneinander ab. Zur objektiven Beurteilung werden deshalb die beiden Masszahlen Bias und Standardabweichung verwendet.
Der Bias ist die Abweichung zwischen dem arithmetischen Mittel der Vorhersagen ŷ und dem arithmetischen Mittel der Beobachtungen o.
BIAS(p) =
N
1X
N
i=1
( yip ) −
N
1X
N
(oip )
(2.26)
i=1
Ein BIAS(p) > 0 bedeutet, dass die A-UMOS Vorhersage im Mittel über dem arithmetischen Mittel der
Beobachtungen liegt. Genauso gilt für BIAS(p) < 0, dass die A-UMOS Vorhersagen im Mittel tiefer
liegen als die Beobachtungen.
s
σ ŷ p =
N
1X
N
i=1
s
( y¯p − yip )2 ; σop =
N
1X
N
(o¯p − oip )2
(2.27)
i=1
Sind die Standardabweichungen der Beobachtung und der Vorhersage identisch, so ist deren Streuung
um den Mittelwert gleich gross. Hier gilt: bei einer perfekten Vorhersage sollte σ ŷ p − σop = 0 sein.
Mittlerer absolute Fehler (MAE) und Root Mean Square Error oder Quadratischer Fehler (RMSE)
Wie bereits an verschiedenen Stellen erwähnt, setzt sich die A-UMOS Vorhersage ŷ zusammen aus der
Beobachtung o und einem Fehler ε (ŷ = ô + ε). Die folgenden Masszahlen drücken ε objektiv aus.
Dabei ist der mittlere absolute Fehler (engl. „MAE: mean absolute error“) der mittlere Fehler zwischen
Vorhersage und Beobachtung. Der RMSE (engl. „root mean square error“) ist die Wurzel aus dem
39
2.7 Verifikation
Quadrat der Abweichungen zwischen den Beobachtungen und den Vorhersagen. Im Gegensatz zum
MAE reagiert der RMSE stärker auf Ausreisser.
N
P
M AE(p) =
RM S E(p) =
|oip − ŷip |
i=1
(2.28)
N
v
u N
uP
u (oip − ŷip )2
t i=1
N
(2.29)
Sowohl MAE als auch RMSE sind positiv definierte Werte. Im Idealfall nehmen sie den Wert 0 ein,
ansonsten RM S E(p) > 0 und M AE(p) > 0.
Korrelation
Eine weitere wichtige Zahl ist die Korrelation zwischen der Beobachtung und den Vorhersagen. Sie
kann die Werte 1 ≥ CORR(p) ≥ −1 einnehmen und ist ein Mass für die Beziehung zwischen zwei
Merkmalen.
CORR(p) =
COVo,ŷ
σop · σ ŷ p
=
σ2op, ŷ p
σop · σ ŷ p
(2.30)
Im Idealfall entspricht der Wert der Korrelation 1.
2.7.3 multiple lineare Regression: Resultate
Auf den folgenden Seiten befinden sich einige ausgewählte repräsentative Verifikationen verschiedener
MLR Prädiktanten. Es wurden jeweils die Auswertungen des 12Z Laufes gewählt, da die AUSTROMOS2
Vorhersagen (Referenzsystem) nur für diesen Lauf zur Verfügung stehen. Am Ende dieses Abschnittes
befindet sich eine Tabelle mit den Scores aller im A-UMOS verwendeten Prädiktanten.
Erkärung der Abbildungen
Die Grafiken zeigen verschieden Scores der entsprechenden Prädiktanten und umfassen die Korrelation (o.l), den Bias (o.r.), der mittlere absolute Fehler (MAE, u.l) sowie die Verfügbarkeit (engl.
„Availability“, u.r), welche jeweils gegen die Vorhersagezeitschritte aufgetragen sind. Im Anschluss an
die Grafiken befinden sich einige Erklärungen zu den abgebildeten Scores.
Graphen : in rot die Auswertungen für das A-UMOS, in blau jene für das AUSTROMOS2 (falls vorhanden) und in grün jene des ECMWF.
Zeitschritte : die Niederschlagsmenge (pre) ist über den gesamten Vorhersagezeitraum 6-stündig, alle
anderen Prädiktanten sind jeweils bis +72h 3-stündig, danach ebenfalls 6-stündig bis +144h (s.
Tabelle 2.2). Die Vorhersagen des AUSTROMOS2 sind jeweils von +12h bis +120h verfügbar,
jedoch lediglich 6-stündig über den gesamten Zeitraum.
40
Das Austrian Updateable Model Output Statistics System
Verifikation spot: Temperatur 2m über Grund
Korrelation für spot 12Z
Bias fuer spot 12Z
[0−1]
[1/10 ° C]
1
20
0.8
10
0.6
0
0.4
−10
0.2
−20
0
+12h
+36h
+60h
+84h
+108
Mittlerer absoluter Fehler für spot 12Z
+132h
+12h
[1/10 ° C]
40
+36h
+60h
+84h
Verfügbarkeit für spot 12Z
+108
+132h
[0%−100%]
100
35
80
A−UMOS
ECMWF
AUSTROMOS2
30
60
25
40
20
15
10
+12h
+36h
+60h
+84h
+108
+132h
20 Anzahl Fälle in den Scores:
A−UMOS: 2041247.
ECMWF: 2048501.
AUSTROMOS2: 591222.
0
+12h
+36h
+60h
+84h
+108
+132h
Abbildung 2.10: Verifikation Lufttemperatur 2m über Grund (spot in 1/10◦ C). Eine allgemeine Erklärung der
Graphen befindet sich in Abschnitt 2.7.3.
Die Korrelation des DMO ist mit 92% relativ zu anderen Vorhersagegrössen recht hoch, tendenziell
sind die Vorhersagen aus dem ECMWF jedoch zu tief (negativer Bias). Die genauen Verifikationswerte
sind bei Bedarf alle der Tabelle 2.13 zu entnehmen.
Korrelation
Die beiden MOS Systeme liegen mit einer Korrelation von 97% um 5% höher als das ECMWF. Aufgrund
der bereits sehr hohen Korrelation des ECMWF sind die Unterschiede der MOS Systeme nur marginal.
Bias, MAE und RMSE
Die Ersten Unterschiede zwischen dem A-UMOS und dem AUSTROMOS2 zeigen sich im Bias und im
mittleren absoluten Error (MAE). Der MAE konnte im A-UMOS um etwas mehr als 0.2 ◦ C verbessert
werden und liegt nun bei 1.58 ◦ C im Mittel über alle 2.04 Millionen ausgewerteten Vorhersagen.
Der MAE im ECMWF nimmt mit der Vorhersagezeit nur leicht zu, die beiden MOS Systeme zeigen
jedoch einen stärkeren Anstieg des MAE. Unter der Berücksichtigung, dass sich der Bias bei allen
Modellen über die Vorhersagezeit etwa konstant verhält, kann angenommen werden, dass die Streuung
im ECMWF nicht zunimmt, während die Streuung der Vorhersagen in den MOS Systemen von der
Vorhersagezeit abhängt.
41
2.7 Verifikation
Der Tagesgang im MAE des A-UMOS läuft zudem entgegen jenem im ECMWF. Die Temperaturen der
ersten Nachthälfte (vor Mitternacht) weisen im A-UMOS einen wesentlich tieferen MAE auf als jene
untertags. Im ECMWF ist dies genau umgekehrt. Allgemein kann der Tagesgang des Fehlers gedämpft,
jedoch nicht vollständig eliminiert werden.
Der RMSE des ECMWF konnte um rund 47% reduziert werden und liegt im A-UMOS bei 2.13 ◦ C.
Durch die verwendeten Methoden wird der Bias minimiert. Auf einem abhängigen Testdatensatz (Trainingsdatensatz = Testdatensatz) resultiert der Bias in einem Wert 0.0. Die hier gezeigte Auswertung
basiert auf Vorhersagen über insgesamt 546 Tage, wovon rund 2/3 auf einem abhängigen Trainingsdatensatz gerechnet wurden (s. Abschnitt 2.7.1). Bei unabhängigen Vorhersagen im operationellen
Betrieb ist der zu erwartende Bias deshalb etwas höher.
Verifikation ff10: Windgeschwindigkeit 10m über Grund
Korrelation fuer ff10 12Z
[0−1]
Bias fuer ff10 12Z
1
[1/10 m s
−1
]
80
60
0.8
40
0.6
20
0.4
−20
0
−40
0.2
0
−60
−80
+12h
+36h
+60h
+84h
+108
Mittlerer absoluter Fehler für ff10 12Z
+132h
+12h
[1/10 m s −1 ]
80
+36h
+60h
+84h
Verfügbarkeit für ff10 12Z
+108
+132h
[0%−100%]
100
70
80
60
50
A−UMOS
ECMWF
AUSTROMOS2
60
40
40
30
20
10
0
+12h
+36h
+60h
+84h
+108
+132h
20 Anzahl Fälle in den Scores:
A−UMOS: 2035134.
ECMWF: 2042449.
AUSTROMOS2: 591066.
0
+12h
+36h
+60h
+84h
+108
+132h
Abbildung 2.11: Verifikation der Windgeschwindigkeit 10m über Grund (ff10 in 1/10 m s−1 ). Eine allgemeine
Erklärung der Graphen befindet sich in Abschnitt 2.7.3.
Aufgrund der Modelltopographie, der abstrahierten Oberflächenbeschaffenheit sowie der notwendigen
mathematischen Vereinfachungen des numerischen Modells ist der bodennahe Wind (Windgeschwindigkeit in 10m über Grund) wesentlich schwieriger vorhersagbar als etwa die Temperatur 2m über
Grund. Gut erkennbar ist ein Tagesgang im ECMWF Modell. In der Nacht ist die Performance des
ECMWF besser. Die genauen Werte der hier angesprochenen Verifikationsmasse können bei Bedarf in
Tabelle 2.13 nachgelesen werden.
42
Das Austrian Updateable Model Output Statistics System
Korrelation
Gut zu erkennen ist im Gegensatz zur Temperatur in 2m über Grund die tiefe Korrelation des ECMWF
mit im Mittel lediglich 35%. Die A-UMOS Vorhersagen verbessern diesen Wert auf 80% und liegen
damit 29% über jenen des AUSTROMOS2 und 45% über dem ECMWF.
Bias, MAE und RMSE
Während das ECMWF einen Bias von rund 6ms−1 aufweist, können beide MOS Systeme diesen Wert
auf beinahe 0 reduzieren (A-UMOS: 0.02ms−1 , AUSTROMOS2: 0.23ms−1 ). Ebenfalls konnte der RMSE
im Gegensatz zum ECMWF um mehr als 80% auf nur mehr 1.3ms−1 reduziert werden.
Es ist zu beachten, dass der MAE im Gegensatz zu den anderen in dieser Arbeit gezeigten Auswertungen der MLR Prädiktanten (spot, pre, rhtd) kaum mit der Vorhersagezeit zunimmt, ein Tagesgang
ist jedoch in beiden Modellen erkennbar. Die beiden Tagesgänge haben ihre Minima und Maxima zu
denselben Vorhersagezeiten, im Gegensatz zu den beiden Auswertungen spot/rhtd. Dies liegt unter
anderem daran, dass die absoluten Werte der Windgeschwindigkeit tagsüber höher liegen als nachts,
wodurch der MAE ebenfalls erhöht wird.
43
2.7 Verifikation
Verifikation pre: Niederschlagsmenge
Korrelation für pre 12Z
[0−1]
Bias für pre 12Z
1
15
0.8
10
[1/10 mm ]
5
0.6
0
0.4
−5
0.2
0
−10
−15
+12h
+36h
+60h
+84h
+108
Mittlerer absoluter Fehler für pre 12Z
+132h
+12h
[1/10 mm]
20
+36h
+60h
+84h
Verfügbarkeit für pre 12Z
+108
+132h
[0%−100%]
100
18
80
16
14
60
12
40
10
8
6
+12h
+36h
+60h
+84h
+108
+132h
A−UMOS
ECMWF
AUSTROMOS2
20 Anzahl Fälle in den Scores:
A−UMOS: 1295572.
ECMWF: 1290599.
AUSTROMOS2: 600026.
0
+12h
+36h
+60h
+84h
+108
+132h
Abbildung 2.12: Verifikation der Niederschlagsmenge (spot in 1/10 mm m−2 ). Eine allgemeine Erklärung der
Graphen befindet sich in Abschnitt 2.7.3.
Der nächste hie genauer untersuchte Prädiktant ist die deterministische Niederschlagssumme. Interessant zu sehen ist, dass die aktuelle Modellversion des ECMWF, auf welchen die Verifikationen basieren, eine höhere Vorhersagegenauigkeit aufweisen als das AUSTROMOS2. Zur Info: AUSTROMOS2
wurde vor mehr als 6 Jahren auf einer damals aktuellen Version des ECMWF entwickelt. Hier zeigt
sich jedoch der Vorteil des im A-UMOS verwendeten „update“-Schemas. Durch dieses Verfahren kann
das A-UMOS sehr rasch auf die veränderte (und markant bessere) Charakteristik der neuen ECMWF
Modellversion reagieren, während das AUSTROMOS2 diese nicht in qualitativ bessere Vorhersagen
umsetzen kann. Die genauen Werte können bei Bedarf der Tabelle 2.13 entnommen werden.
Korrelation
Während die Korrelation des AUSTROMOS2 etwas abgeschlagen auf 29% liegt, konnte das A-UMOS
diese gegen das ECMWF um 15% im Mittel auf 56% erhöhen.
Bias, MAE und RMSE
Dasselbe Bild wie bei der Korrelation zeigt sich bei Bias, RMSE und im mittleren absoluten Fehler
(MAE). Im A-UMOS konnten alle Werte gegenüber dem ECMWF nochmals verbessert werden, der
RMSE beispielsweise konnte um gut 20% reduziert werden. Der mittlere absolute Fehler des A-UMOS
beträgt 0.83mm und liegt damit unter dem MAE des ECMWF mit 0.95mm.
44
Das Austrian Updateable Model Output Statistics System
Erneut zeigt sich der Tagesgang im ECMWF, welcher durch das A-UMOS gedämpft, nicht aber eliminiert wird. Im Gegensatz zur Auswertung der Windgeschwindigkeit nimmt hier sowohl beim ECMWF
als auch beim A-UMOS der MAE zu mit der Vorhersagezeit.
Verfügbarkeit
Die Verfügbarkeit des A-UMOS beträgt 94.7% gemessen an der theoretisch möglichen Anzahl an Vorhersagen. Achtung: Das ECMWF weist natürlich eine Verfügbarkeit von 100% auf! Die reduzierte Verfügbarkeit basiert auf einem Software-Bug, welcher leider erst nach der Verifikation beseitigt werden
konnte.
Verifikation rhtd: relative Luftfeuchte 2m über Grund
Korrelation für rhtd 12Z
[0−1]
Bias für rhtd 12Z
1
[% ]
8
6
0.8
4
0.6
2
0.4
−2
0
−4
0.2
−6
0
−8
+12h
+36h
+60h
+84h
+108
Mittlerer absoluter Fehler für rhtd 12Z
+132h
+12h
[% ]
16
+36h
+60h
+84h
Verfügbarkeit für rhtd 12Z
+108
+132h
[0%−100%]
100
14
80
A−UMOS
ECMWF
AUSTROMOS2
12
60
10
40
8
6
4
+12h
+36h
+60h
+84h
+108
+132h
20 Anzahl Fälle in den Scores:
A−UMOS: 2040576.
ECMWF: 2047985.
AUSTROMOS2: 590945.
0
+12h
+36h
+60h
+84h
+108
+132h
Abbildung 2.13: Verifikation der relative Feuchte (rhtd in %). Eine allgemeine Erklärung der Graphen befindet
sich in Abschnitt 2.7.3.
Die abgebildete Verifikation betrifft die relative Luftfeuchte mit dem Prädiktantenkürzel rhtd. Gut zu
erkennen sind die Schwankungen im Tagesverlauf. Analog zur Windgeschwindigkeit ist die Performance des ECMWF in der Nacht besser als am Tag. Diese Variation paust sich in allen gezeigten Verifikationsmassen ab. Die in den Erläuterungen verwendeten Werte können in Tabelle 2.13 nachgelesen
werden.
45
2.7 Verifikation
Korrelation
Die Korrelation des ECMWF liegt bei 62%, jene des AUSTROMOS2 bei 73% und diejenige des A-UMOS
bei 82%. Die Variationen ECMWF mit einer 24-stündigen Periodizität pausen sich jedoch auch auf die
Vorhersagen der beiden MOS Systeme ab.
Bias, MAE und RMSE
Das A-UMOS ist auf den ausgewerteten Vorhersagen nahezu Biasfrei, während das ECMWF vorwiegend
in den Morgenstunden zu tiefe, in den Abendstunden dann zu hohe Vorhersagen liefert. Der RMSE im
A-UMOS konnte im Gegensatz zum ECMWF um rund 32% reduziert werden.
Markant sind die starken Tagesgänge aller Modelle. Das A-UMOS reduziert den MAE um rund 34%,
der Tagesverlauf wird jedoch kaum gedämpft und verläuft in allen Modellen gleich (Minima/Maxima
deckungsgleich).
Verfügbarkeit
Mit nur 1.1% fehlender Vorhersagen ist die Verfügbarkeit nahe am Maximalwert.
Verifikation glo: Globalstrahlung
Korrelation für glo 12Z
[0−1]
Bias für glo 12Z
1
−2
[W m ]
5
0.8
0.6
0
0.4
0.2
0
−5
+12h
+36h
+60h
+84h
+108
Mittlerer absoluter Fehler für glo 12Z
+132h
+12h
[W m −2 ]
200
+36h
+60h
+84h
Verfügbarkeit für glo 12Z
+108
+132h
[0%−100%]
100
A−UMOS
80
150
60
100
40
50
0
20
+12h
+36h
+60h
+84h
+108
+132h
0
Totally scored rows:
A−UMOS: 1169067.
+12h
+36h
+60h
+84h
+108
+132h
Abbildung 2.14: Verifikation der Globalstrahlung (glo in W m2 ). Eine allgemeine Erklärung der Graphen befindet
sich in Abschnitt 2.7.3.
46
Das Austrian Updateable Model Output Statistics System
Als letztes Verifikationsbeispiel sei hier die Globalstrahlung (direkte und diffuse Solarstrahlung der
oberen Hemisphähre) gezeigt. Die Vorhersage im A-UMOS gibt die Globalstrahlung für die gegebene
Vorhersagezeit aus. Der Verlauf der gezeigten Graphen unterscheidet sich stark von den zuvor gezeigten. Der auffälligste Punkt sind die ausgeprägten Sprünge in der Korrelation und der Verfügbarkeit.
Der Grund dafür sind die fehlenden Beobachtungen in der Nacht. Dies führt zu den starken Einbrüchen in der Verifikation. Die in den Erklärungen verwendeten Werte können bei Bedarf in Tabelle 2.13
eingesehen werden.
Korrelation
In der Nacht beträgt die Globalstrahlung im Mittel rund 0W m−2 . Die Einbrüche in der Korrelation
resultieren aus vernachlässigbaren absoluten Unterschieden von O(1W m−1 ) aber statistisch bedeutsamen relativen Unterschieden. Die Varianz der Beobachtungen in der Nacht wesentlich kleiner ist als
jene der A-UMOS Vorhersagen. Als Beispiel: für den 12Z Lauf für den Vorhersagezeitschritt +12h beträgt σA−U M OS = 2.97W m−2 , σBeo b = 0.75W m−2 und die Kovarianz der beiden COV ( ŷ, o) = 0.21.
0.21
Mittels Gleichung 2.5 ergibt sich daraus eine Korrelation von COR( ŷ, o) = 2.97·0.75
= 0.09.
Bias, MAE und RMSE
Da die Globalstrahlung in der Nacht 0W m−2 beträgt, am Tag jedoch über 800W m−2 ansteigen kann,
sind die mittleren absoluten Fehler kurz nach Sonnenaufgang oder kurz vor Sonnenuntergang entsprechend gering und untertags vom Betrag her wesentlich grösser. Der Bias ist mit weniger als 5W m−2
relativ zum MAE gesehen relativ klein, wirkt aufgrund der Darstellung lediglich etwas „gross“. Der
MAE liegt im A-UMOS auf 61W m−2 , der RMSE bei 107W m−2 . Eine Gegenüberstellung mit den Referenzsystemen ist leider nicht möglich, da diese keine äquivalente Grösse liefern.
Verfügbarkeit
Wie bereits angesprochen bricht die Verfügbarkeit Nachts durch die fehlenden Messungen stark ein.
Im Alltag ist dieses Problem jedoch nicht gravierend, da die Globalstrahlung nach Sonnenuntergang
auf 0W m−2 gesetzt werden kann. Dieser Vorgang wird im A-UMOS jedoch nicht durchgeführt.
47
2.7 Verifikation
2.7.4 multiple lineare Regression: Übersichtstabelle
Die nachfolgende Tabelle 2.8 zeigt die relative Änderung des Root Mean Square Error oder Quadratischer Fehler (RMSE) im A-UMOS gegenüber dem Referenzmodell AUSTROMOS2 sowie dem direkten
Modelloutput des ECMWF. Eine detaillierte Tabelle mit allen Verifikationsmassen befindet sich im Anhang in Tabelle 2.13 auf Seite 79.
RMSE
Prädiktant/Lauf
ECMWF
Verbesserung gegenüber
AUSTROMOS2 A-UMOS
EMCWF
AUSTROMOS2
ff10 00Z (1/10 m s−1 )
72.04
—
12.8
82%
—
mclotclo 00Z ([0/8 − 8/8])
3.84
—
2.29
40%
—
pre 00Z (1/10 mm)
26.6
—
21.91
17%
—
rhtd 00Z (%)
15.05
—
9.93
34%
—
spot 00Z (1/10 ◦ C)
39.95
—
20.78
47%
—
ssd 00Z (1/10 h)
10.42
—
8.86
15%
—
t5cm 00Z (1/10 ◦ C)
61.79
—
31.1
49%
—
tclo 00Z ([0/8 − 8/8])
2.94
—
2.1
29%
—
tdrh 00Z (1/10 ◦ C)
38.37
—
19.77
48%
—
tmax 00Z (1/10 C)
54.17
—
22.6
58%
—
tmin 00Z (1/10 ◦ C)
39.5
—
20.11
49%
—
u10 00Z (1/10 m s−1 )
21.97
—
13.92
37%
—
23.21
—
12.91
◦
−1
v10 00Z (1/10 m s )
Mittelwerte der Verbesserung des RMSE für 00UTC
44%
—
43%
—
ff10 12Z (1/10 m s−1 )
71.81
21.64
12.99
82%
40%
mclotclo 12Z ([0/8 − 8/8])
3.87
3.6
2.3
41%
36%
pre 12Z (1/10 mm)
26.41
39.08
21.24
20%
46%
rhtd 12Z (%)
15.02
12.5
10.08
33%
19%
◦
spot 12Z (1/10 C)
40.01
24.45
21.25
47%
13%
ssd 12Z (1/10 h)
10.45
—
8.89
15%
—
t5cm 12Z (1/10 ◦ C)
61.68
—
32.49
47%
—
tclo 12Z ([0/8 − 8/8])
2.96
2.68
2.11
29%
21%
tdrh 12Z (1/10 ◦ C)
38.2
28.41
20.12
47%
29%
tmax 12Z (1/10 ◦ C)
55.36
28.14
22.49
59%
20%
tmin 12Z (1/10 ◦ C)
39.37
23.57
21.06
47%
11%
u10 12Z (1/10 m s )
21.89
—
13.94
36%
—
v10 12Z (1/10 m s−1 )
23.22
—
12.89
44%
—
43%
25%
−1
Mittelwerte der Verbesserung des RMSE für 12UTC
Tabelle 2.8: zeigt die Verifikation des RMSE sowie die Verbesserung (Verb) des A-UMOS relativ zu
den anderen Modellen. Verb(RMSE)= 1 − RM S EA−U M OS /RM S E EC M W F beziehungsweise Verb(RMSE)= 1 −
RM S EA−U M OS /RM S EAUST ROM OS2 angegeben in [%]. Die Prädiktanten ffx, siw, glo und dd10uv sind nicht aufgeführt, da keine äquivalenten Vorhersagen aus den Referenzmodellen vorhanden sind.
48
Das Austrian Updateable Model Output Statistics System
2.7.5 lineare multiple Diskriminantenanalyse: Verifikationsmasse
Die folgenden Seiten zeigen einige Auswertungen für die Prädiktanten die durch die lineare multiple Diskriminantenanalyse (LMDA) des A-UMOS berechnet werden. Die Scores wurden getrennt für
den 00Z und den 12Z Lauf gerechnet, aus Platzgründen werden in dieser Arbeit aber lediglich einige
wenige Auswertungen für den 12Z Lauf gezeigt. Analog zu den Prädiktanten der MLR sind die Vorhersagen des AUSTROMOS2 (Verifikationssystem; altes MOS der ZAMG) lediglich für den 12Z Lauf
vorhanden, weswegen eine Gegenüberstellung für den 00Z Lauf nicht möglich ist. Eine Übersicht aller
Verifikationszahlen befindet sich in Tabelle 2.14 auf Seite 82. 1
Das Reliabilitydiagramm
Die Reliability (dt. „Zuverlässigkeit“) ist ein Mass für die Funktionszuverlässigkeit des Systems. Die
probabilistischen Vorhersagen des A-UMOS liegen im Wertebereich [0 − 100%]. Bei einer vorhergesagten Wahrscheinlichkeit von 50% tritt das vorhergesagte Ereignis bei einer perfekten Reliability in 50%
der Fälle auf, in 50% der Fälle nicht. Somit sagt die Reliability aus, wie verlässlich die Wahrscheinlichkeitsvorhersagen für einen gewissen Schwellwert (oder einen Bereich) tatsächlich sind.
Zur Auswertung wurden insgesamt 10 „bins“, also Wahrscheinlichkeitsbereiche, verwendet. Die
Schrittweite dabei ist jeweils 10% wobei das Resultat auf dem Mittelwert abgebildet ist (z.B.: zwischen 10% und 20% → Abbildung des Wertes bei 15%).
RE L IAB(z1 ; z2 ) =
#{z1 ≥ ŷi < z2 |oi = 1}
#{z1 ≥ ŷi < z2 }
(2.31)
Die beiden Werte z1 und z2 definieren dabei das untersuchte „bin“ (z.B. 0 − 10%). ŷi repräsentiert
die MOS Vorhersagen, oi die Beobachtungen. Der Ausdruck im Nenner (#{z1 ≥ ŷi < z2 }) beschreibt
die Anzahl aller Vorhersagen, welche innerhalb des definierten „bins“ liegen, der Ausdruck im Zähler
(#{z1 ≥ ŷi < z2 |oi = 1}) die Anzahl aller Vorhersagen, welche innerhalb des definierten „bins“ liegen
deren zugehörige Beobachtungen oi = 1 („Ereignis Ja“) ist.
Bei einer idealen Reliability liegt die Verifikation perfekt auf der Diagonalen zwischen den Punkten
(0, 0) und (1, 1). Liegen die Werte unterhalb der Diagonalen, so wird dieses „bin“ durch das MOS zu
oft vorhergesagt. Liegen die Werte über der Diagonalen, so tritt das Ereignis öfter ein als durch das
MOS vorhergesagt. Bei einer perfekten Vorhersage für beispielsweise 30%, tritt das Ereignis in der
Realiät in 3 von 10 Fällen ein (also ebenfalls genau 30%).
ROC Diagramm und ROC-AREA Plot
Das ROC Diagram zeigt die Trefferquote und die Fehlerrate des Systems. p j definiert dabei einen Wahrscheinlichkeitswert, der als Schwellwert für die Verifikation verwendet wird und liegt im Wertebereich
von [0 − 100%]. In den Auswertungen wurde dieser Schwellwert jeweils in 10% Schritten erhöht
(z j = (0%, 10%, ...90%, 100%)).
H I T (p j ) =
F (p j ) =
1
#{oi = 1 | ŷi ≥ z j }
#{oi = 1}
#{oi = 0 | ŷi ≥ z j }
#{oi = 0}
(2.32)
(2.33)
Die Windrichtung (dd10uv) ist nicht im Verifikationssystem enthalten, da sie erst in der Nachbearbeitung aus u10 und v10
erstellt wird.
49
2.7 Verifikation
ŷi sind die MOS Vorhersagen, oi die dazugehörigen Beobachtungen. oi = 1 definiert eine Beobachtung,
bei welcher das Ereignis eingetreten ist („Ereignis Ja“), oi = 0 entsprechend jene Beobachtungen mit
„Ereignis Nein“.
Die Hit-Rate ist das Verhältnis zwischen all jenen Fällen, bei welchen ein Ereignis beobachtet wurde
(oi = 1) und die Vorhersage ŷi über dem zu testenden Schwellwert z j lag (das Ereignis also für den
Schwellwert korrekt vorhergesagt wurde) gegen die Anzahl aller Beobachtungen mit „Ereignis Ja“. Im
besten Fall werden für einen beliebigen Schwellwert z j alle „Ereignisse Ja“ mit einer Wahrscheinlichkeit
ŷi ≥ z j vorhergesagt, wodurch sich eine Hitrate von 1.0 ergibt.
Die Fals-Alarm-Rate F (z j ) ist das Verhältnis all jener Fälle, bei welchen die Vorhersagen ŷi ≥ z j waren,
das Ereignis jedoch nicht eingetreten ist (oi = 0) gegen alle Beobachtungen mit „Ereignis Nein“. Im
besten Fall liegt nie eine Vorhersage ŷi über dem Schwellwert z j wordurch sich eine False-Alarm-Rate
von 0.0 ergibt.
Stiege die Hit-Rate also augenblicklich auf den Wert 1.0, während die False-Alarm-Rate für alle
Schwellwerte 0.0 wäre, so hätten wir die perfekte Vorhersage. Damit ergibt sich eine Flächte unterhalb
R z j =100%
der ROC-Kurve mit dem z =0% ROC(z j ) = 1.0. Die Fläche unter der ROC-Kurve ist also ein Mass
j
für die Qualität der Vorhersagen über die Gesamtheit z j = 0%, ..., 100%. Der schlechteste Wert, den
die Fläche einnehmen kann, ist 0.5. Fiele die Fläche unter diesen Wert, so würde ein Invertieren aller
Vorhersagen ( ŷi = 100% − ŷi ) die qualitativ bessere Vorhersage liefern.
Kontingenztabelle
Die Kontingenztabelle zeigt die Trefferquote des Systems basierend auf dem Schwellwert 50%. Eine
MOS Vorhersage gilt in der Verifikation immer dann als „Vorhersage Ja“, wenn das Ereignis mit einer
Wahrscheinlichkeit von ≥ 50% vorhergesagt wird.
Ereignis NEIN
(oi = 0)
Ereignis JA
(oi = 1)
A
B
FAR( ŷi < 50%; oi )
C
D
FAR( ŷi ≥ 50%; oi )
H I T ( ŷi ; oi = 0)
H I T ( ŷi ; oi = 1)
RATIO
Vorhersage Nein, ŷi < 50%
Vorhersage Ja, ŷi ≥ 50%
A = #{oi = 0 | ŷi < 50%}
(2.34)
B = #{oi = 1 | ŷi < 50%}
(2.35)
C = #{oi = 0 | ŷi ≥ 50%}
(2.36)
D = #{oi = 1 | ŷi ≥ 50%}
(2.37)
H I T ( ŷi ; oi = 0) =
A
A+ C
=
#{oi = 0 | ŷi < 50%}
#{oi = 0}
(2.38)
50
Das Austrian Updateable Model Output Statistics System
H I T ( ŷi ; oi = 1) =
D
B+D
FAR( ŷi < 50%; oi ) =
=
B
A+ B
C
FAR( ŷi ≥ 50%; oi ) =
C+D
#{oi = 1 | ŷi ≥ 50%}
=
=
#{oi = 1}
#{oi = 1 | ŷi < 50%}
#{ ŷi < 50%}
#{oi = 0 | ŷi ≥ 50%}
#{ ŷi ≥ 50%}
(2.39)
(2.40)
(2.41)
Achtung: Es ist zu beachten, dass FAR nicht identisch mit der im ROC-Diagram verwendeten FalseC
.
Alarm-Rate ist (s. Gleichung 2.33). Im Spezialfall z j = 50% wäre F entsprechend F (50%) = C+A
A ist auch bekannt als „True Negative“, B als „Flase Negative„, C als „False Positive“ und D als „True
Positive“. Die zusätzlich angegebene Ratio gibt an, wie das Verhältnis zwischen der Anzahl der Vorhersagen ŷi ≥ 50% zur Anzahl der Beobachtungen „Ereignis Ja“ (oi = 1) ist. Ist dieses Verhältnis > 0, so
ist die Anzahl der Modellvorhersagen mit „ ŷi ≥ 50%“ höher als die tatsächlich eingetretenen Beobachtungen für „Ereignis Ja“. Umgekehrt sagt ein negatives Verhältnis aus, dass die Anzahl der durch das
Modell vorhergesagten Fälle „ ŷi ≥ 50%“ geringer ist als beobachtet.
RAT IO = (
#{ ŷi ≥ 50%}
#{oi = 1}
− 1) · 100%
(2.42)
Gesamttrefferquote und Brier-Score
Die Gesamttrefferquote (engl. „Percent Correct“) bildet sich auf folgende Weise aus der Kontingenztabelle.
PC =
A+ D
A+ B + C + D
=
#{oi = 0 | ŷi < 50%} + #{oi = 1 | ŷi ≥ 50%}
#{oi = 0} + #{oi = 1}
(2.43)
Und der Brier-Score ...
BS =
n
1 X
2
·
ŷi − oi
n i=1
(2.44)
... wobei hier die Vorhersage ŷi nicht in Prozent, sondern als Wert zwischen [0.0, 1.0] in die Berechnung einfliesst. Die Gesamttrefferquote kann Werte von [0 − 1] annehmen. Bei einer perfekten Vorhersage ergibt sich ein Wert P C = 1.0, da dann B + C = 0 und daraus resultierend P C = (A+ D)/(A+ D) =
1.0. Der Brier Score ist ebenfalls zwischen [0 − 1] definiert. Bei einer perfekten Vorhersage ist ŷi immer dann 1.0 (100%), wenn das Ereignis eintritt (oi = 1) und ŷi = 0 wenn das Ereignis nicht eintritt
(oi = 0). In diesem Fall nimmt der Brier Score den Wert 0.0 an.
Theoretisch mögliche Fälle
Die theoretische Zahl an möglichen Fällen in der Verifikation setzt sich zusammen aus der Anzahl
der gescorten Tage, der Anzahl an Stationen sowie der Anzahl der Vorhersagezeitschritte. Da die Anzahl der Vorhersagezeitschritte nicht bei allen Prädiktanten identisch ist, kann die Zahl zwischen den
verschiedenen Vorhersagegrössen variieren. Die Auswertungen basieren ebenfalls auf der ValidierungsStationsliste (s. Abbildung 2.9) mit insgesamt 145 Stationen innerhalb Österreichs.
2.7 Verifikation
51
Verfügbarkeit der Vorhersagen
Die Verfügbarkeit wird gemäss Formel 2.25 berechnet werden. Achtung: die Verfügbarkeit zeigt die
tatsächliche Verfügbarkeit der Vorhersagen des entsprechenden Modells an. Die Verfügbarkeit ist nicht
identisch mit den Anzahl Fällen in der Kontingenztabelle dividiert durch die „Anzahl der theoretisch
möglichen Fälle“. In die Kontingenztabellen fliessen nur jene Fälle ein, bei denen sowohl die Beobachtung als auch die Vorhersage des Modells vorhanden sind. Die Bedingung für die Verfügbarkeit ist
lediglich das Vorhandensein der Modellvorhersage.
2.7.6 lineare multiple Diskriminantenanalyse: Resultate
Erklärung der Abbildungen
Die Grafiken auf den folgenden Seiten zeigen die Scores einiger Prädiktanten und umfassen „Reliability
(Reliability diagram, o.l.)“, „Hit-/False alarm Rate (ROC diagram, o.r.)“, „Datensatzgrösse (Sample used
for reliability diagram, u.l.)“ sowie „die Fläche unterhalb der ROC Kurve (ROC AREA, u.r.)“, welche
nach den Vorhersagezeiten aufgeschlüsselt ist.
Auf die Grafiken folgen jeweils einige zusätzliche Scores in „Tabellenform“. Diese umfassen neben
der Hit-/False-Alarm Rate die Verfügbarkeit (Availability), die Gesamttrefferquote (Percent Correct)
sowie den Brier-Score. Wird in den folgenden Abschnitten die Abkürzung „FCST“ verwendet, so sind
damit die Vorhersagen der verschiedenen Modelle gemeint. Die Abkürzung „OBS“ steht jeweils für die
Beobachtungen. Eine genaue Beschreibung der Scores befindet sich im Abschnitt 2.7.5.
Graphen : in rot die Auswertungen für das A-UMOS und in blau jene für das AUSTROMOS2. Ist für
einen Prädiktanten keine äquivalente Modellgrösse dem AUSTROMOS2 vorhanden, so fehlt der
entsprechende Graph.
Zeitschritte : der Niederschlag (pop) ist über den gesamten Vorhersagezeitraum 6-stündig, die restlichen Prädiktanten sind bis +72h immer 3-stündig, danach ebenfalls 6-stündig bis +144h (s.
Tabelle 2.2). Die Vorhersagen des AUSTROMOS2 sind jeweils von +12h bis +120h verfügbar,
jedoch lediglich 6-stündig über den gesamten Zeitraum.
52
Das Austrian Updateable Model Output Statistics System
Verifikation pop1 (Wahrscheinlichkeit für Niederschlag mindestens 0.1mm): Grafik
Reliability Diagramm
Praediktant: pop1, 12UTC−run
ROC Diagramm
Praediktant: pop1, 12UTC−run
1
1
A−UMOS
AUSTROMOS2
0.8
Hit−Rate (HIT)
Reliability
0.8
0.6
0.4
0.2
0.6
0.4
0.2
nmin: 100
0
0.5
Bins in 10% Schritten
0
1
Anzahl Faelle in den Bins
Anzahl verwendete Faelle
5
x 10 Paediktant: pop1, 12UTC−run
6
6
4
4
2
0
0.2
0.4
0.6
0.8
Bins in 10% Schritten
1
0.5
False−Alarm−Rate (F)
1
ROC Flaeche
Praediktant: pop1, 12UTC−run
1
0.8
2
0
0
4
x 10
8
Flaeche
0
0.6
0.4
0.2
0
0
+0h
+24h +48h +72h +96h 120h +144h
Vorhersagezeitschritt
Anzahl der theoretisch moeglichen Faelle: 1900080
488379
348636
58.3%
FAR(0)
FAR(1)
4%
3.
10
%
.3
34
HIT(1)
7.5%
84.7%
FAR(1)
62946
HIT(0)
46.9%
771116
61.2%
104252
OBS(1)
FCST(0)
92155
FAR(0)
OBS(0)
FCST(1)
10.2%
HIT(1)
42035
71.3%
370262
HIT(0)
FAR(1)
3%
HIT(1)
29.6%
1.
41.3%
173530
FAR(0)
−4
94.5%
73112
16.5%
80.1%
1253636 246913
ECMWF
OBS(1)
FCST(0)
OBS(1)
HIT(0)
FCST(0)
FCST(1)
AUSTROMOS2
OBS(0)
FCST(1)
A−UMOS
OBS(0)
Availability:
99.27 %
Availability:
34.56 %
Availability:
95.62 %
Percent Correct:
81.68 %
Percent Correct:
77.95 %
Percent Correct:
67.01 %
Brier−Score:
0.132
Brier−Score:
0.159
Abbildung 2.15: Verifikation des Prädiktanten pop1, Wahrscheinlichkeit für Niederschlag ≥ 0.1mm. Eine allgemeine Erklärung der hier gezeigten Graphen befindet sich unter dem Abschnitt 2.7.6, genauere Erläuterungen zu
dieser Abbildung auf der nächsten Seite.
2.7 Verifikation
53
Verifikation pop1 (Wahrscheinlichkeit für Niederschlag mindestens 0.1mm): Erläuterungen
Die folgenden Erklärungen gelten der Abbildung 2.15 auf Seite 52.
Reliability
Gut zu erkennen ist die starke Reliability der Vorhersagen des im A-UMOS verwendeten statistischen
Modells. Bei den hohen Wahrscheinlichkeiten (> 80%) zeichnet sich eine leichte Untervorhersage des
A-UMOS ab.
ROC Diagram
Im Gegensatz zu den Vorhersagen des AUSTROMOS2 steigt die False-Alarm-Rate (F ) des A-UMOS
weniger rasch an. Das A-UMOS zeigt jedoch eine etwas geringere Hit-Rate. Dasselbe zeichnet sich
auch in der Kontingenztabelle im unteren Teil der Abbildung 2.15 ab.
ROC Fläche
Die Fläche unter der ROC-Kurve ist für die verschiedenen Vorhersagezeitschritte relativ konstant. Eine leichte Abnahme mit zunehmender Vorhersagezeit ist zu erwarten und hängt von der ebenfalls
abnehmenden Vorhersagegüte des numerischen Modells (ECMWF) ab.
Kontingenztabelle
Betrachtet man die „Percent Correct“ Werte der jeweiligen Modelle, schneidet das A-UMOS am Besten
ab. Die Trefferquote der Vorhersagen „Ereignis Ja“ liegen jedoch mit 41.3% unter den Trefferquoten des AUSTROMOS2 und des ECMWF. Das A-UMOS ist in der Vorhersage etwas konservativ und
prognostiziert tendenziell zu oft „Ereignis Nein“. Dies widerspiegelt sich auch in die „Ratio“ der Kontingenztabelle. Während AUSTROMOS2 und ECMWF mit 34.3%/103.4% deutlich über 0% liegen, ist
die Ratio des A-UMOS mit −41.3% deutlich tiefer. Das Ereignis tritt also häufiger auf, als das A-UMOS
dies vorhersagt. Das numerische Modell jedoch hat mehr als doppelt so viele Vorhersagen mit Niederschlägen ≥ 0.1mm wie die durch die Beobachtungen repräsentierte Realität. Betrachtet man lediglich
die Absolutwerte der Ratios, so liegen die beiden MOS Systeme näher an der Realität als das ECMWF,
jedoch in unterschiedlichen Richtungen. Die etwas konservativere Vorhersage des A-UMOS führt jedoch auch zu einer wesentlich tieferen False-Alarm-Rate, die beim A-UMOS mit 29.6% markant tiefer
liegt als die der Referenzmodelle (46.9%/ 58.3%).
Ebenfalls konnte die Verfügbarkeit durch das A-UMOS stark gesteigert werden. Mit 99.3% sind nur
wenige fehlende Vorhersagen vorhanden. Die Tatsache, dass das ECMWF eine Verfügbarkeit unter
100% hat, basiert auf einem Software-Bug. Dieser wurde erst nach den Verifikationsläufen behoben,
die Korrekturen konnten leider nicht mehr in die Auswertungen einfliessen.
54
Das Austrian Updateable Model Output Statistics System
Verifikation pop4 (Wahrscheinlichkeit für Niederschlag mindestens 10mm): Grafik
Reliability Diagramm
Praediktant: pop4, 12UTC−run
ROC Diagramm
Praediktant: pop4, 12UTC−run
1
1
A−UMOS
AUSTROMOS2
0.8
Hit−Rate (HIT)
Reliability
0.8
0.6
0.4
0.2
0.6
0.4
0.2
nmin: 100
0
0
0.5
Bins in 10% Schritten
0
1
0.5
False−Alarm−Rate (F)
1
ROC Flaeche
Praediktant: pop4, 12UTC−run
4
x 10
15
1
0.8
10
10
5
Flaeche
Anzahl Faelle in den Bins
Anzahl verwendete Faelle
5
x 10 Paediktant: pop4, 12UTC−run
0
0.6
0.4
5
0.2
0
0
0.2
0.4
0.6
0.8
Bins in 10% Schritten
1
0
0
+0h
+24h +48h +72h +96h 120h +144h
Vorhersagezeitschritt
Anzahl der theoretisch moeglichen Faelle: 1900080
15351
5883
72.3%
FAR(0)
FAR(1)
−2
1.
3%
1%
7%
4.
2.
12
−6
HIT(1)
1.3%
21.8%
21105
HIT(0)
FAR(1)
1626353
99.1%
84.4%
OBS(1)
FCST(0)
3006
FAR(0)
OBS(0)
FCST(1)
16207
HIT(1)
1.0%
34.8%
5623
HIT(0)
FAR(1)
580042
97.3%
50.2%
OBS(1)
FCST(0)
4864
FAR(0)
ECMWF
OBS(0)
FCST(1)
4895
HIT(1)
1.5%
17.9%
22320
HIT(0)
1451702
99.7%
FCST(0)
AUSTROMOS2
OBS(1)
FCST(1)
A−UMOS
OBS(0)
Availability:
84.98 %
Availability:
34.31 %
Availability:
95.62 %
Percent Correct:
98.17 %
Percent Correct:
96.39 %
Percent Correct:
97.82 %
Brier−Score:
0.016
Brier−Score:
0.034
Abbildung 2.16: Verifikation des Prädiktanten pop4, Wahrscheinlichkeit für Niederschlag ≥ 10mm. Eine allgemeine Erklärung der hier gezeigten Graphen befindet sich unter dem Abschnitt 2.7.6, genauere Erläuterungen zu
dieser Abbildung auf der nächsten Seite.
2.7 Verifikation
55
Verifikation pop4 (Wahrscheinlichkeit für Niederschlag mindestens 10mm): Erläuterungen
Die folgenden Erklärungen gelten der Abbildung 2.16 auf Seite 54. Interessant an dieser Auswertung
ist der Vergleich mit jener der Klasse pop1 auf Seite 52 (s. Abbildung 2.16), da pop4 dieselbe Vorhersagegrösse darstellt, jedoch für einen wesentlich höheren Schwellwert von ≥ 10mm gilt. Ereignisse
mit mehr als ≥ 10mm sind wesentlich seltener als Ereignisse mit Niederschlagsmengen ≥ 0.1mm. Aufgrund der geringen Stichprobengrösse sind diese Events durch die statistischen Modelle schwieriger
vorherzusagen.
Reliability
Analog zur Klasse „Wahrscheinlichkeit für Niederschlag ≥ 0.1mm“ (siehe Seite 52) zeigt sich die starke
Verbesserung der Reliability im Vergleich zum AUSTROMOS2. Es zeigt sich jedoch eine starke Untervorhersage durch das A-UMOS bereits ab einer Vorhersagewahrscheinlichkeit von > 20%. Dies hängt
damit zusammen, dass das Ereignis wesentlich seltener ist und dadurch in den Trainingsdatensätzen
nicht sehr häufig vorkommt. Das A-UMOS hat deshalb mehr Mühe, diese Ereignisse korrekt zu klassifizieren. Dies ist zum Teil ein Problem des „updateable“ Verfahrens des A-UMOS. Nach einer gewissen
Zeit wird der Trainingsdatensatz der Vorgängerversion nicht mehr berücksichtigt, wodurch ein Teil der
historischen Daten verloren geht.
ROC Fläche
Wie Anhand des ROC Diagramms zu erwarten, ist die Fläche unterhalb der ROC Kurve relativ niedrig.
Der schlechteste zu erwartende Wert dieser Fläche liegt bei 0.5.
Kontingenztabelle
Analog zur Auswertung für „Wahrscheinlichkeit für Niederschlag ≥ 0.1mm“ist die Verfügbarkeit des
A-UMOS wesentlich höher als jene des AUSTROMOS2. Es zeigen sich jedoch auch wieder dieselben
Probleme. Durch die etwas konservative Vorhersage des A-UMOS ist die Gesamttrefferquote besser, bei
der Vorhersage für „pop4“ liegt die Hit-Rate jedoch mit lediglich 17.9% unter jener des AUSTROMOS2
(34.8%) und jener des ECMWF (21.8%). Die Stärke des konservativen Verhaltens zeigt sich in der
False-Alarm-Rate, welche beim A-UMOS mit 50.2% mehr als 20% unter jenen der anderen beiden
Modelle liegt.
Das Ratio des A-UMOS ist erneut < 0%, was einer Untervorhersage entspricht. Den besten Score
liefert hier das ECMWF mit einer Untervorhersage von lediglich 21.3% währen das AUSTROMOS2
mehr als doppelt so viele Vorhersagen für „Wahrscheinlichkeit für Niederschlag ≥ 10mm“ liefert, wie
die Beobachtungen widergeben.
56
Das Austrian Updateable Model Output Statistics System
Verifikation wfesns (Wahrscheinlichkeit für festen Niederschlag): Grafik
ROC Diagramm
Praediktant: wfesns, 12UTC−run
Reliability Diagramm
Praediktant: wfesns, 12UTC−run
1
1
A−UMOS
AUSTROMOS2
0.8
Hit−Rate (HIT)
Reliability
0.8
0.6
0.4
0.2
0.6
0.4
0.2
nmin: 100
0
0.5
Bins in 10% Schritten
0
1
Anzahl Faelle in den Bins
Anzahl verwendete Faelle
4
x 10 Paediktant: wfesns, 12UTC−run
8000
6
6000
4
4000
2
0
0.2
0.5
False−Alarm−Rate (F)
1
1
0.8
2000
0
0
ROC Flaeche
Praediktant: wfesns, 12UTC−run
Flaeche
0
0.4
0.6
0.8
Bins in 10% Schritten
1
0.6
0.4
0.2
0
0
+0h
+24h +48h +72h +96h 120h +144h
Vorhersagezeitschritt
Anzahl der theoretisch moeglichen Faelle: 2810808
0
0
NaN%
FAR(0)
FAR(1)
%
%
.8
aN
N
21
9%
0.
−1
HIT(1)
NaN%
NaN%
FAR(1)
0
HIT(0)
55.2%
0
NaN%
6704
OBS(1)
FCST(0)
8252
FAR(0)
OBS(0)
FCST(1)
5.2%
HIT(1)
5577
54.6%
FAR(1)
100902
HIT(0)
35.5%
OBS(1)
92.4%
12366
OBS(0)
FCST(0)
6811
FAR(0)
ECMWF
FCST(1)
8.9%
HIT(1)
9167
57.4%
93438
HIT(0)
OBS(1)
93.2%
OBS(0)
FCST(0)
AUSTROMOS2
FCST(1)
A−UMOS
Availability:
11.48 %
Availability:
17.07 %
Availability:
0.00 %
Percent Correct:
86.88 %
Percent Correct:
88.61 %
Percent Correct:
NaN %
Brier−Score:
0.089
Brier−Score:
0.080
Abbildung 2.17: Verifikation des Prädiktanten wfesns, Wahrscheinlichkeit für festen Niederschlag. N aN Werte
bedeuten, dass die entsprechenden Werte aufgrund fehlender Fälle nicht berechnet werden konnten. Eine allgemeine Erklärung der hier gezeigten Graphen befindet sich unter dem Abschnitt 2.7.6, genauere Erläuterungen zu
dieser Abbildung auf der nächsten Seite.
2.7 Verifikation
57
Verifikation wfesns (Wahrscheinlichkeit für festen Niederschlag): Erläuterungen
Die auf dieser Seite folgenden Erläuterungen gehören zur Auswertung in Abbildung 2.17 auf Seite 56
und beschreiben die Verifikation für die Wahrscheinlichkeit für festen Niederschlag. Als fester Niederschlag gilt neben Schnee auch Graupel, Hagel oder gefrierender Sprühregen (engl. „Drizzle“).
Reliability
Erneut zeigt sich die Stärke der verwendeten statistischen Methode. Das A-UMOS liefert eine stärkere
und konsistentere Reliability als das Referenzsystem (AUSTROMOS2). Aufgrund der Tatsache, dass
fester Niederschlag bei tiefer gelegenen Stationen ein eher seltenes Ereignis ist (betrachtet über das
gesamte Jahr) erklärt sich die Schwierigkeit des A-UMOS, hohe Wahrscheinlichkeiten genügend oft
vorherzusagen. Es zeigt sich eine Untervorhersage ab Wahrscheinlichkeiten von > 60%, welche bei
höheren Wahrscheinlichkeiten noch zunimmt.
ROC Diagram
Die beiden Kurven des A-UMOS und des AUSTROMOS2 sind hier beinahe deckungsgleich, jedoch
nimmt die Hit-Rate des A-UMOS etwas rascher zu, während die False-Alarm-Rate des A-UMOS bis auf
den letzten Wert bei 90% leicht unter jenen des AUSTROMOS2 liegt.
Kontingenztabelle
Im Gegensatz zu pop4 (Niederschlag ≥ 10mm) ist fester Niederschlag kein „extremes“ Ereignis und ist
deshalb einfacher vorhersagbar. Dies zeigt sich vor allem in den Ratios der beiden MOS Systeme. Während das eher konservative A-UMOS eine leichte Untervorhersage von 10.9% aufweist, liefert das AUSTROMOS mit +20.8% eine Übervorhersage. Betrachtet man die Absolutwerte der Ratios, so schneidet
das A-UMOS besser ab als das Referenzsystem. Dasselbe gilt für die Hit-Rate und die False-Alarm-Rate,
jedoch nicht für die Verfügbarkeit. Die tiefe Verfügbarkeit von lediglich 11.48% lässt sich auf die Anzahl der Beobachtungen zurückführen. Nur wenige Stationen liefern diese Information, wordurch der
Grossteil der Trainingsdatensätze gar keine oder nicht genügend Fälle besitzen, um die LMDA anzuwenden. Durch das „updateable“ System werden die historischen Daten alter Modellversionen nach
einer gewissen Zeit ignoriert (siehe Abschnitt 1.3), wodurch die Anzahl der Fälle in den Trainingsdatensätzen nicht stetig ansteigt. Dies ist der Vorteil des AUSTROMOS2 mit einem Trainingsdatensatz
über mehr als 6 Jahre und entsprechend mehr Beobachtungen in den Trainingsdatensätzen.
58
Das Austrian Updateable Model Output Statistics System
Verifikation aktww7 (Wahrscheinlichkeit für Regen): Grafik
Reliability Diagramm
Praediktant: aktww7, 12UTC−run
1
A−UMOS
ROC Diagramm
Praediktant: aktww7, 12UTC−run
1
0.8
Hit−Rate (HIT)
Reliability
0.8
0.6
0.4
0.2
0.6
0.4
0.2
nmin: 100
0
0
0.5
Bins in 10% Schritten
0
1
Anzahl verwendete Faelle
Paediktant: aktww7, 12UTC−run
Flaeche
Anzahl Faelle in den Bins
0.8
0.5
10000
0
5000
−0.5
0.2
0.4
0.6
0.8
Bins in 10% Schritten
1
1
15000
0
0.5
False−Alarm−Rate (F)
ROC Flaeche
Praediktant: aktww7, 12UTC−run
1
0
0
1
0.6
0.4
0.2
−1
0
+0h
+24h +48h +72h +96h 120h +144h
Vorhersagezeitschritt
Anzahl der theoretisch moeglichen Faelle: 2810808
0
0
NaN%
FAR(0)
FAR(1)
%
aN
N
0%
%
aN
N
5.
−6
HIT(1)
NaN%
NaN%
FAR(1)
0
HIT(0)
NaN%
0
NaN%
0
OBS(1)
FCST(0)
0
FAR(0)
OBS(0)
FCST(1)
NaN%
HIT(1)
0
NaN%
FAR(1)
0
HIT(0)
36.9%
OBS(1)
NaN%
1241
OBS(0)
FCST(0)
726
FAR(0)
ECMWF
FCST(1)
15.3%
HIT(1)
4384
22.1%
24202
HIT(0)
OBS(1)
97.1%
OBS(0)
FCST(0)
AUSTROMOS2
FCST(1)
A−UMOS
Availability:
2.32 %
Availability:
0.00 %
Availability:
0.00 %
Percent Correct:
83.27 %
Percent Correct:
NaN %
Percent Correct:
NaN %
Brier−Score:
0.114
Brier−Score:
NaN
Abbildung 2.18: Verifikation des Prädiktanten wfesns, Wahrscheinlichkeit für Regen. N aN Werte bedeuten, dass
die entsprechenden Werte aufgrund fehlender Fälle nicht berechnet werden konnten. Eine allgemeine Erklärung
der hier gezeigten Graphen befindet sich unter dem Abschnitt 2.7.6, genauere Erläuterungen zu dieser Abbildung
auf der nächsten Seite.
2.7 Verifikation
59
Verifikation aktww7 (Wahrscheinlichkeit für Regen): Erläuterungen
In der Meteorologie werden beobachtete Ereignisse im sogenannten SYNOP-Code verschlüsselt. Der
Code umfasst insgesamt 10 verschiedene Ereignisklassen zur Beschreibung des aktuellen Wetters, welche im A-UMOS durch die aktww Prädiktanten vorhergesagt werden. Die Prädiktantenklasse aktww7
steht dabei für das „aktuelle Wetter 6“ oder das Ereignis „Regen“. Ereignis „aktww7 Ja“ steht also für
Regen, wobei irrelevant ist, wie viel Niederschlag fällt (es geht also nicht um die Niederschlagsmenge). Andere Klassen für “aktuelles Wetter“ wären beispielsweise Schauer, Schnee, Nieseln oder Dunst
(s. Tabelle 2.1). Diese Daten werden durch einen Beobachter erhoben (optische Klassifizierung des
aktuellen Wetters). Die folgenden Erläuterungen gehören zu Abbildung 2.18 auf Seite 58.
Kontingenztabelle
Zu Beginn sei hier die Kontingenztabelle erläutert. Was auffällt ist die sehr tiefe Verfügbarkeit. Das
Problem der heutigen Zeit ist, dass es sehr teuer geworden ist einen Beobachter zu beschäftigen.
Deshalb wurden die Beobachtungen an vielen Standorten eingestellt. Standorte, welche zuverlässig
Beobachtungen durchführen, sind heute vor allem noch Flughäfen, da diese Daten für die Piloten von
hoher Wichtigkeit sind. Die Ratio zeigt wieder die bekannte konservative Haltung des A-UMOS und
die daraus resultierende Untervorhersage des Ereignisses. Die Hit-Rate und False-Alarm-Rate ist mit
den Auswertungen auf den vorherigen Seiten vergleichbar. Leider fehlen hier die Referenzsysteme, da
das AUSTROMOS2 keine Vorhersagen für „Aktuelles Wetter“ liefert und das ECMWF ebenfalls keine
Vorhersagegrösse beinhaltet, welche die Klassifikation möglich machen würde.
ROC Diagram
Aufgrund der fehlenden Referenz lässt sich darüber leider nur wenig sagen. Es ist jedoch erkennbar,
dass die False-Alarm-Rate nie über 50% ansteigt, die Hit-Rate hingegen bis über 90%.
ROC Fläche
Hier zeigt sich das Problem der fehlenden Beobachtungen. Ein Unterbruch in der Kurve zeigt einen
Vorhersagezeitschritt, bei welchem keine ROC Analyse durchgeführt werden konnte, da keine Paare
Vorhersage/Beobachtung vorhanden waren. Diese Lücken befinden sich ausschliesslich bei Vorhersagezeitschritten von (n · 24h + 12h), also bei +12h, +36h, +60h, .... Da diese Analyse für den 12Z
ECMWF Modellauf gilt, wiederspiegeln diese Vorhersagezeitschritte jeweils die Nachtphasen. Wie es
scheint, sind die Beobachter an den wenigen noch besetzten Stationen zu normalen Arbeitszeiten von
Sonnenaufgang bis Sonnenuntergang angestellt, wodurch während der Nacht keine Beobachtungen
gemacht werden. Dieses Problem zeigt sich im A-UMOS für beinahe alle Beobachtunge, die durch
einen Beobachter aufgenommen und nicht durch automatische Systeme abgeleitet werden können.
60
Das Austrian Updateable Model Output Statistics System
2.7.7 lineare multiple Diskriminantenanalyse: Übersichtstabelle
Es folgt Tabelle 2.10, welche die relativen Änderungen der Gesamttrefferquote („Percent Correct, PC“)
und des Brier-Scores zeigen. Die Tabelle 2.14 mit den detaillierten Verifikationsmassen befindet sich
aus platztechnischen Gründen im Anhang auf Seite 82
Gesamttrefferquote
Prädiktant/Lauf
ECMWF
A2
AU
Verb.
EMCWF
Brier-Score
A2
A2
AU
Verb.
A2
pop1 00UTC
67.0
—
81.5
14.48
—
—
0.133
—
pop2 00UTC
82.2
—
89.4
7.23
—
—
0.084
—
pop3 00UTC
94.1
—
96.1
2.00
—
—
0.034
—
pop4 00UTC
97.8
—
98.2
0.35
—
—
0.017
—
pop5 00UTC
99.5
—
99.3
-0.28
—
—
0.007
—
wconv 00UTC
—
—
91.0
—
—
—
0.066
—
wfesns 00UTC
—
—
86.7
—
—
—
0.090
—
wgew 00UTC
—
—
97.2
—
—
—
0.024
—
wsp1 00UTC
95.4
—
97.1
1.78
—
—
0.024
—
wsp2 00UTC
99.2
—
98.1
-1.12
—
—
0.017
—
wsp3 00UTC
99.8
—
98.5
-1.33
—
—
0.013
—
Mittelwert 00UTC
91.9
—
89.9
2.89
—
—
0.068
—
pop1 12UTC
67.0
78.0
81.7
14.67
3.73
0.159
0.132
16.8
pop2 12UTC
82.4
85.3
89.4
7.01
4.17
0.104
0.083
20.5
pop3 12UTC
94.0
—
96.1
2.02
—
—
0.033
—
pop4 12UTC
97.8
96.4
98.2
0.35
1.78
0.034
0.016
52.9
pop5 12UTC
99.6
—
99.3
-0.26
—
—
0.007
—
wconv 12UTC
—
82.2
91.0
—
8.83
0.131
0.066
49.7
wfesns 12UTC
—
88.6
86.9
—
-1.73
0.080
0.090
-11.7
wgew 12UTC
—
92.4
97.2
—
4.77
0.061
0.024
60.8
wsp1 12UTC
95.4
93.4
97.2
1.75
3.82
0.053
0.024
55.2
wsp2 12UTC
99.2
—
98.1
-1.09
—
—
0.016
—
wsp3 12UTC
99.8
—
98.5
-1.31
—
—
0.013
—
Mittelwert 12UTC
91.9
88.0
90.0
2.89
3.62
0.089
0.068
34.9
Tabelle 2.10: zeigt die Gesamttrefferquote (PC in [%]) sowie den Brier-Score (BS in [0 − 1]) der Modelle.
Aus Platzgründen abgekürzt: AU = A-UMOS, A2 = AUSTROMOS2, Verb.= Verbesserung gegenüber den Modellen. Vergleich für PC gegen ECMWF und AUSTROMOS2 möglich, wobei Verb(PC)= P CA−U M OS − P C EC M W F
bez. Verbesserung= P CA−U M OS − P CAUST ROM OS2 . Vergleich beim Brier-Score nur gegen AUSTROMOS2 möglich.
Verb(BS)= 1 − BSA−U M OS /BSAUST ROM OS2 angegeben in [%]. Prädiktant aktww ist nicht aufgeführt da, keine äquivalenten Vorhersagen aus den Referenzmodellen vorhanden sind.
2.8 Diskussion
2.8
61
Diskussion
Das Ziel des Austrian Updateable Model Output Statistics (A-UMOS) Projektes war das Entwickeln
eines MOS Systems um das bestehende AUSTROMOS2 der ZAMG abzulösen. Dies bedingt natürlich,
dass die Performance des neuen Systems über jener des alten Modells liegt.
Das System als Ganzes läuft seit Anfang 2011 operationell, seit August 2011 in der finalen Version und
dies bis heute ohne erkennbare Fehler. Das schlanke Design ermöglicht einen Betrieb des kompletten
A-UMOS auf einem herkömmlichen Desktop-PC. Ein 2.6GHz Dual-Core Rechner auf einer 64bi t Linux Architektur mit 8GB Arbeitsspeicher und 200GB Harddisk (exkl. Backup) liefert die Vorhersage
aller Prädiktanten und Stationen in weniger als 90 Minuten pro Vorhersagelauf. Die reduzierte Information in den SSCPs ermöglicht jedoch nur die Verwendung einiger weniger statistischen Methoden.
Betrachtet man die Scores der MLR, so sind die Vorteile des Softwaredesigns sicher stärker als die Nachteile durch die SSCP-Form der Trainingsdaten. Beim Klassifizierungsalgorithmus (LMDA) sind einige
Probleme erkennbar, möglicherweise könnte die Qualität des A-UMOS noch durch andere statistische
Methoden gesteigert werden, zur Entscheidung müsste der Einfluss des „updateable“-Schemas noch
genau untersucht werden. Ein ebenfalls markantes Problem sind kleine Stichprobengrössen, besonders bei seltenen Ereignissen (z.B. in der höchsten Niederschlagsklasse). In solchen Fällen kann das
statistische Modelle nicht angewendet werden. Eine mögliche Variante, diese Probleme zu umgehen,
wäre die Verwendung eines Reforecast Datensatzes (Hamill et al. 2006). Aufgrund der Tatsache, dass
nur eine Modellversion des numerischen Modells über 30 Jahre Trainingsdaten liefert führt dazu, dass
das updateable-Schema komplett überflüssig wird. Zudem können die Beobachtungen (falls vorhanden) aus über 30 Jahren verwendet werden, wodurch die Stichprobenzahl in den Trainingsdaten stark
erhöht werden könnte.
Für die statistischen Methoden wurde jeweils ein Subset von insgesamt 145 Stationen aus dem AUMOS über einen Zeitraum von 546 Tagen zwischen dem 01.01.2010 und dem 31.07.2011 ausgewertet. Es ist zu beachten, dass die Vorhersagen bis zum 07.01.2011 auf einem Testdatensatz gerechnet
wurden, welcher nicht unabhängig vom Trainingsdatensatz war. Die Vorhersagen nach dem 07.01.2011
stammen aus dem operationellen System und basieren somit auf einem unabhängigen Trainingsdatensatz. Aufgrund des Umfangs der ausgewerteten Daten sind die Verifikationsmasse aber dennoch
aussagekräftig.
Die MLR liefert im A-UMOS insgesamt 16 deterministische Vorhersagegrössen (s. Tabelle 2.1), welche
gegen den direkte Modelloutput des numerischen Modells (DMO) des ECMWF Modells sowie gegen
das Referenzsystem AUSTROMOS2 ausgewertet wurden. Die detaillierten Auswertungen befinden sich
in der Tabelle 2.13. Tabelle 2.8 liefert die relative Änderung des RMSE (Root Mean Square Error oder
Quadratischer Fehler) gegen die beiden Referenzsysteme.
Der RMSE konnte bei allen deterministischen Grössen gegenüber beiden Referenzsystemen reduziert
werden. Im Durchschnitt um 43% gegenüber dem ECMWF und 25% gegenüber dem AUSTROMOS2.
Bei den „Temperatur-Prädiktanten“ (namentlich spot, t5cm, tdrh, tmax, tmin) liegt der RMSE im AUMOS im Mittel bei 2.32◦ C und konnte gegenüber dem ECMWF um 50% reduziert werden. Dies ist
vergleichbar mit anderen MOS Systemen. Die Abbildungen 2.19 und 2.20 zeigen den RMSE der 2m
Temperatur eines MOS Systems der Universität Basel (Müller 2011), welches auf einem Regionalmodell mit 3km bzw. einer Version mit 12km horizontaler Auflösung basiert. Die Auswertung zeigt eine
Reduktion des RMSE um rund 30 − 35% bei einer Auswertung über alle 1150 europäischen Stationen
(s. Abbildung 2.19) und bei rund 40 − 50% (s. Abbildung 2.20) bei einer Auswertung der Stationen in
komplexem Terrain (180 Stationen). Die Verifikation des A-UMOS basiert auf den 145 Stationen der
Validierungs-Stationsliste, welche alle in Österreich und somit ebenfalls mehrheitlich in komplexem
62
Das Austrian Updateable Model Output Statistics System
Terrain liegen (s. Abbildung 2.9). Die beiden MOS Systeme verbessern den RMSE gegenüber dem verwendeten DMO etwa gleich stark. Der DMO weist bei allen Prädiktanten einen Tagesgang auf, welcher
in der Korrelation, dem MAE sowie dem Bias sichtbar ist. Dieser kann durch das A-UMOS nicht entfernt werden, wird jedoch meist stark gedämpft. Interessant ist die Änderung des MAE im A-UMOS.
Während bei einigen Prädiktanten eine Zunahme mit fortschreitender Vorhersagezeit sichtbar ist (spot,
pre, rhtd, s. Abbildungen 2.10, 2.12, 2.13), weisen andere Prädiktanten dieses Verhalten nicht auf
(ff10, glo, s. Abbildungen 2.11, 2.14). Letztere scheinen sich stärker am Vehalten der äquivalenten
Vorhersagegrösse aus dem ECMWF zu orientieren, was den Schluss zulässt, dass dieses Verhalten stark
von der Wahl der Prädiktoren abhängig ist. Eine genauere Analyse wurde bisher jedoch noch nicht
durchgeführt.
Abbildung 2.19: RMSE-Vergleich zwischen dem DMO eines Regionalmodells und drei MOS-Varianten der Universität Basel für die Temperatur in 2m über Grund (Fig. 12 Müller 2011, P. 1634). Aufgrund fehlender Verifikationszahlen lässt sich die Reduktion des RMSE gegenüber dem Regionalmodell lediglich schätzen und beträgt rund
30 − 35%.
Abbildung 2.20: RMSE-Vergleich zwischen dem DMO eines Regionalmodells mit 3km und einmal mit 12km
Horizontalauflösung gegen eine und MOS-Varianten der Universität Basel für die Temperatur 2m über Grund (Fig.
14 Müller 2011, P. 1635) basierend auf dem 3km Regionalmodell für 180 Stationen in komplexer Umgebung in
Europa. Aufgrund fehlender Verifikationszahlen lässt sich die Reduktion des RMSE gegenüber dem Regionalmodell
lediglich schätzen und beträgt in komplexem Terrain rund 45 − 50%.
Die Verfügbarkeit der Vorhersagen bei allen vollautomatisch gemessenen Grössen liegt bei ≥ 95%.
Ausgenommen davon sind glo und ssd, da nicht alle Standorte die entsprechenden Messinstrumente
besitzen. Einige Grössen (Bewölkung total/mittelhoch, tclo/mclotclo; Sichtweite, siw) werden durch
einen Beobachter am Stationsstandort erstellt. Da nicht mehr bei jeder Station ein Beobachter seinen
Dienst leistet, sind die Verfügbarkeiten dort entsprechend gering. Speziell in der Nacht fehlen die
Beobachtungen meistens ganz, weshalb die Verfügbarkeit in der Nacht auf nahezu 0% reduziert wird.
2.8 Diskussion
Abbildung 2.21: Reliability Diagramm
aus dem UMOS für „Wahrscheinlichkeit
für Niederschlag“ (Fig. 8 Wilson and
63
Das zweite statistische Verfahren (LMDA) liefert probabilistische Grössen für 6 verschiedene Vorhersagegrössen in insgesamt 26 unterschiedlichen Klassen. Betrachtet man die Durchschnittliche Verbesserung des A-UMOS gegenüber den beiden
Referenzsystemen in Tabelle 2.10, so ist eine Verbesserung
in der Gesamttrefferquote um 2.9% gegenüber dem ECMWF
und einer Verbesserung um 3.62% gegenüber dem AUSTROMOS2 erkennbar. Ebenfalls konnte der Brier-Score im Mittel
um 35% reduziert (verbessert) werden.
Betrachtet man sich die Auswertungen der einzelnen Prädiktanten in Tabelle 2.10, fallen einige Vorhersagegrössen auf,
bei welchen weder Gesamttrefferquote noch der Brier-Score
verbessert werden konnte. Dieses Problem tritt vorwiegend
bei der Klassifizierung von seltenen Ereignissen auf. Dies liegt
auch daran, dass durch das im A-UMOS verwendete upda-
teable Schema bei einer Modellumstellung die historischen
Daten der „alten“ Modellversion nach einer gewissen Zeit
gilt für die 6 − h Vorhersage von +42h
nicht mehr berücksichtigt werden. Bei seltenen Ereignissen
bis +46h im Sommer, 12UTC Lauf. PPM
bedeutet dies, dass sie dadurch in den Trainingsdatensätzen
= Perfect Prog Vergleichssystem.
noch seltener auftreten. Das „updateable“ Konzept könnte also einen negativen Einfluss auf die Klassifizierung seltener
Ereignisse haben, einen expliziten Beweis dieser Hypothese
kann jedoch an dieser Stelle nicht mitgeliefert werden. Ein
Ausweg aus diesem Problem stellt die Arbeit von (Hamill et al.
2006) dar. Durch den generierten GFS Reforecast Datensatz
kann ein Trainingsdatensatz auf ein und derselben Modellversion erstellt werden, der bei entsprechenden Beobachtungen über 30 Jahre Daten beinhält. Dadurch kann die Stichprobengrösse besonders bei „seltenen“ Ereignissen stark erAbbildung 2.22: Percent Correct für alhöht werden, wordurch der Skill von Klassifizierungsmethole 6 UMOS Wahrscheinlichkeitsklassen
den stark gesteigert werden kann. Ebenfalls verbreitet sind
der Windgeschwindigkeit (Fig. 17 Wildie sogenannten logistischen Regressionen, welche ebenfalls
son and Vallée 2003, P. 299). Wintervorprobabilistische Vorhersagen liefern (Wilks (2009) Schmeits
hersagen 00UTC-Lauf. Links für +6h,
et al. (2008)). Es handelt sich dabei nicht mehr um einen
rechts für +18h. PPM = Perfect Prog
Klassifizierungsalgorithmus sondern um eine Spezialform der
Vergleichssystem; UMO und UMB sind
Varianten des UMOS.
Regressionen. Fraglich ist, ob diese das Problem der geringen Stichprobengrösse „extremer“ Ereignisse besser handhaben als die verwendete LMDA. Dies konnte nicht getestet werden, da die logistische Regression mit der reduzierten Information aus den SSCPs nicht umgesetzt werden kann.
Vergleicht man die Verifikation des A-UMOS mit den Auswertungen des UMOS (Wilson and Vallée
2003), so zeigen sich ähnliche Resultate im A-UMOS. Abbildung 2.21 zeigt das Reliabilitydiagramm
Vallée 2003, P. 296). Die Auswertung
aus der Arbeit von Wilson and Vallée für „Wahrscheinlichkeit für Niederschlag (+42h bis +46h)“ und
ist somit vergleichbar mit der Auswertung in Abbildung 2.15. Gut erkennbar ist die starke Reliability in den beiden Abbildungen sowie die Verteilung der „verwendeten Fälle“. Genau wie das A-UMOS
scheint auch das UMOS etwas konservative Vorhersagen zu generieren, was zu einer Untervorhersage
der höheren Wahrsheinlichkeiten führt. Die Abbildung 2.22 zeigt die Gesamttrefferquote für die Wahr-
64
Das Austrian Updateable Model Output Statistics System
scheinlichkeiten der Windgeschwindigkeit aus dem UMOS. Im Mittel lieferte das UMOS aus dem Jahre
2003 eine Gesamttrefferquote von rund 52 − 55% und damit deutlich tiefer als die Gesamttrefferquote
des A-UMOS mit rund 98% gemittelt über beide Läufe sowie wsp1, wsp2 und wsp3. Dies resultiert zum
Teil aus den starken Weiterentwicklungen der numerischen Modelle seit jener Zeit. Interessant wäre
der Vergleich der Hit- sowie False-Alarm-Rate zwischen dem A-UMOS und dem UMOS, entsprechende
Informationen konnten dem Artikel jedoch nicht entnommen werden (Wilson and Vallée 2003).
Abkürzungsverzeichnis
DMO direkte Modelloutput des numerischen Modells
DMO direkten Modelloutput des numerischen Modells
ZAMG Zentralanstalt für Meteorologie und Geodynamik
IMGI Institut für Meteorologie und Geophysik der Universität Innsbruck
NOAA National Oceanic and Atmospheric Administration der U.S.A.
USAF United States Air Force
ECMWF European Centre for Medium-Range Weather Forecasts
GFS Global Forecast System
NCEP National Center for Environmental Prediction
LAM Local Area Model, ein Regionalmodell
VSZ Vorhersagezeitschritt
MAE Mittlerer absolute Fehler
VAR Varianz
COV Kovarianz
COR Korrelation
OLS kleinsten Quadrateschätzer
RMSE Root Mean Square Error oder Quadratischer Fehler
MLR multiple lineare Regression
MDA multiple Diskriminantenanalyse
LMDA lineare multiple Diskriminantenanalyse
SSCPs Trainingsdatensätze
SSCP Trainingsdatensatz
PP
Perfect Prog
UMOS Canadian Updateable Model Output Statistics
A-UMOS Austrian Updateable Model Output Statistics
MOS Model Output Statistics
65
66
Das Austrian Updateable Model Output Statistics System
Abbildungsverzeichnis
1.1 Darstellung eines orthogonalen Gitters mit 48 Gitterpunkten entlang der Breitengrade
und 40 entlang des Längengrade, ergibt insgesamt 1920 Gitterpunkte (Fig. 1 Tribbia
and Anthes 1987, P. 494). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
1.2 Der Lorenz-Attraktor. (a) und (b) zeigen die Originallabildungen (Fig. 2 Lorenz 1963, P.
137), (c) eine modernere und besser bekannte Darstellung (Wikimol 2006). . . . . . . .
6
1.3 Konzeptioneller Ablauf des updateable-Ansatzes. Achtung: alle Werte sind lediglich exemplarisch! . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
2.1 Konzeptioneller Aufbau des Austrian Updateable Model Output Statistics (A-UMOS)
Systems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
2.2 Graphische Übersicht der im A-UMOS verwendeten Stationen. Links: Gesamte Stationsliste mit 1041 Stationen; Mitte: SYNOP Stationen; Rechts: TAWES Stationen. Diese
teilautomatischen Wetterstationen (TAWES) der ZAMG stehen verteilt über ganz Österreich. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
2.3 Konzept einer linearen Regression, lediglich 2-Dimensional. (a) zeigt die Daten im Trainingsdatensatz, welche die Basis für die Regression (b) sind. Die Regression führt zusammen mit dem DMO zur MOS Vorhersage (c). . . . . . . . . . . . . . . . . . . . . . . . . .
20
2.4 Konzept einer linearen Diskriminantenanalyse, lediglich 2-Dimensional. (a) zeigt den
Trainingsdatensatz, wobei beide Klassen getrennt gespeichert sind. Durch die Diskriminantenanalyse erhält man die Klassengrenze (b), welche für die MOS-Vorhersage verwendet wird. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
2.5 Diese Grafik zeigt einen Selektionsprozess für ein Prädiktorenset aus dem A-UMOS für
die lineare multiple Diskriminantenanalyse (LMDA) (Klassifizierungsalgorithmus). Grau
(gestrichelt) stellt die Anzahl der gewählten Prädiktoren dar (skaliert mit Faktor 50 zur
Darstellung auf derselben Ordinate). Grün (gepunktet) das Quadrat der MahalanobisDistanz des jeweiligen Test-Sets und Rot (ausgezogen) diejenige der jeweils beste Kombination. Seitlich rechts mit T bezeichnet ist das totale Quadrat der Mahalanobis-Distanz
für das Set mit 5 Prädiktoren dargestellt. Markiert mit I (Improvement) die Verbesserung durch den zuletzt gewählten Prädiktor. Fällt TI unter einen Schwellwert s, so wird
dieser wieder eliminiert. Im Beispiel ist das bei Prädiktor 5 der Fall - die Selektion endet
hier also mit K − 1 = 4 Prädiktoren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
67
68
ABBILDUNGSVERZEICHNIS
2.6 Schematische Darstellung der Grenzwertüberprüfung. Die Vorhersagen ŷi haben einen
zulässigen Wertebereich zwischen Gu und Go . Manche Prädiktanten besitzen zusätzlich
einen Korrekturbereich K. Liegt ŷi innerhalb K, so wird ŷi auf die nächstgelegene Grenze Gu oder Go korrigiert. Liegt ŷi ausserhalb K und ausserhalb des zulässigen Wertebereiches, so wird die Vorhersage verworfen. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
2.7 Gewichtungsschema zwischen der „kalten“ und „warmen“ Saison. In blau (einfarbig) ist
die „kalte“-Saison, in rot (schraffiert) die „warme“-Saison abgebildet. Die Gewichtung
wechselt von 1.0/0.0 über 0.33/0.67, 0.5/0.5, 0.67/0.33 zu 0.0/1.0. Dies einmal im
Frühling und einmal im Herbst. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
2.8 Beispiel der relativen Faktoren ωneu und ωal t . Schattiert ist die Übergangsphase
zwischen zwei Modellversionen, begrenzt durch die Schwellwerte So und Su . Achtung: Beispiel gilt für Su = 50, So = 300, Nal t = 600 und ωma x = 1.66. ωneu =
f (So , Su , Nneu , ωma x ) und ωol d = g(ωneu , Nal t ). Die Funktionen f (•) und g(•) besitzen
je 4 − 5 Freiheitsgrade, weshalb nicht der komplette Funktionsbereich für ωal t und ωneu
abgebildet werden kann. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
2.9 Stationen aus der für die Verifikation verwendeten Stationsliste. Insgesamt 145 Stationen, davon 2 reine TAWES Stationen und 5 reine SYNOP Stationen. . . . . . . . . . . . . .
37
2.10 Verifikation Lufttemperatur 2m über Grund (spot in 1/10◦ C). Eine allgemeine Erklärung
der Graphen befindet sich in Abschnitt 2.7.3. . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
2.11 Verifikation der Windgeschwindigkeit 10m über Grund (ff10 in 1/10 m s−1 ). Eine allgemeine Erklärung der Graphen befindet sich in Abschnitt 2.7.3. . . . . . . . . . . . . . . . .
41
2.12 Verifikation der Niederschlagsmenge (spot in 1/10 mm m−2 ). Eine allgemeine Erklärung
der Graphen befindet sich in Abschnitt 2.7.3. . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
2.13 Verifikation der relative Feuchte (rhtd in %). Eine allgemeine Erklärung der Graphen
befindet sich in Abschnitt 2.7.3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
44
2.14 Verifikation der Globalstrahlung (glo in W m2 ). Eine allgemeine Erklärung der Graphen
befindet sich in Abschnitt 2.7.3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
45
2.15 Verifikation des Prädiktanten pop1, Wahrscheinlichkeit für Niederschlag ≥ 0.1mm. Eine
allgemeine Erklärung der hier gezeigten Graphen befindet sich unter dem Abschnitt
2.7.6, genauere Erläuterungen zu dieser Abbildung auf der nächsten Seite. . . . . . . . .
52
2.16 Verifikation des Prädiktanten pop4, Wahrscheinlichkeit für Niederschlag ≥ 10mm. Eine
allgemeine Erklärung der hier gezeigten Graphen befindet sich unter dem Abschnitt
2.7.6, genauere Erläuterungen zu dieser Abbildung auf der nächsten Seite. . . . . . . . .
54
2.17 Verifikation des Prädiktanten wfesns, Wahrscheinlichkeit für festen Niederschlag. N aN
Werte bedeuten, dass die entsprechenden Werte aufgrund fehlender Fälle nicht berechnet werden konnten. Eine allgemeine Erklärung der hier gezeigten Graphen befindet
sich unter dem Abschnitt 2.7.6, genauere Erläuterungen zu dieser Abbildung auf der
nächsten Seite. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
56
2.18 Verifikation des Prädiktanten wfesns, Wahrscheinlichkeit für Regen. N aN Werte bedeuten, dass die entsprechenden Werte aufgrund fehlender Fälle nicht berechnet werden
konnten. Eine allgemeine Erklärung der hier gezeigten Graphen befindet sich unter dem
Abschnitt 2.7.6, genauere Erläuterungen zu dieser Abbildung auf der nächsten Seite. . .
58
2.19 RMSE-Vergleich zwischen dem DMO eines Regionalmodells und drei MOS-Varianten der
Universität Basel für die Temperatur in 2m über Grund (Fig. 12 Müller 2011, P. 1634).
Aufgrund fehlender Verifikationszahlen lässt sich die Reduktion des RMSE gegenüber
dem Regionalmodell lediglich schätzen und beträgt rund 30 − 35%. . . . . . . . . . . . .
62
2.20 RMSE-Vergleich zwischen dem DMO eines Regionalmodells mit 3km und einmal mit
12km Horizontalauflösung gegen eine und MOS-Varianten der Universität Basel für die
Temperatur 2m über Grund (Fig. 14 Müller 2011, P. 1635) basierend auf dem 3km Regionalmodell für 180 Stationen in komplexer Umgebung in Europa. Aufgrund fehlender
Verifikationszahlen lässt sich die Reduktion des RMSE gegenüber dem Regionalmodell
lediglich schätzen und beträgt in komplexem Terrain rund 45 − 50%. . . . . . . . . . . .
62
2.21 Reliability Diagramm aus dem UMOS für „Wahrscheinlichkeit für Niederschlag“ (Fig. 8
Wilson and Vallée 2003, P. 296). Die Auswertung gilt für die 6 − h Vorhersage von +42h
bis +46h im Sommer, 12UTC Lauf. PPM = Perfect Prog Vergleichssystem. . . . . . . . . .
63
2.22 Percent Correct für alle 6 UMOS Wahrscheinlichkeitsklassen der Windgeschwindigkeit
(Fig. 17 Wilson and Vallée 2003, P. 299). Wintervorhersagen 00UTC-Lauf. Links für +6h,
rechts für +18h. PPM = Perfect Prog Vergleichssystem; UMO und UMB sind Varianten
des UMOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
63
69
70
ABBILDUNGSVERZEICHNIS
Tabellenverzeichnis
2.1 Liste aller im A-UMOS enthaltenen Prädiktanten. Typ: gibt an, mit welcher Methode
der Prädiktant gerechnet wird; Stat-Typ: zugrunde liegende Stationsliste (S=Synop,
T=Tawes); die drei LMDA Prädiktanten wconv, wfesns, wgew werden jeweils in zwei
Klassen vorhergesagt, wobei die Klasse 0 jeweils „Ereignis Nein“ und die Klasse 1 „Ereignis Ja“ repräsentiert. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
2.2 Übersicht der Vorhersagezeitschritt (VSZ) der einzelnen Prädiktanten. A: erster VSZ;
∆1 : Zeitschrittintervall bis B, ∆2 : Zeitschrittintervall bis C; C: letzter VSZ; in blau-kursiv:
„spezielle“ VSZ-Intervalle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
2.3 Häufigkeit [%], mit welcher eine gewisse Anzahl an Prädiktoren (1 − 10) gewählt wurde. Die maximal erlaubte Anzahl Prädiktoren Kma x = 10, wodurch maximal 10 verschiedene Prädiktoren gewählt werden können. Diese Auswertung gilt für den 19.10.2011.
Datengrundlage: Gleichungssatz beider Saisonen, beider Modellstartzeiten und aller
Vorhersagezeitschritte. Die Tabelle 2.1 enthällt die Beschreibung der hier abgebildeten
Prädiktanten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
2.4 Liste der abgeleiteten Prädiktanten. Typ A steht für abgeleitete Prädiktanten, K für kombinierte Prädiktanten. Eine Kombination von A und K ist ebenso möglich. . . . . . . . . .
29
2.5 Grenzwerte für die Grenzwertüberprüfung. Abgebildet sind die Grenzwerte Gu , Go sowie
K. Die Tabelle 2.1 beinhaltet die vollständige Beschreibungen der Prädiktanten . . . . . .
30
2.6 Bedingungen für den Konsistenzcheck der MLR Prädiktanten. Bei den Prädiktanten der
LMDA (pop, wsp) wurde eine bedingte Abhängigkeit definiert. Die Klasse mit dem höheren Schwellwert darf keine höhere Wahrscheinlichkeit besitzen als die Klassen mit den
tieferen Schwellwerten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
2.7 Die Tabelle zeigt die Abstufung der Gewichtungsfunktion der beiden Jahreszeiten im
des A-UMOS in Zahlen (äquivalent zu Abbildung 2.7). Erste Zeile: Gültigkeitsbereich
(in julianischen Tagen) der Gewichtungsfaktoren (GF); zweite Zeile: GF für die kalte
Jahreszeit; dritte Zeile: GF für die warme Jahreszeit; letzte Zeile: Anzahl Tage des Gültigkeitsbereiches. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
2.8 zeigt die Verifikation des RMSE sowie die Verbesserung (Verb) des A-UMOS relativ zu
den anderen Modellen. Verb(RMSE)= 1 − RM S EA−U M OS /RM S E EC M W F beziehungsweise
Verb(RMSE)= 1 − RM S EA−U M OS /RM S EAUST ROM OS2 angegeben in [%]. Die Prädiktanten
ffx, siw, glo und dd10uv sind nicht aufgeführt, da keine äquivalenten Vorhersagen aus
den Referenzmodellen vorhanden sind. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
47
71
72
TABELLENVERZEICHNIS
2.10 zeigt die Gesamttrefferquote (PC in [%]) sowie den Brier-Score (BS in [0 − 1])
der Modelle. Aus Platzgründen abgekürzt: AU = A-UMOS, A2 = AUSTROMOS2,
Verb.= Verbesserung gegenüber den Modellen. Vergleich für PC gegen ECMWF und
AUSTROMOS2 möglich, wobei Verb(PC)= P CA−U M OS − P C EC M W F bez. Verbesserung=
P CA−U M OS − P CAUST ROM OS2 . Vergleich beim Brier-Score nur gegen AUSTROMOS2 möglich. Verb(BS)= 1 − BSA−U M OS /BSAUST ROM OS2 angegeben in [%]. Prädiktant aktww ist
nicht aufgeführt da, keine äquivalenten Vorhersagen aus den Referenzmodellen vorhanden sind. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
60
2.11 Verwendete Schwellwerte für die Prädiktorenselektion (s. Abschnitt 2.3.1) sowie für den
updateable Prozess (s. Abschnitt 2.6.2) der MLR Prädiktanten. s(I(CORR)) = Schwellwert (s) für Korrelation (s. Selektionsprozess); Ssng l = minimale Stichprobengrösse die
in der „alten“ MOS Modellversion vorhanden sein muss um im updateable Prozess berücksichtigt zu werden; Su /So = Schwellwerte für den updateable Prozess. . . . . . . . .
75
2.12 Verwendete Schwellwerte für die Prädiktorenselektion (s. Abschnitt 2.3.2) sowie für den
updateable Prozess (s. Abschnitt 2.6.2) der LMDA Prädiktanten. s(I(D2 )) = Schwellwert
(s) für Mahalanobis-Distanz (D2 , s. Selektionsprozess); nmin = minimale Stichprobengrösse der LMDA Gruppen (ist dies nicht gegeben wird die LMDA aus Stabilitätsgründen
nicht gerechnet); Ssng l = minimale Stichprobengrösse die in der „alten“ MOS Modellversion vorhanden sein muss um im updateable Prozess berücksichtigt zu werden; Su /So =
Schwellwerte für den updateable Prozess. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
76
2.13 Übersichtstabelle aller Verifikationsmasse der MLR Prädiktanten. Gehört zu Abschnitt
2.7.4 auf Seite 47. Die Erste Spalte gibt an, um welchen Prädiktanten sowie welchen
Lauf es sich handelt. Darauf folgt der Name des verifizierten Modells, danach Standardabweichung der Vorhersage sowie Standardabweichung der Beobachtung (σ ŷ ; σo , s.
Gleichung 2.27), BIAS = Bias (s. Gleichung 2.26), MAE = mittlerer absoluter Fehler (s.
Gleichung 2.28), RMSE = mittlerer quadratischer Fehler (s. Gleichung 2.29) sowie AVAIL
= Verfügbarkeit der Vorhersagen (s. Gleichung 2.25). Eine Erklärung zu den hier verwendeten Abkürzungen der Prädiktanten sowie deren Einheiten befindet sich in Tabelle
2.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
79
2.14 Übersicht aller Verifikationen der mittels LMDA klassifizierten Prädiktanten. Gehšrt zu
Abschnitt 2.7.7 auf Seite 60 Die erste Spalte gibt an, um welchen Prädiktanten sowie um
welchen Modellauf es sich handelt. Danach folgen: Avail = Verfügbarkeit, N = Anzahl
der Fälle die in den Score eingeflossen sind, PC = Gesamttrefferquote (s. Gleichung
2.43), BS = Brier Score (s. Gleichung 2.44), HIT = Hit-Rate „Ereignis Ja“ (s. Gleichung
2.39), FAR = False-Alarm-Rate „Ereignis JA“ (s. Gleichung 2.41) und Ratio = Verhältnis
zwischen Vorhersage „Ereignis Ja“ und Beobachtung „Ereignis Ja“ (s. Gleichung 2.42).
Eine Erklärung zu den hier verwendeten Abkürzungen der Prädiktanten befindet sich in
Tabelle 2.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
82
Literaturverzeichnis
Bjerknes, V., 1900: The dynamic principle of the circulatory movements in the atmosphere. Monthly
Weather Review, 28, 434.
Carter, G., 1986: Moving towards a more responsive statistical guidance system((for weather forecasting)). Conference on Weather Forecasting and Analysis.
Charney, J. G., R. FJÖRTOFT, and J. Neumann, 1950: Numerical integration of the barotropic vorticity
equation. Tellus, 2 (4), 237–254.
Glahn, H. R. and D. A. Lowry, 1972: The use of model output statistics (mos) in objective weather
forecasting. Journal of Applied Meteorology.
Hamill, T., J. S. Whitaker, and S. L. Mullen, 2006: Reforecasts. an important dataset for improving
weather predictions. Bull. Amer. Meteor. Soc., 87, 33–46.
Hastie, T., R. Tibshirani, and J. Friedman, 2003: The Elements of Statistical Learning: Data Mining,
Inference, and Prediction.
Klein, W., B. Lewis, and I. Enger, 1959: Objective prediction of five-day mean temperatures during
winter. Journal of Atmospheric Sciences, 16, 672–682.
Lorenz, E. N., 1963: Deterministic nonperiodic flow. Journal of Atmospheric Sciences, 20, 130.
Lorenz, E. N., 1972: Does the flap of a butterfly’s wings in brazil set off a tornado in texas? American
Association for the Advancement of Science, (139th meeting).
Müller, M. D., 2011: Effects of model resolution and statistical postprocessing on shelter temperature
and wind forecasts. J. Appl. Meteor. Climatol., 50 (8), 1627–1636.
Richardson, L. F., 1965: Weather Prediction by Numerical Process.
Schmeits, M. J., K. J. Kok, D. H. P. Vogelezang, and R. M. van Westrhenen, 2008: Probabilistic forecasts
of (severe) thunderstorms for the purpose of issuing a weather alarm in the netherlands. Weather
and forecasting, 23, 1253.
top500.org, 2011: Online 04.11.2011. Top 500 supercomputer sites. URL http://www.top500.
org/, URL http://www.top500.org/.
Tribbia, J. J. and R. A. Anthes, 1987: Scientific basis of modern weather prediction. Science, 237, 493.
Vannitsem, S., 2009: A unified linear model output statistics scheme for both deterministic and ensemble forecasts. Quarterly Journal of the Royal Meteorological Society, 135 (644), 1801–1815.
Vislocky, R. and G. Young, 1989: The use of perfect prog forecasts to improve model output statistics
forecasts of precipitation probability. Weather and forecasting.
73
74
LITERATURVERZEICHNIS
Wikimol, 2006: Online: 21.10.2011. Lorenz attractor – Wikipedia, the free encyclopedia. URL http:
//de.wikipedia.org/wiki/Lorenz-Attraktor, URL http://de.wikipedia.org/wiki/
Lorenz-Attraktor.
Wilks, D. D., 2006: Statistical Methods in the Atmospheric Sciences. 627+ pp.
Wilks, D. S., 2009: Extending logistic regression to provide full-probability-distribution mos forecasts.
Meteorological Applications, 16, 361.
Wilson, L. J. and M. Vallée, 2002: The canadian updateable model output statistics (UMOS) system:
Design and development tests. Weather and forecasting.
Wilson, L. J. and M. Vallée, 2003: The canadian updateable model output statistics (UMOS) system:
Validation against perfect prog. Weather and forecasting.
Anhang
Der Anhang enthält einige zusätzliche Informationen in Tabellenform. Entsprechende Verweise befinden sich im Hauptteil der Arbeit beziehungsweise in der Beschreibung der Tabelle.
Schwellwerte der MLR Prädiktorrenselektion
Prädiktant
S(I(CORR))
Ssng l
Su
So
spot
0.5%
300
50
300
rh
0.5%
300
50
300
mclo
1.0%
300
50
300
u10
1.0%
300
50
300
v10
1.0%
300
50
300
tclo
1.0%
300
50
300
ff10
1.0%
300
50
300
ffx
1.0%
300
50
300
td
0.5%
300
50
300
tmin
0.5%
300
50
300
tmax
0.5%
300
50
300
pre
1.0%
300
50
300
t5cm
0.5%
300
50
300
glo
1.0%
300
50
300
ssd
1.0%
300
50
300
siw
1.0 %
300
50
300
ssd
1.0%
300
50
300
Tabelle 2.11: Verwendete Schwellwerte für die Prädiktorenselektion (s. Abschnitt 2.3.1) sowie für den updateable
Prozess (s. Abschnitt 2.6.2) der MLR Prädiktanten. s(I(CORR)) = Schwellwert (s) für Korrelation (s. Selektionsprozess); Ssng l = minimale Stichprobengrösse die in der „alten“ MOS Modellversion vorhanden sein muss um im
updateable Prozess berücksichtigt zu werden; Su /So = Schwellwerte für den updateable Prozess.
Schwellwerte LMDA Prädiktorrenselektion/updateable Prozess
Prädiktant
I(D2 )
nmin
Ssng l
Su
Su
pop1
20%
5
200
100
200
pop2
20%
5
200
100
200
pop3
20%
5
200
100
200
pop4
20%
5
200
100
200
Fortsetzung auf der nächsten Seite ...
75
76
LITERATURVERZEICHNIS
Prädiktant
I(D2 )
nmin
Ssng l
Su
Su
pop5
20%
5
200
100
200
aktww1
20%
5
200
100
200
aktww2
20%
5
200
100
200
aktww3
20%
5
200
100
200
aktww4
20%
5
200
100
200
aktww5
5%
5
200
100
200
aktww6
5%
5
200
100
200
aktww7
20%
5
200
100
200
aktww8
20%
5
200
100
200
aktww9
20%
5
200
100
200
aktww10
20%
5
200
100
200
wsp1
20%
5
200
100
200
wsp2
20%
5
200
100
200
wsp3
20%
5
200
100
200
wconv
15%
5
200
100
200
wfesns
20%
5
200
100
200
wgew
20%
5
200
100
200
Tabelle 2.12: Verwendete Schwellwerte für die Prädiktorenselektion (s. Abschnitt 2.3.2) sowie für den updateable
Prozess (s. Abschnitt 2.6.2) der LMDA Prädiktanten. s(I(D2 )) = Schwellwert (s) für Mahalanobis-Distanz (D2 , s.
Selektionsprozess); nmin = minimale Stichprobengrösse der LMDA Gruppen (ist dies nicht gegeben wird die LMDA
aus Stabilitätsgründen nicht gerechnet); Ssng l = minimale Stichprobengrösse die in der „alten“ MOS Modellversion vorhanden sein muss um im updateable Prozess berücksichtigt zu werden; Su /So = Schwellwerte für den
updateable Prozess.
77
LITERATURVERZEICHNIS
Detaillierte Verifikationsmasse der MLR Prädiktanten
Prädiktant/Lauf
Modell
σ ŷ
σo
BIAS
MAE
RMSE
CORR
AVAIL
A-UMOS
—
—
—
—
—
—
—
dd10uv 00Z
AUSTROMOS2
—
—
—
—
—
—
—
[0 − 359◦ ]
ECMWF
—
—
—
—
—
—
—
A-UMOS
17.86
21.78
0.12
8.63
12.80
0.81
98.90
—
—
—
—
—
—
—
ff10 00Z
AUSTROMOS2
[1/10 m s−1 ]
ECMWF
39.51
21.76
61.33
62.26
72.04
0.35
100.00
A-UMOS
33.76
40.57
0.50
16.97
23.45
0.82
98.60
ffx 00Z
AUSTROMOS2
—
—
—
—
—
—
—
[1/10 m s−1 ]
ECMWF
—
—
—
—
—
—
—
A-UMOS
213.50
239.77
-0.86
59.57
106.04
0.90
59.70
glo 00Z
AUSTROMOS2
—
—
—
—
—
—
—
[W m−2 ]
ECMWF
—
—
—
—
—
—
—
A-UMOS
1.87
2.92
-0.23
1.82
2.29
0.63
11.80
—
—
—
—
—
—
—
mclotclo 00Z
AUSTROMOS2
[0/8 − 8/8]
ECMWF
3.16
2.95
-1.55
2.85
3.84
0.34
100.00
A-UMOS
14.56
25.60
0.25
8.71
21.91
0.52
95.20
—
—
—
—
—
—
—
pre 00Z
AUSTROMOS2
[1/10 mm]
ECMWF
22.41
25.78
2.25
9.54
26.60
0.40
96.10
A-UMOS
14.41
17.40
-0.14
7.33
9.93
0.82
98.90
—
—
—
—
—
—
—
rhtd 00Z
AUSTROMOS2
[0 − 100%]
ECMWF
16.82
17.39
-1.96
11.24
15.05
0.62
100.00
A-UMOS
25.50
129.78
176.78
3.69
86.73
121.46
0.73
siw 00Z
AUSTROMOS2
—
—
—
—
—
—
—
[1/10 km]
ECMWF
—
—
—
—
—
—
—
A-UMOS
91.03
93.69
0.65
15.54
20.78
0.98
98.90
—
—
—
—
—
—
—
spot 00Z
AUSTROMOS2
[1/10 ◦ C]
ECMWF
93.42
93.70
-15.80
31.09
39.95
0.92
100.00
A-UMOS
12.03
15.08
0.12
5.59
8.86
0.81
68.40
—
—
—
—
—
—
—
ssd 00Z
AUSTROMOS2
[1/10 h]
ECMWF
15.21
13.73
1.53
5.01
10.42
0.75
100.00
A-UMOS
102.53
106.63
0.26
21.82
31.10
0.96
85.20
—
—
—
—
—
—
—
t5cm 00Z
AUSTROMOS2
[1/10 ◦ C]
ECMWF
106.11
106.93
-36.81
46.05
61.79
0.89
100.00
A-UMOS
1.92
2.85
-0.05
1.60
2.10
0.67
14.40
—
—
—
—
—
—
—
tclo 00Z
AUSTROMOS2
[0/8 − 8/8]
ECMWF
3.23
2.86
-0.31
1.98
2.94
0.54
100.00
A-UMOS
81.48
83.61
-0.23
14.52
19.77
0.97
98.80
—
—
—
—
—
—
—
tdrh 00Z
AUSTROMOS2
[1/10 ◦ C]
ECMWF
88.12
83.65
-17.80
29.45
38.37
0.92
100.00
A-UMOS
95.99
98.26
3.40
16.80
22.60
0.97
98.90
—
—
—
—
—
—
—
tmax 00Z
AUSTROMOS2
[1/10 ◦ C]
ECMWF
96.04
98.29
-35.48
43.94
54.17
0.91
100.00
A-UMOS
83.35
85.49
-1.60
14.80
20.11
0.97
98.90
—
—
—
—
—
—
—
tmin 00Z
AUSTROMOS2
[1/10 ◦ C]
ECMWF
89.49
85.47
-0.64
31.07
39.50
0.90
100.00
A-UMOS
17.29
22.22
0.12
9.44
13.92
0.78
98.60
—
—
—
—
—
—
—
u10 00Z
AUSTROMOS2
Fortsetzung auf der nächsten Seite ...
78
LITERATURVERZEICHNIS
Prädiktant/Lauf
Modell
σ ŷ
σo
BIAS
MAE
RMSE
CORR
AVAIL
[1/10 m s−1 ]
ECMWF
20.27
22.19
1.93
15.85
21.97
0.47
100.00
A-UMOS
15.81
20.44
0.12
8.30
12.91
0.78
98.40
—
—
—
—
—
—
—
v10 00Z
AUSTROMOS2
[1/10 m s−1 ]
ECMWF
22.38
20.39
-1.05
17.21
23.21
0.42
100.00
A-UMOS
—
—
—
—
—
—
—
dd10uv 12Z
AUSTROMOS2
—
—
—
—
—
—
—
[0 − 359◦ ]
ECMWF
—
—
—
—
—
—
—
98.90
A-UMOS
17.91
21.78
0.16
8.73
12.99
0.80
ff10 12Z
AUSTROMOS2
21.57
21.70
2.25
13.43
21.64
0.51
29.00
[1/10 m s−1 ]
ECMWF
39.53
21.76
61.05
62.00
71.81
0.35
100.00
A-UMOS
33.90
40.57
0.62
17.16
23.76
0.81
98.60
ffx 12Z
AUSTROMOS2
—
—
—
—
—
—
—
[1/10 m s−1 ]
ECMWF
—
—
—
—
—
—
—
A-UMOS
213.22
239.83
-0.82
60.82
107.65
0.89
59.80
glo 12Z
AUSTROMOS2
—
—
—
—
—
—
—
[W m−2 ]
ECMWF
—
—
—
—
—
—
—
11.90
A-UMOS
1.88
2.92
-0.22
1.83
2.30
0.62
mclotclo 12Z
AUSTROMOS2
2.93
2.94
-1.82
2.59
3.60
0.44
12.10
[0/8 − 8/8]
ECMWF
3.15
2.95
-1.58
2.88
3.87
0.33
100.00
94.70
A-UMOS
13.70
25.55
0.73
8.26
21.24
0.56
pre 12Z
AUSTROMOS2
36.27
25.21
10.16
15.67
39.08
0.29
44.20
[1/10 mm]
ECMWF
22.44
25.87
2.21
9.48
26.41
0.41
95.70
98.90
A-UMOS
14.53
17.40
-0.27
7.44
10.08
0.82
rhtd 12Z
AUSTROMOS2
16.25
17.59
-0.27
9.17
12.50
0.73
28.90
[0 − 100%]
ECMWF
16.86
17.40
-1.80
11.20
15.02
0.62
100.00
A-UMOS
129.93
176.57
5.18
88.10
122.96
0.72
25.50
siw 12Z
AUSTROMOS2
131.02
181.29
-29.95
102.58
148.75
0.61
12.20
[1/10 km]
ECMWF
—
—
—
—
—
—
—
98.90
A-UMOS
91.06
93.65
0.90
15.77
21.25
0.97
spot 12Z
AUSTROMOS2
87.30
92.75
6.28
18.06
24.45
0.97
28.90
[1/10 ◦ C]
ECMWF
93.31
93.67
-16.07
31.18
40.01
0.92
100.00
A-UMOS
12.10
15.08
0.18
5.62
8.89
0.81
68.50
—
—
—
—
—
—
—
ssd 12Z
AUSTROMOS2
[1/10 h]
ECMWF
15.28
13.73
1.57
5.03
10.45
0.75
100.00
A-UMOS
103.12
106.63
0.02
22.57
32.49
0.95
85.30
—
—
—
—
—
—
—
t5cm 12Z
AUSTROMOS2
[1/10 ◦ C]
ECMWF
105.80
106.91
-36.74
45.93
61.68
0.89
100.00
14.30
A-UMOS
1.92
2.85
-0.05
1.60
2.11
0.67
tclo 12Z
AUSTROMOS2
2.79
2.86
-0.44
1.85
2.68
0.56
13.00
[0/8 − 8/8]
ECMWF
3.23
2.87
-0.30
2.00
2.96
0.54
100.00
98.70
A-UMOS
81.76
83.54
-0.17
14.62
20.12
0.97
tdrh 12Z
AUSTROMOS2
79.86
82.15
7.62
19.81
28.41
0.94
28.90
[1/10 ◦ C]
ECMWF
88.41
83.61
-17.77
29.29
38.20
0.92
100.00
99.00
A-UMOS
96.17
98.46
3.53
16.60
22.49
0.97
tmax 12Z
AUSTROMOS2
93.58
100.09
8.77
21.20
28.14
0.96
25.60
[1/10 ◦ C]
ECMWF
95.96
98.48
-37.34
45.26
55.36
0.91
100.00
A-UMOS
83.48
86.63
-1.61
15.47
21.06
0.97
99.00
AUSTROMOS2
74.76
80.91
4.06
17.26
23.57
0.96
20.40
tmin 12Z
Fortsetzung auf der nächsten Seite ...
79
LITERATURVERZEICHNIS
Prädiktant/Lauf
Modell
σ ŷ
σo
BIAS
MAE
RMSE
CORR
AVAIL
[1/10 ◦ C]
ECMWF
89.47
86.61
-3.04
30.94
39.37
0.90
100.00
A-UMOS
17.25
22.21
0.10
9.44
13.94
0.78
98.60
—
—
—
—
—
—
—
u10 12Z
AUSTROMOS2
[1/10 m s−1 ]
ECMWF
20.14
22.19
1.77
15.77
21.89
0.47
100.00
A-UMOS
15.83
20.44
0.10
8.28
12.89
0.78
98.40
—
—
—
—
—
—
—
22.43
20.39
-1.15
17.21
23.22
0.42
100.00
v10 12Z
AUSTROMOS2
[1/10 m s−1 ]
ECMWF
Tabelle 2.13: Übersichtstabelle aller Verifikationsmasse der MLR Prädiktanten. Gehört zu Abschnitt 2.7.4 auf
Seite 47. Die Erste Spalte gibt an, um welchen Prädiktanten sowie welchen Lauf es sich handelt. Darauf folgt
der Name des verifizierten Modells, danach Standardabweichung der Vorhersage sowie Standardabweichung der
Beobachtung (σ ŷ ; σo , s. Gleichung 2.27), BIAS = Bias (s. Gleichung 2.26), MAE = mittlerer absoluter Fehler (s.
Gleichung 2.28), RMSE = mittlerer quadratischer Fehler (s. Gleichung 2.29) sowie AVAIL = Verfügbarkeit der
Vorhersagen (s. Gleichung 2.25). Eine Erklärung zu den hier verwendeten Abkürzungen der Prädiktanten sowie
deren Einheiten befindet sich in Tabelle 2.1.
Detaillierte Verifikationsmasse der LMDA Prädiktanten
Prädiktant/Lauf
pop1 00UTC
pop2 00UTC
pop3 00UTC
pop4 00UTC
pop5 00UTC
aktww1 00UTC
aktww2 00UTC
aktww3 00UTC
aktww4 00UTC
Modell
Avail
N
PC
BS
HIT
FAR
Ratio
A-UMOS
99.27
1748193
81.52
0.1333
39.80
29.37
-43.65
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
96.07
1680155
67.04
—
84.86
58.37
103.82
A-UMOS
99.26
1748007
89.42
0.0835
26.94
34.11
-59.12
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
96.07
1680185
82.19
—
62.45
62.74
67.61
A-UMOS
98.74
1738727
96.05
0.0340
21.14
45.26
-61.37
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
96.07
1680480
94.05
—
34.98
68.62
11.45
A-UMOS
83.64
1460774
98.15
0.0168
13.05
49.52
-74.15
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
96.07
1678168
97.80
—
20.22
73.83
-22.72
A-UMOS
44.14
757160
99.26
0.0072
0.86
61.90
-97.73
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
96.07
1668951
99.54
—
5.97
83.95
-62.82
A-UMOS
0.00
0
—
—
—
—
—
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
0.00
0
—
—
—
—
—
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
0.00
0
—
—
—
—
—
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
1.56
21758
94.12
0.0455
17.83
43.33
-68.54
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
Fortsetzung auf der nächsten Seite ...
80
Prädiktant/Lauf
aktww5 00UTC
aktww6 00UTC
aktww7 00UTC
aktww8 00UTC
aktww9 00UTC
aktww10 00UTC
wsp1 00UTC
wsp2 00UTC
wsp3 00UTC
wgew 00UTC
wconv 00UTC
wfesns 00UTC
pop1 12UTC
pop2 12UTC
pop3 12UTC
pop4 12UTC
LITERATURVERZEICHNIS
Modell
Avail
N
PC
BS
HIT
FAR
Ratio
A-UMOS
2.31
30510
58.14
0.2276
23.39
28.51
-67.28
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
2.10
28629
95.14
0.0430
2.01
49.09
-96.05
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
2.32
30616
83.36
0.1128
21.12
37.38
-66.27
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
2.32
30603
75.87
0.1452
27.85
23.17
-63.75
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
2.31
30580
81.71
0.1289
16.00
38.24
-74.09
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
1.34
18186
97.63
0.0213
1.18
70.59
-95.99
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
63.97
1729218
97.14
0.0238
42.74
35.68
-33.56
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
100.00
2710302
95.36
—
30.67
81.63
66.92
A-UMOS
21.52
568960
98.08
0.0165
37.57
31.77
-44.94
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
100.00
2683305
99.20
—
8.07
88.98
-26.79
A-UMOS
8.55
225036
98.51
0.0132
39.25
42.48
-31.77
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
100.00
2677483
99.84
—
1.85
87.52
-85.20
A-UMOS
7.86
83175
97.18
0.0240
11.99
52.73
-74.64
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
15.20
252539
91.01
0.0661
23.03
44.22
-58.72
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
11.45
121568
86.74
0.0901
57.76
35.72
-10.14
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
99.27
1747191
81.68
0.1322
41.27
29.64
-41.34
AUSTROMOS2
34.56
608704
77.95
0.1588
71.27
46.92
34.26
ECMWF
95.62
1671077
67.01
—
84.71
58.35
103.37
A-UMOS
99.25
1746857
89.43
0.0826
28.96
35.46
-55.14
AUSTROMOS2
34.34
604885
85.26
0.1039
59.38
58.14
41.85
ECMWF
95.62
1671098
82.42
—
62.75
62.19
65.96
A-UMOS
98.78
1738503
96.06
0.0334
23.03
45.40
-57.82
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
95.62
1671360
94.04
—
35.65
68.33
12.58
A-UMOS
84.98
1483781
98.17
0.0162
17.89
50.16
-64.10
AUSTROMOS2
34.31
604878
96.39
0.0344
34.84
84.35
122.66
ECMWF
95.62
1668692
97.82
—
21.80
72.29
-21.32
A-UMOS
51.27
888261
99.29
0.0068
3.54
56.35
-91.90
Fortsetzung auf der nächsten Seite ...
81
LITERATURVERZEICHNIS
Prädiktant/Lauf
Modell
Avail
N
PC
BS
HIT
FAR
Ratio
pop5 12UTC
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
95.62
1659052
99.55
—
7.25
79.83
-64.03
A-UMOS
0.00
0
—
—
—
—
—
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
0.00
0
—
—
—
—
—
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
0.00
0
—
—
—
—
—
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
1.55
21616
94.15
0.0455
18.24
42.52
-68.27
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
2.31
30424
59.32
0.2238
25.20
25.87
-66.01
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
2.10
28600
95.08
0.0439
3.10
41.33
-94.72
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
2.32
30553
83.27
0.1141
22.06
36.91
-65.03
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
2.32
30535
75.76
0.1445
27.47
24.05
-63.82
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
2.32
30535
81.68
0.1299
15.97
37.75
-74.35
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
1.36
18405
97.67
0.0209
3.75
51.52
-92.27
AUSTROMOS2
0.00
0
—
—
—
—
—
aktww1 12UTC
aktww2 12UTC
aktww3 12UTC
aktww4 12UTC
aktww5 12UTC
aktww6 12UTC
aktww7 12UTC
aktww8 12UTC
aktww9 12UTC
aktww10 12UTC
wsp1 12UTC
wsp2 12UTC
wsp3 12UTC
wgew 12UTC
wconv 12UTC
wfesns 12UTC
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
64.20
1734032
97.17
0.0236
42.84
35.13
-33.96
AUSTROMOS2
21.87
592561
93.35
0.0527
65.99
77.25
190.10
ECMWF
100.00
2708096
95.42
—
30.80
81.25
64.29
A-UMOS
21.64
572377
98.12
0.0162
38.09
31.31
-44.54
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
100.00
2683012
99.21
—
7.85
89.09
-28.10
A-UMOS
8.61
226684
98.53
0.0130
39.43
42.41
-31.52
AUSTROMOS2
0.00
0
—
—
—
—
—
ECMWF
100.00
2676106
99.84
—
1.64
89.11
-84.94
A-UMOS
7.87
83293
97.15
0.0240
13.15
54.35
-71.19
AUSTROMOS2
3.47
29796
92.38
0.0613
20.88
89.81
104.99
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
15.21
252571
90.98
0.0659
22.56
44.54
-59.33
AUSTROMOS2
9.87
120980
82.15
0.1311
51.76
80.40
164.08
ECMWF
0.00
0
—
—
—
—
—
A-UMOS
11.48
121782
86.88
0.0895
57.43
35.52
-10.94
AUSTROMOS2
17.07
121435
88.61
0.0801
54.59
55.18
21.78
Fortsetzung auf der nächsten Seite ...
82
Prädiktant/Lauf
LITERATURVERZEICHNIS
Modell
Avail
N
PC
BS
HIT
FAR
Ratio
ECMWF
0.00
0
—
—
—
—
—
Tabelle 2.14: Übersicht aller Verifikationen der mittels LMDA klassifizierten Prädiktanten. Gehšrt zu Abschnitt
2.7.7 auf Seite 60 Die erste Spalte gibt an, um welchen Prädiktanten sowie um welchen Modellauf es sich handelt.
Danach folgen: Avail = Verfügbarkeit, N = Anzahl der Fälle die in den Score eingeflossen sind, PC = Gesamttrefferquote (s. Gleichung 2.43), BS = Brier Score (s. Gleichung 2.44), HIT = Hit-Rate „Ereignis Ja“ (s. Gleichung 2.39),
FAR = False-Alarm-Rate „Ereignis JA“ (s. Gleichung 2.41) und Ratio = Verhältnis zwischen Vorhersage „Ereignis
Ja“ und Beobachtung „Ereignis Ja“ (s. Gleichung 2.42). Eine Erklärung zu den hier verwendeten Abkürzungen der
Prädiktanten befindet sich in Tabelle 2.1.
83
84
LITERATURVERZEICHNIS
Danksagung
Ich bin kein Freund grosser Worte, eine Danksagung ist an dieser Stelle aber definitiv angebracht.
Zuerst möchte ich mich bei meinem Betreuer Georg Mayr und meinem Projektmittarbeiter Johannes
Vergeiner herzlichst bedanken, die mich im Jahre 2009 an Bord des Projektes geholt haben. Als noch
„unerfahrener“ Meteorologe und Programmierer ist dies nicht selbstverständlich!
Obwohl - oder eben weil der Weg bis zu dieser Arbeit oft sehr arbeitsintensiv und aufreibend war, durfte
und konnte ich sehr viel dabei lernen. Ein spezielles Dankeschön gilt hier vor allem dem Team aus dem
„9. Stock“ (namentlich Felix, Georg, Jakob, Jo und Susanne), welche mich fachlich und mental immer
supportet haben. Ohne eine solch nette Arbeitsatmosphäre wären das Ganze nicht denkbar gewesen.
Ebenso gilt das Dankeschön natürlich meiner Familie, meinen KollegInnen und MitstudentInnen, die
mir den Rücken in so manch einer Situation frei gehalten haben und mit welchen über die vergangenen
zwei Jahre der eine oder andere Sack gerösteter Kaffeebohnen seiner Bestimmung zugeführt wurde.