Fengler_Gumann DWH Meeting

Transcription

Fengler_Gumann DWH Meeting
A Real-Time Data Warehouse:
Bridging the Gap between Weather and Climate
Andreas Gumann
03.02.2010
Die Meteomedia-Gruppe
Firmenstruktur
Omega/USA
Jörg Kachelmann
Produktions AG
The Weatherman
Inc.
Appenzell/Schweiz
Bridge Lake/Canada
Meteomedia GmbH
Meteomedia AG
Meteoradar GmbH
Bochum/Deutschland
Gais/Schweiz
Stallikon/Schweiz
WeatherOK Inc.
1990 von Jörg Kachelmann gegründet
Einer der ersten und führenden privaten Wetterdienstleister in Europa
Vertikal voll integrierter Wetterdienst
Expandierendes Unternehmen
03.02.2010
2
Das Meteomedia-Messnetz
Gemeinsam mit zahlreichen
Kooperationspartnern betreibt
Meteomedia ein privates
Wetterstations-Netz mit rund 780
Wetterstationen.
Zusätzlich verfügen wir über die
Messwerte aller nationalen
Wetterdienste. Damit stehen
Meteomedia in Deutschland und in der
Schweiz rund 1’520 Wetterstationen zur
Verfügung.
Die daraus resultierende
Messnetzdichte ist in dieser Form
einmalig!
03.02.2010
3
Wie entsteht eine Wettervorhersage?
Flugzeuge
Satelliten
Radiosonden
Prognoserechner
Schiffe
Bojen
Wettermodelle
Wetterstationen
Niederschlagsradar
03.02.2010
4
Wie entsteht eine Wettervorhersage?
Täglicher Dateneingang:
Satelliten
Flugzeuge
100 GB
Radiosonden
2 GB
Prognoserechner
Schiffe
5 GB
Bojen
15 GB
Niederschlagsradar
03.02.2010
Wettermodelle
Wetterstationen
70 GB
5
Wettermodelle
4x4 km Strömungsbild
03.02.2010
6
Model Output Statistics (MOS)
+
Grobmaschiges Wettermodell
Daten der Wetterstation
Punktvorhersage für eine Station
7
Warum Wettervorhersagen? Wen interessiert Wetter?
Internet Portale
Veranstaltungen
Fernsehen
8
Warum Wettervorhersagen? Wen interessiert Wetter?
Unwetterwarnungen
Versicherungen
Schadensgutachten
Wasserauen, Jan 2007
9
Warum Wettervorhersagen? Wen interessiert Wetter?
Bordcomputer
Straßenwetter
Winterdienst
10
Wen interessieren Klimadaten?
Energie-Produzenten
CME Energie Derivate
Risk-Management
Direkt- und Rückversicherer
Enterprise Risk
11
Problemstellung (Beispiele)
• Portale
„Gib mir alle Daten zum 26.10.2009 um 12z!“
Wetter
• Medien
„Regnet es morgen Nachmittag? Wie wird das Wochenende?“
• Energie
„Gib mir alle Daten der Station Fulda seit Messbeginn!“
Klima
• Medien / TV
„Welches war die kälteste Station im Februar 2006 in Hessen?“
• Risk Management
„Wie hoch ist das Niederschlagsrisiko bei Rock am Ring?“
03.02.2010
12
Anforderungen
„Wetter“
Aktuelle Werte
Die letzten 3-4 Tage
Vorhersagen
• Minütlicher Dateneingang
Ca. 5-10 GB
• Keine redundante Datenhaltung
• Backup im Live Betrieb
• Ausfallsicherheit
„Klima“
Historische Werte
Für die letzten Jahrzehnte
Hist. Vorhersagen
• Die Zugriffszeiten auf aktuelle und
historische Daten sollten in etwa
gleich schnell sein.
Ca. 5-10 TB
03.02.2010
13
Datenfluss
Wetterstationen
Schiffe
Flugzeuge
Radiosonden
Bojen
FM12*, FM15,
BUFR, XML, CSV
1minütig
24/7
AFD
Redundantes Dekoder-Cluster
*10382 SNDL22_EDZW_020700 AAXX 02071 10382
41580 72705 10085 20058 30080 40125 53003 76162
8483/ 333 55300 81825 84656 87359=
csv-Format
für jede Stunde ein File
03.02.2010
14
Datenfluss
Archivierung
NAS
20 TB
SAN
DB
RAC:
• Real failover
• Oracle Enterprise
Abstraktionslayer
Tape Roboter
Backup-System
filebasiert
03.02.2010
15
Datenbank-Design
CSVFiles
Daten der letzten
Stunde (minütlich)
2 Files
Highest Priority!
Daten der letzten 2 Wochen
(viertelstündlich)
ca. 200 Files
Normal Priority!
Daten älter als 2
Wochen (stündlich)
Ca. 45.000 Files
Lowest Priority!
Partitionierung
Insert/
Replace
Partition/
Exchange
OWB
Partition/
Exchange
Oracle Application Cluster 11g
Oracle Warehouse Builder 11g
Oracle Enterprise Manager 11g
03.02.2010
16
Softwareauswahl vor Projektstart (aus MM Sicht)
MySQL
Oracle
Hypertable
Filebasierte
Lösung
KnowHow bei MM
+
-
o
+
Robust
+
+
o
+
Redundanz
o
+
+
+
Shared Disk
-
+
o
o
Partitionierung
-
+
-
o
Backup
o
+
+
+
Preis
+
-
+
o
Interface
+
+
o
-
Dokumentation
+
o
-
-
Community
+
o
-
-
Head based
+
+
o
-
Schulungen
o
+
-
o
03.02.2010
17
Projekt-Hindernisse (Lessons Learned)
„ORA-600!“
Wir beobachten
Cluster-Waits…
+ Hardware ist Oracle spezifiziert
+ Aufbau KnowHow durch Schulungen / Fortbildungen
- Lizenzkauf vor Produktionsgang
- Defektes Netzwerkkabel (ca. 2 Monate)
- diverse Oracle Patches (ca. 1 Monat)
- Falsche Paketgröße: Jumbo Frames vs. UDP-Packet-Size (ca. 2 Monate)
03.02.2010
18
Vielen Dank für Ihre Aufmerksamkeit!