Folie 0 - Katholische Universität Eichstätt
Transcription
Folie 0 - Katholische Universität Eichstätt
SoSe 2012 CRM mit SAP CRM: SAP NetWeaver BI Prof. Dr. Klaus D. Wilde Lehrstuhl für ABWL und Wirtschaftsinformatik Katholische Universität Eichstätt-Ingolstadt Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Literatur Egger, N. et al. (2006): SAP BW Reporting und Analyse, 1. Auflage – korrigierter Nachdruck, Bonn. Egger, N. et al. (2007): SAP Business Intelligence, 1. Auflage –korrigierter Nachdruck, Bonn. Egger, N. et al. (2007): SAP BW Datenbeschaffung, 1. Auflage – korrigierter Nachdruck, Bonn. Kießwetter, M.; Vahlkamp, D. (2007): Data Mining in SAP NetWeaver BI, 1.Auflage, Bonn. Mehrwald, C. (2007): Datawarehousing mit SAP BW 7, 4. Auflage, Heidelberg. www.sap.help.com 1 Copyright 2 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde SAP, SAP Logo, R/2, RIVA, R/3, SAP ArchiveLink, SAP Business Workflow, WebFlow, SAP EarlyWatch, BAPI, SAPPHIRE, Management Cockpit, SAP, SAP.com und alle im Text erwähnten SAP-Produkte und –Dienstleistungen, Screenshots sowie die entsprechenden Logos sind Marken oder eingetragene Marken der SAP AG in Deutschland und anderen Ländern weltweit Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Struktur der Übung 3 Allgemeines Theorie SAP Praxis / Übungen Lernziele der Übung Theorie Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Was ist ein DW? Was versteht man unter einem ETLProzess? … 4 SAP-Praxis Wie ist die Software aufgebaut? Wie funktioniert die Software? … 1 Grundlagen 2 SAP CRM 3 SAP BI Übersicht 3.1 Einführung 3.2 Data Warehouse 3.3 Business Intelligence 1 Grundlagen 2 SAP CRM 3 SAP BI 3.1 Übersicht 3.2 3.3 Einführung 3.1.1 Definition analytisches CRM 3.1.2 Closed-Loop-Prozess 3.1.3 SAP Data Warehouse 3.2.1 Definition Data Warehouse 3.2.2 ETL Prozess 3.2.3 SAP NetWeaver BI Business Intelligence 1 Grundlagen 2 SAP CRM 3 SAP BI 3.1 Übersicht 3.2 3.3 Einführung 3.1.1 Definition analytisches CRM 3.1.2 Closed-Loop-Prozess 3.1.3 SAP Data Warehouse 3.2.1 Definition Data Warehouse 3.2.2 ETL Prozess 3.2.3 SAP NetWeaver BI Business Intelligence 1 Grundlagen 2 SAP CRM 3 SAP BI 3.1 Übersicht 3.2 3.3 Einführung 3.1.1 Definition analytisches CRM 3.1.2 Closed-Loop-Prozess 3.1.3 SAP Data Warehouse 3.2.1 Definition Data Warehouse 3.2.2 ETL Prozess 3.2.3 SAP NetWeaver BI Business Intelligence 3.1 Einführung 9 3.1.1 Definition analytisches CRM SalesProzesse Enterprise Ressource Planning Back Office Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Supply Chain Management MarketingProzesse Interaktions- Pers. Kontakt Telefon kanäle Customer Außendienst Filiale Touch Points CRMAnwendungen WWW Brief/Fax Innendienst Operative CRM-Systeme E-Mail Etc. CIC Website Etc. Kampagne Opportunity Lead Angebot/Auftrag Stammdaten BasisAnwendungen ServiceProzesse Kontakt Aktivitäten Feedback Support Workflow Eskalation Operative Kundendatenbank Data Warehouse Analytische CRM-Systeme Data Mining OLAP Quelle: in Anlehnung an: Hippner/Wilde 2006, S. 48; Kemper/Baars 2008, S. 2 Analytisches CRM dient der Untersuchung des Kundenbestandes und -verhaltens. In diesem Umfeld werden auf der Basis kundenzentrierter Data Warehouses mit Hilfe von Analysesystemen (vor allem Data Mining und OLAP) Kundenwertmodelle, Kundensegmentierung bzw. -klassifikationen und kundenspezifische Verhaltensänderungen ermittelt (Churn-Analysen). 1 Grundlagen 2 SAP CRM 3 SAP BI 3.1 Übersicht 3.2 3.3 Einführung 3.1.1 Definition analytisches CRM 3.1.2 Closed-Loop-Prozess 3.1.3 SAP Data Warehouse 3.2.1 Definition Data Warehouse 3.2.2 ETL Prozess 3.2.3 SAP NetWeaver BI Business Intelligence 3.1 Einführung 11 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.1.2 Closed-Loop-Prozess Geschlossener Regelkreis verschafft strategischen Mehrwert und bindet Kunden langfristig. Im operativen Bereich gewonnene Daten werden im analytischen CRM ausgewertet. Die daraus abgeleiteten Erkenntnisse werden in den Produktionsprozess eingearbeitet, verwirklicht und somit wieder in den operativen Verfahren eingespeist. Der Regelkreis ist geschlossen! Ergebnis: - Gezieltere Kundenansprache - Intensivere Kundenbindung 3.1 Einführung 3.1.2 Closed-Loop-Prozess Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Praktische Anwendungen: Service-Hotline Kundenbefragung After Sales Management (Postkarte beilegen) Internet: Verkaufsportale, Online Marketing, Verfahren um Verhalten der Internetbesucher zu analysieren Kombi-Produkte: Amazon Kunden die dieses Buch gekauft haben, haben auch … gekauft. 12 3.1 Einführung 13 3.1.2 Closed-Loop-Prozess Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Ziel: Operative Daten in analysierbare Informationen umzuwandeln, daraus Action Knowledge (handlungsauslösendes Wissen) zu generieren, um damit wieder Einfluss auf die operativen Systeme zu nehmen. Quelle: Egger et al. 2007a, S. 27 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.1 3.1.2 Closed-Loop-Prozess Einführung Quelle: Egger et al. 2007a, S. 57 14 Ziel: Eliminieren der Wissenslücke! 3.1 Einführung 3.1.2 Closed-Loop-Prozess Voraussetzung: Unternehmensweite, konsistente Informationslandschaft als Basis. Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Die 5 Schritte des Closed-Loop Business Analytics Process: 1. Verfolgen 2. Analysieren 3. Modellieren 4. Entscheiden 5. Handeln Quelle: Egger et al. 2007a, S. 27 ff. 15 3.1 Einführung 3.1.2 Closed-Loop-Prozess Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Closed-Loop Business Analytics Process – 1. Schritt: Verfolgen Datenbeschaffung und Datenhaltung Extraktion der Daten aus allen relevanten operativen Systemen (entweder zeitversetzt oder Echtzeit) Bereinigung, Umwandlung, Anreicherung und Vereinheitlichung der Daten SAP: Laden und Lagerung der bereinigten Daten im Enterprise Data Warehouse Layer des Data Warehouses Quelle: Egger et al. 2007a, S. 27 f. 16 3.1 Einführung 3.1.2 Closed-Loop-Prozess Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Closed-Loop Business Analytics Process – 2. Schritt: Analysieren Datenbereitstellung, Daten stehen für Analyse mit Business IntelligenceWerkzeugen zur Verfügung Möglichkeit von Query, Reporting und multidimensionale Analysen Beantwortung der Fragen: Was ist passiert? Wie ist es passiert? Wann ist es passiert? Es fehlen jedoch die Antworten auf folgende Fragen: Welche Entscheidungsalternativen gibt es? Was ist die optimale Entscheidung? Was sind die Tragweiten, Konsequenzen dieser Entscheidung ? Was wird passieren? Quelle: Egger et al. 2007a, S. 27 f. 17 3.1 Einführung 3.1.2 Closed-Loop-Prozess Closed-Loop Business Analytics Process: Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Evolutionspfad analytischer Methoden Quelle: Egger et al. 2006, S. 58 18 3.1 Einführung 3.1.2 Closed-Loop-Prozess Closed-Loop Business Analytics Process – 3. Schritt: Modellieren Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Kreieren von Regeln, Klassifizierungen und weiteren Modellen mit Hilfe von Advanced-Analytics-Werkzeugen (fortschrittliche Analyse Werkzeuge) Einsatz von: Entscheidungsmodellierung Prognostik Simulation Optimierung Risikoanalyse Quelle: Egger et al. 2007a, S. 28 19 3.1 Einführung 3.1.2 Closed-Loop-Prozess Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Closed-Loop Business Analytics Process – 4. Schritt: Entscheiden Auf Basis von soliden Informationen, die auch anwendergerecht präsentiert wurden, Entscheidungen zu treffen. Grundlage bietet der Zugriff auf die konsistenten und integrierten Informationen. Quelle: Egger et al. 2007a, S. 29 f. 20 3.1 Einführung 3.1.2 Closed-Loop-Prozess Closed-Loop Business Analytics Process – 5. Schritt: Handeln Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Bildet die Rückkopplung zu den operativen Prozessen im Unternehmen Vollautomatisch = Retraktion Entscheider mit handlungsauslösendem Wissen = manuelle Rückkopplung Beispiele: Weitere Marketing Kampagne auf Basis der Ergebnisse früherer Kampagnen Automatische Sperrung einer Kreditkarte im Falle des Betrugsverdachts (Transaktionsanalyse!) Aufgrund von Kundenprofilen Kredite gewähren oder verweigern Quelle: Egger et al. 2007a, S. 29 f. 21 3.1 Einführung 3.1.2 Closed-Loop-Prozess Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Ziele des Closed-Loop-Prozesses: Den Prozess an sich beschleunigen ohne zu schnelle vorzeitige Entscheidungen zu treffen. Präzision bei der Entscheidungsfindung! Verständnis der Auswertungsergebnisse und Marktkenntnisse, um echte Wettbewerbsvorteile zu generieren! Quelle: Egger et al. 2007a, S. 30 22 1 Grundlagen 2 SAP CRM 3 SAP BI 3.1 Übersicht 3.2 3.3 Einführung 3.1.1 Definition analytisches CRM 3.1.2 Closed-Loop-Prozess 3.1.3 SAP Data Warehouse 3.2.1 Definition Data Warehouse 3.2.2 ETL Prozess 3.2.3 SAP NetWeaver BI Business Intelligence Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.1 3.1.3 SAP Einführung 24 3.1 Einführung Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.1.3 SAP SAP: Systeme, Anwendungen und Produkte in der Datenverarbeitung Aktiengesellschaft Größter europäischer und weltweit 4. größter Softwarehersteller 53 513 Mitarbeiter Über 100 000 Kunden und 12. Mio Anwender Niederlassungen in mehr als 50 Ländern Umsatz in 2011: 14,233 Mrd. Euro Quelle: SAP 25 3.1 Einführung 26 3.1.3 SAP Externe Entwicklungen Entwicklungsverlauf: Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Grau = informationstechnologische Konzepte Schwarz = dazugehörige SAP Lösungen SAP Produktentwicklungen Quelle: Einkauf.Österreich.com 3.1 Einführung 27 3.1.3 SAP SAP ERP SAP CRM Operative Prozesse Nachfragefluss Auftragserfüllungsfluss Finanzmittelfluss Beschaffungspartner Analytische Prozesse Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde SAP SCM/APO Quelle: SAP Unternehmen Analyse und Reporting SAP Netweaver BI Vertriebspartner Kunde 3.1 Einführung 3.1.3 SAP ERP Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde FI (Financial Accounting) FI CO: Controlling CO-PC: Kostenträgerrechnung (Product Costing) CO-OM-CEL: Kostenartenrechnung (Cost Element Accounting) CO-OM-CCA: Kostenstellenrechnung (Cost Center Accounting) SEM: Strategic Enterprise Management EC: Enterprise Controlling PSM: Haushaltsmanagement (Public Sector Management) PS: Projektabwicklung (Project System) Human Capital Management PA: Personnel Management Logistics MM: Materialwirtschaft (Materials Management) PP: Produktionsplanung und -steuerung (Production Planning and Control) LE: Lagerverwaltung, Versand und Transport (Logistics Execution) IS: Branchenlösungen Quelle: SAP 28 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.1 3.1.3 SAP NetWeaver BI Menübaum Einführung Quelle: SAP NetWeaver BI 29 3.1 Einführung Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.1.3 SAP NetWeaver BI: Data Warehousing Workbench Nur im Bereich des BI Training KU Eichstätt-Ingolstadt / Übung SoSe 12 wird gearbeitet!!! Quelle: SAP NetWeaver BI 30 3.1 Einführung 3.1.3 SAP NetWeaver BI Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Wichtige Symbole: Enter Freigabe / Bestätigung der getätigten Eingabe Sichern Sichern der zuvor eingegebenen Daten Zurück man gelangt eine Anwendungsstufe zurück auf den vorherigen Bildschirm Beenden aktuelle Anwendung wird ohne Datensicherung verlassen Abbrechen beendet Anwendung ohne Speicherung der Daten Suchen Suchen von Daten, die auf dem aktuellen Bildschirm angezeigt werden F1-Hilfe kurze Feldhilfe zu dem Feld auf dem sich der Cursor befindet Anzeigen <-> Ändern wechselt vom Anzeigen in den Änderungsmodus Aktivieren aktiviert die getätigte Eingabe / Änderung Neu anlegen gibt die Möglichkeit zur Neuanlage eines Objektes Auffrischen integriert die neuen Änderungen und zeigt aktuelle Situation an F4 Werthilfe Quelle: SAP NetWeaver BI 31 3.1 Einführung 3.1.3 SAP NetWeaver BI Symbole: Merkmal Kennzahl Dimension Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Info Objekt Katalog InfoCube DataSource InfoProvider InfoObjects Quelle: SAP NetWeaver BI 32 3.1 Einführung Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.1.3 SAP NetWeaver BI: Customizing 33 Nach Erwerb eines SAP-Systems muss die Software an die unternehmensspezifischen Anforderungen angepasst werden. Customizing bezeichnet die Vorgehensweise der Systemkonfiguration, in der die Mitarbeiter des Projektteams Systemeinstellungen vornehmen. Customizing wird im SAP-System über den Einführungsleitfaden (IMG: Implementation Guide) vorgenommen. IMG: Werkzeug zur Anpassung des SAP-Systems an die betriebswirtschaftlichen Anforderungen im Unternehmen. Alle Änderungen die im Customizing vorgenommen werden haben später Auswirkungen auf die Handhabung des Systems. -> Nur Dokumentationen betrachten, keine Änderungen durchführen!!! Quelle: SAP Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.1 3.1.3 SAP NetWeaver BI: Customizing Einführung Quelle: SAP NetWeaver BI 34 3.1 Einführung 3.1.3 SAP NetWeaver BI Benutzeroberfläche Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Login Die Kommunikation zwischen dem Benutzer und dem SAP System erfolgt üblicherweise über das SAP GUI (Graphical User Interface) und ist lokal auf den entsprechenden Clients installiert. Eingabe: VS_12-XX (Nummer wird vom Dozenten vergeben!) Passwort: winter Quelle: SAP NetWeaver BI 35 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.1 3.1.3 SAP NetWeaver BI Benutzeroberfläche Einführung Übungen 1-10: Einführende Aufgaben zu SAP NetWeaver BI 36 1 Grundlagen 2 SAP CRM 3 SAP BI 3.1 Übersicht 3.2 3.3 Einführung 3.1.1 Definition analytisches CRM 3.1.2 Closed-Loop-Prozess 3.1.3 SAP Data Warehouse 3.2.1 Definition Data Warehouse 3.2.2 ETL Prozess 3.2.3 SAP NetWeaver BI Business Intelligence 1 Grundlagen 2 SAP CRM 3 SAP BI 3.1 Übersicht 3.2 3.3 Einführung 3.1.1 Definition analytisches CRM 3.1.2 Closed-Loop-Prozess 3.1.3 SAP Data Warehouse 3.2.1 Definition Data Warehouse 3.2.2 ETL Prozess 3.2.3 SAP NetWeaver BI Business Intelligence 3.2 Data Warehouse 39 3.2.1 Definition Ausgangsproblematik (d.h. ohne Data Warehouse) Nachfolgende Abbildung (Heine 1999, S. 75) veranschaulicht die damit i.d.R. verbundene Speicherung der Daten in unterschiedlichen Datenbanksystemen mit abweichenden physikalischen und logischen Strukturen. Vorstandsinformationssystem Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Managementunterstützendes Teilinformationssystem Datenauswertung Datengenerierung Marketinginformationssystem Individuelle Lösungen Operatives Teilinformationssystem Verteilung Auftragssystem Finanzinformationssystem Fakturierungssystem Buchhaltungssystem Aus Sicht der Datenauswertung bedeutet dies, dass Informationen auf horizontaler Ebene über mehrere operative Anwendungssysteme - teilweise redundant - verteilt sind und informationelle Zusammenhänge durch u.a. unterschiedliche Modelle, Schlüsselung und Zeitbezüge der Bewegungsdaten verloren gehen. Quelle: Heine, P. (1999): Unternehmensweite Datenintegration - modular-integrierte Datenlogistik in betrieblichen Informationssystemen, Stuttgart [u.a.]. 3.2 Data Warehouse 3.2.1 Definition 40 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Ausgangsproblematik (d.h. ohne Data Warehouse) Zudem werden teilweise Daten individuell zum Zweck der Auswertung direkt aus den operativen Systemen extrahiert. Dies führt zu einer Belastung der operativen Systeme, zu Medienbrüchen und innerhalb des managementunterstützenden Teilinformationssystems teilweise zu personenspezifischen Datenbanken, die von einzelnen Anwendern weiterverarbeitet und ausgewertet werden. Dies wiederum führt entlang der vertikalen Ebenen der InformationssystemPyramide zu starkem Wachstum, Heterogenität und Redundanz der Datenbestände und damit zu einer mangelhaften Datenqualität (Heine 1999, S. 72 ff.). Insgesamt entsteht für das Herauslösen und Zusammenführen von Daten zum Zweck der Auswertung ein sehr hoher Aufwand. Das Konzept des Data Warehouse wurde entwickelt, um die genannten Integrationsdefizite zu beheben. Es hat in der Praxis eine rasche Verbreitung erfahren und wesentlich zur „Reifung“ der MSS beigetragen. Quelle: Heine, P. (1999): Unternehmensweite Datenintegration - modular-integrierte Datenlogistik in betrieblichen Informationssystemen, Stuttgart [u.a.]. 3.2 Data Warehouse 3.2.1 Definition 41 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Begriffsabgrenzung und Eigenschaften Der Data-Warehouse-Begriff umfasst sowohl technische als auch betriebswirtschaftliche Aspekte. Data Warehouse : Datenbank, „die aus der technischen Sicht Daten aus verschiedenen Datenquellen integriert und aus der betriebswirtschaftlichen Sicht dem Anwender diese Daten zu Analysezwecken zur Verfügung stellt“ (Bauer/Günzel 2004, S. 5). Data Warehouse : Eine von den operationalen Systemen isolierte Datenbank, „die als unternehmensweite Datenbasis für alle Ausprägungen managementunterstützender Systeme dient und durch eine strikte Trennung von operationalen und entscheidungsunterstützenden Daten und Systemen gekennzeichnet ist“ (Mucksch/Behme 2000, S. 6). Zu den Leitgedanken des Data Warehouse zählen somit Integration, Separation und Informationsbereitstellung für Analysezwecke. Quelle: Bauer, A.; Günzel, H. (2004): Data Warehouse Systeme - Architektur Entwicklung Anwendung, 2. Aufl., Heidelberg. Mucksch, H.; Behme, W. (2000): Das Data Warehouse-Konzept als Basis einer unternehmensweiten Informationslogistik. In: Mucksch, H.; Behme, W. (Hg.): Das Data Warehouse-Konzept - Architektur - Datenmodelle - Anwendungen, 4. Aufl., Wiesbaden, S. 3-80. 3.2 Data Warehouse 3.2.1 Definition 42 Begriffsabgrenzung und Eigenschaften Integration: Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Übernahme von Daten aus unterschiedlichen Vorsystemen mit verschiedenen Datenhaltungen (z.B. relationale Datenbanken, hierarchische Datenbanken, FlatFiles) und Datenformaten (z.B. Datenbank-Tabellen, unstrukturierte Textdateien, Bild-Dateien). Zu den Vorsystemen gehören nicht nur die internen operativen Informationssysteme, mit denen die Geschäftsvorfälle des betrieblichen Basissystems in Transaktionen innerhalb des Informationssystems abgebildet werden (Online Transaction Processing Systems, OLTP), sondern auch externe Systeme, wie z.B. kommerzielle Datenbanken. Relevante atomare Daten der Vorsysteme werden periodisch extrahiert, in vielfältiger Weise aufbereitet und im Data Warehouse systematisch zusammengeführt (vgl. Chamoni/Gluchowski 2006, S. 12). Nach den englischen Bezeichnungen der Teilschritte - „Transformation“, „Extraction“ und „Loading“ - wird dieser Vorgang auch als „ETL-Prozess“ bezeichnet. Quelle: Chamoni, P.; Gluchowski, P. (2006): Analytische Informationssysteme - Einordnung und Überblick. In: Chamoni, P.; Gluchowski, P. (Hg.): Analytische Informationssysteme - Business Intelligence-Technologien und Anwendungen, 3. Aufl., Berlin [u.a.], S. 3-22. 3.2 Data Warehouse 43 3.2.1 Definition Begriffsabgrenzung und Eigenschaften Separation: Beeinträchtigungen eines operativen Systems durch darauf ausgeführte analytische Abfragen lassen sich technisch kaum verhindern. Nachfolgende Abbildung (leicht modifiziert nach Mucksch/Behme 2000, S. 16) verdeutlicht, dass die Auslastung der zugrunde liegenden Hardware bei den transaktional ausgerichteten operativen Systemen relativ gleichmäßig ist. operative DV-System e Managem entunterstützungssystem e HW-Nutzung HW-Nutzung Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Basiert auf der Erkenntnis, dass die operativen Vorsysteme durch analytische Abfragen nicht in ihrem reibungslosen Betrieb gestört werden dürfen. Zeit Zeit Quelle: Mucksch, H.; Behme, W. (2000): Das Data Warehouse-Konzept als Basis einer unternehmensweiten Informationslogistik, in: Mucksch, H.; Behme, W. (Hg.): Das Data Warehouse-Konzept - Architektur - Datenmodelle - Anwendungen, 4. Aufl., Wiesbaden, S. 3-80. 3.2 Data Warehouse 3.2.1 Definition Begriffsabgrenzung und Eigenschaften Informationsbereitstellung für Analysezwecke : Hard- und Software sowie Datenmodell der operativen Systeme sind für die schnelle Bearbeitung von kurzen, einfachen Transaktionen ausgelegt, wobei die Anfragen keine modellseitige Bevorzugung haben und damit auf einem anfrageflexiblen Datenmodell basieren. Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Analytische Abfragen hingegen umfassen sehr viele Datensätze in langen Lesetransaktionen und benötigen ein analysebezogenes Datenmodell. Die Daten der operativen Systeme sind zeitaktuell und ständigen Modifikationen unterworfen. Analytische Anwendungen dagegen benötigen konsolidierte, stabile und meist aggregierte Daten. Das Datenbankschema des Data Warehouse muss sich dem Einsatzzweck anpassen und wird im Gegensatz zu den OLTP-Systemen nicht anwendungsneutral, sondern auswertungsorientiert mit vorgedachten Analysepfaden ausgelegt Dies spricht ebenfalls für die Separation von operativen und Data WarehouseSystemen. Quelle: Bauer, A.; Günzel, H. (2004): Data Warehouse Systeme - Architektur Entwicklung Anwendung, 2. Aufl., Heidelberg, S. 8 ff. 44 3.2 Data Warehouse 3.2.1 Nutzenpotenziale eines Data Warehouse Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Gründe für ein gesondertes Data Warehouse: Quelle: SAP Themenorientierung Vereinheitlichung Zeitraumorientierung Beständigkeit 45 3.2 Data Warehouse 3.2.1 Nutzenpotenziale eines Data Warehouse 46 Begriffsabgrenzung und Eigenschaften Data Warehouse-Systeme haben sich als Zwischenschicht durchgesetzt, die dispositive und operative Applikationen entkoppelt (s. Abbildung, leicht modifiziert nach Strauch 2002, S. 24). Das Data Warehouse stellt somit ein Teilinformationssystem des betrieblichen Informationssystems dar. Es handelt sich hierbei weder um einen Standard, noch um ein Produkt, sondern viel mehr um eine Architektur, deren Umsetzung für jedes Unternehmen unterschiedliche Software- und HardwareKomponenten umfasst und einen sehr hohen Anteil an Fachwissen benötigt (Heine 1999, S. 112). Vorstandsinformationssystem Managementunterstützendes Teilinformationssystem Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Marketinginformationssystem Data WarehouseZwischenschicht Finanzinformationssystem Data Warehouse Operatives Teilinformationssystem Auftragssystem Fakturierungssystem Buchhaltungssystem Quelle: Heine, P. (1999): Unternehmensweite Datenintegration - modular-integrierte Datenlogistik in betrieblichen Informationssystemen, Stuttgart [u.a.]. Strauch, B. (2002): Entwicklung einer Methode für die Informationsbedarfsanalyse im Data Warehousing, Bamberg. 3.2 Data Warehouse 47 3.2.1 Definition SalesProzesse Enterprise Ressource Planning Back Office Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Supply Chain Management MarketingProzesse Quelle: Hippner/Wilde 2006, S. 48 Interaktionskanäle Customer Touch Points CRMAnwendungen BasisAnwendungen Operative CRM-Systeme Pers. Kontakt ServiceProzesse WWW Telefon Außendienst E-Mail Brief/Fax Etc. Innendienst Filiale CIC Website Etc. Kampagne Opportunity Feedback Lead Angebot/Auftrag Support Stammdaten Kontakt Aktivitäten Workflow Eskalation Operative Kundendatenbank Data Warehouse Analytische CRM-Systeme Data Mining OLAP 3.2 Data Warehouse 3.2.1 Architektur des Data Warehouse Systems Abfrage- und Analysewerkzeuge Direktzugriff Analysen Berichte Benutzerschnittstelle bzw. Output-Schicht Metadaten Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Verdichtungsstufe n Verdichtungsstufe 2 Data Marts Verdichtungsstufe 1 Datenbasis Archivierungssysteme Datenschnittstelle bzw. Input-Schicht Transformationsprogramme Unternehmensinterne und –externe transaktionsorientierte Daten Quelle: in Anlehnung an: Mucksch/Behme 1996, S. 64 ff. 48 3.2 Data Warehouse 3.2.1 Nutzenpotenziale eines Data Warehouse Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Technischer Nutzen 49 Betriebswirtschaftlicher Nutzen Verbesserte Datenintegration Keine dezentralen Datenprüfungen mehr notwendig Verbesserte Informationsbereitstellung Frühzeitiges Erkennen von Trends Schnelle Abfragen möglich Entlastung operativer Anwendungen Zügige Reaktion auf Umweltveränderungen Verbesserung der Kundenzufriedenheit Harmonisierung von Begriffen Flexible Zugriffsmöglichkeiten Quelle: SAP 3.2 Data Warehouse Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.2.1 Nutzenpotentiale eines OLTP im Vergleich zum Data Warehouse Online Transaction Processing DWH 50 Ziel Effizienz durch Automation Vorteile durch Wissensgenerierung Inhalt der Daten Anwendungs- & funktionsbezogen Themenbezogen Art der Daten Transaktionsdaten Aggregierte- & Transaktionsdaten Alter der Daten Aktuell, zeitnah: 30-60 Tage Historisch, aktuell, zukünftig Datenvolumen Klein Sehr umfangreich Hauptfunktionalität Häufige Änderungen Zeitabhängige Auswertungen State of the Art beim Normalisiert Relationale & multidimensionale DB Erlaubte Operationen auf Einfügen, Aktualisieren, Löschen, Lesen den Datenbestand Lesen Datenbanksystem Quelle: SAP 1 Grundlagen 2 SAP CRM 3 SAP BI 3.1 Übersicht 3.2 3.3 Einführung 3.1.1 Definition analytisches CRM 3.1.2 Closed-Loop-Prozess 3.1.3 SAP Data Warehouse 3.2.1 Definition Data Warehouse 3.2.2 ETL Prozess 3.2.3 SAP NetWeaver BI Business Intelligence 3.2 Data Warehouse 3.2.2 ETL Prozess Bevor BI relevante Daten im DW bereit gestellt werden können, sind umfangreiche Bearbeitungsaktivitäten erforderlich. Im ETL-Prozess werden die operativen Systeme aufgegriffen und in Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde betriebswirtschaftlich interpretierbare Daten transformiert. ETL besteht aus 3 nachfolgenden Prozessschritten: Extraktion der relevanten Daten aus verschiedenen Quellen (Filterung) Transformation der Daten in das Schema und Format der Zieldatenbank (syntaktische und semantische Datenaufbereitung) Laden der Daten in das Data Warehouse (Datenübernahme in das DW) 52 3.2 Data Warehouse 53 3.2.2 ETL Prozess Extraktion Data Warehouse Erster Schritt Auswahl der Daten aus Quellsystem Vorbereitung der Daten für Transformation In der Regel wird nur ein Ausschnitt aus den Quelldaten selektiert Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Bereinigte Rohdaten Extrakt Interne Datenquelle Extrakt Externe Datenquelle 3.2 Data Warehouse 3.2.2 ETL Prozess Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Datenquellen Meist aus verschiedenen Informationssystemen Oftmals bestehen sie aus unterschiedlichen Datenformaten und Datenstrukturen. Im Idealfall sind die Daten in relationalen Datenbanken abgelegt. Unstrukturierte Textdaten lassen sich nur schwer einlesen! ETL- Tools ermöglichen den Zugriff auf vielfältige Datenformate. Quelle: SAP 54 3.2 Data Warehouse 3.2.2 ETL Prozess Aktualität der Datenquellen Extraktion muss regelmäßig stattfinden Asynchrone Extraktion Periodisch Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Ereignisgesteuert Nachfragegesteuert Synchrone Extraktion Oftmals stehen für das Auslesen aus operativen Datenbestände nur begrenzt Zeitfenster zur Verfügung; daher nachts Zugriff auf Quellsysteme um den operativen Tagesbetrieb nicht durch aufwendige Lese- und Kopiervorgänge zu behindern! Quelle: SAP 55 3.2 Data Warehouse 56 3.2.2 ETL Prozess Transformation Unterteilung des Transformationsprozesses Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde in 4 Einzelschritte: Quelle: Kemper/Finger 2006, S. 116 1. Filterung 2. Harmonisierung 3. Aggregation 4. Anreicherung 3.2 Data Warehouse 3.2.2 ETL Prozess 57 Transformation – 1. Schritt: Filterung Filterung: Extraktion und Bereinigung syntaktischer und inhaltlicher (semantischer) Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Defekte der Daten Syntaktische Mängel: falsche Steuerzeichen, formale Fehler Semantische Mängel: Fehler betriebswirtschaftlich-inhaltlicher Art (offensichtlich falsche Umsatzzahlen) Quelle: Kemper/Finger 2006, S. 114 ff. 3.2 Data Warehouse 3.2.2 ETL Prozess Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Unterscheidung: Mängel 1., 2. und 3. Klasse 1. Klasse: lassen sich automatisch erkennen und während des Extraktionsvorgangs auch automatisch korrigieren 2. Klasse: Defekterkennung erfolgt automatisch, die Korrektur muss aber nach dem Extraktionsvorgang manuell vorgenommen werden 3. Klasse: Mängel können ausschließlich manuell erkannt und korrigiert werden Die Mängel 2. und 3. Klasse bedingen kurz- oder mittelfristig eine Fehlerbereinigung in den operativen Quellsystemen! Quelle: Kemper/Finger 2006, S. 114 ff. 58 3.2 Data Warehouse 3.2.2 ETL Prozess 59 Syntaktische Mängel: Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 1. Klasse: Bekannte Formatanpassungen Beispiel: intern verwendete Sonderzeichen werden durch MappingTabellen automatisch beim Extrahieren erkannt und bereinigt 2. Klasse: Erkennbare Formatinkompatibilitäten Beispiel: Entdecken bislang unberücksichtigter Syntaxvarianten der operativen Datenquellen / erkennbare Formatinkompatibilitäten Quelle: Kemper/Finger 2006, S. 114 ff. 3.2 Data Warehouse 3.2.2 ETL Prozess 60 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Semantische Mängel: 1. Klasse: Fehlende Datenwerte 2. Klasse: Ausreißerwerte / unstimmige Wertekonstellationen Beispiel: Negative Umsatzzahlen; Abhilfe durch Plausibilitätskontrollen, Domänenüberprüfung zur Identifikation fehlerhafter Datenfelder 3. Klasse: Unerkannte semantische Fehler in operativen Quellen Beispiel: Zuordnung Produkte zu Produktgruppen; Extrahierte Daten enthalten inkorrekte Datenwerte Quelle: Kemper/Finger 2006, S. 114 ff. 3.2 Data Warehouse 3.2.2 ETL Prozess Transformation – 2. Schritt: Harmonisierung der Daten Die gefilterten und bereinigten Daten werden zusammengeführt Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3 Problemklassen: Abgleichen von Kodierungen, Synonymen und Homonymen Auflösen von Schlüsselharmonien Betriebswirtschaftliche Harmonisierung Quelle: Kemper/Finger 2006, S. 114 ff. 61 3.2 Data Warehouse 3.2.2 ETL Prozess Kodierung: Einzelne Datenbestände können unterschiedlich kodiert sein. So könne Attribute wie Geschlecht in Datenquelle 1 als „M“ / „W“ kodiert sein, in Datenquelle 2 als „0“ / „1“ Variable -> Harmonisierung durch einheitlichen Attributwert „0“ / „1“ Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 62 3.2 Data Warehouse 3.2.2 ETL Prozess 63 Synonyme = unterschiedliche Attributnamen können die gleiche Bedeutung haben. Beispielsweise kann in Datenquelle 1 für den Namen von Betriebsmitarbeitern das Attribut „Personal“ vorgesehen sein, in Datenquelle 2 aber „Mitarbeiter“ Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde -> Harmonisierung durch identische Attributnamen Homonyme = gleiche Attributnamen können unterschiedliche Bedeutung haben. In Datenquelle 1 kann „Partner“ den Namen von Kunden bezeichnen, in Datenquelle 2 den Namen von Lieferanten -> Harmonisierung durch unterschiedliche Attributnamen 3.2 Data Warehouse 3.2.2 ETL Prozess 64 Auflösung von Schlüsseldisharmonien Beim Zusammenführen von Daten aus mehrer Datenbanken ist ein gemeinsamer Primärschlüssel notwenig. Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Mit Hilfe von Zuordnungstabellen wird jedem neuen Kunden ein künstlicher Primärschlüssel generiert. Die Primärschlüssel der operativen Systeme werden als Fremdschlüssel mitgeführt, so dass übergreifende Datenauswertungen möglich sind. Im letzten Schritt erfolgt die Vereinheitlichung betriebswirtschaftlicher Begriffe. Bsp.: Währungen, Periodenzählweise, Einheiten etc. Quelle: SAP 3.2 Data Warehouse 3.2.2 ETL Prozess Beispiel: Schlüsseldisharmonien Kundenreklamation eines schadhaften Ersatzteils. Herstellerfirma hat anderen Schlüssel als Vertriebsfirma Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde -> Garantiefall ohne angelegten Lieferantenschlüssel und ohne Beschaffungssystem, kein Kundenschlüssel bekannt -> Lieferant des schadhaften Ersatzteils ist nicht identifizierbar! Quelle: SAP 65 3.2 Data Warehouse 3.2.2 ETL Prozess Transformation – 3. Schritt: Aggregation Betriebswirtschaftliche Aufbereitung. Die Daten werden in die gewünschte Granularität (Detaillierungsebene der abgelegten Daten innerhalb eines DWH) Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde überführt. Aggregationsalgorithmen für tagesaktuelle Daten zusammenfassen Vorsummierung für betriebswirtschaftliche Kennziffern Entwicklung von Dimensionshierarchietabellen (Kunde, Kundengruppe, Gesamt) Wichtiger Einschnitt was „Neutralität“ der Daten betrifft Quelle: Kemper/Baars 2008, S. 10; Kemper /Finger 2006, S. 114 ff. 66 3.2 Data Warehouse 3.2.2 ETL Prozess Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Granularität Beschreibt den Detaillierungsgrad von Daten Sehr detaillierte Daten haben eine niedrige Granularität Mit steigender Verdichtung der Daten wird eine höhere Granularität erreicht Die Granularität wirkt sich unmittelbar auf den benötigten Speicherplatz, die Verarbeitungsgeschwindigkeit und die Flexibilität des Data Warehouses aus Quelle: Kemper/Finger 2006, S. 132 67 3.2 Data Warehouse 68 3.2.2 ETL Prozess Transformation – 4. Schritt: Anreicherung Aufweichung der strikten Trennung zwischen Daten und Programmlogik. Die Daten werden um betriebswirtschaftliche Kennziffern expandiert. Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Vorteile: Abfragen sind effizienter durchführbar Die errechneten Werte sind wegen der einmaligen Berechnung konsistenter Es liegt ein abgestimmtes betriebswirtschaftliches Instrumentarium vor Dieser Prozess findet in der Staging Area statt! Quelle: Skript Wirtschaftsuniversität Wien 3.2 Data Warehouse 3.2.2 ETL Prozess 69 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Laden der geprüften Daten Die vorbereiteten Daten werden in das Data Warehouse integriert. Hierzu müssen sie physikalisch in die Datenbank des DW verschoben werden und darauf aufbauende Datenanalysesysteme aktualisiert werden. Das Laden aus der Staging Area in das DW soll möglichst effizient geschehen, daher werden meist nicht alle Daten bei jeder Aktualisierung geladen, sonder nur die Neuen. Um operativen Betrieb nicht zu beeinträchtigen wird der ETL Prozess meist über Nacht abgewickelt. Quelle: SAP 1 Grundlagen 2 SAP CRM 3 SAP BI 3.1 Übersicht 3.2 3.3 Einführung 3.1.1 Definition analytisches CRM 3.1.2 Closed-Loop-Prozess 3.1.3 SAP Data Warehouse 3.2.1 Definition Data Warehouse 3.2.2 ETL Prozess 3.2.3 SAP NetWeaver BI Business Intelligence 3.2 Data Warehouse 3.2.3 Vom DW zum SAP NetWeaver BI Abfrage- und Analysewerkzeuge Direktzugriff Analysen Berichte Verdichtungsstufe n Verdichtungsstufe 2 Metadaten Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Benutzerschnittstelle bzw . Output-Schicht Data Marts Verdichtungsstufe 1 Datenbasis ArchivierungsArchivierungs systeme Datenschnittstelle bzw. Input-Schicht Transformationsprogramme Unternehmensinterne - und -externe transaktionsorientierte Daten Quelle: SAP 71 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.2 3.2.3 SAP NetWeaver BI Data Warehouse Quelle: http://www.uniorg.de/page/sap_beratung_netweaver_soa 72 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.2 3.2.3 Integration SAP NetWeaver BI im SAP NetWeaver Quelle: SAP Data Warehouse 73 3.2 Data Warehouse 3.2.3 Integration SAP NetWeaver BI im SAP NetWeaver Data Warehouse Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde BI Plattform BI Suite: Business Explorer Entwicklertechnologien Quelle: SAP 74 3.2 Data Warehouse Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.2.3 SAP NetWeaver BI – Body of Information Quelle: http://www.youtube.com/watch?v=zB-uBLI_30Q SAP 75 3.2 Data Warehouse 3.2.3 … zur Praxis SAP NetWeaver BI Die SAP-Lösung für den DWH Bereich ist das SAP NetWeaver BI, sprich es handelt sich um eine von SAP entwickelte Applikation eines Data Warehouses Das SAP NetWeaver BI: 76 ist für die Datenhaltung und Datenanalyse von SAP interner und externer Daten entwickelt worden Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde ist inzwischen die Grundlage für verschiedene SAP Anwendungen geworden dient der Unterstützung von strategischen und operativen Unternehmensentscheidungen. Dabei werden Warehouse-Technologien mit vorkonfigurierten betriebswirtschaftlichen Inhalten (Business Content) miteinander verbunden. Auf diese Weise wird ein umfassender Überblick über unternehmensinterne und –externe Daten geboten. Quelle: SAP 3.2 Data Warehouse 77 3.2.3 Definition SAP NetWeaver BI Die 3 Ebenen des SAP NetWeaver BI: Präsentationsebene (Auswertungen) Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Administrationsebene (Aufbereitung der Daten) Zentraler Punkt: Data Warehousing Workbench Extraktionsebene (Datenbeschaffung) Quelle: SAP 3.2 Data Warehouse 78 3.2.3 Administrator Workbench Zentraler Punkt der BW Verwaltung und Steuerung Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde BW Erstellung Pflege Überwachung Datenübernahme einplanen Daten laden Datenübernahme überwachen Fortschreibungsprozess überwachen 3.2 Data Warehouse 79 3.2.3 Extraktion im SAP NetWeaver BI Data Warehousing Workbench: Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Funktionsbereiche: Quelle: SAP NetWeaver BI Modellierung Administration Transportanschluss Dokumente Business Content Übersetzung Metadaten Repository 3.2 Data Warehouse 80 3.2.3 ETL im SAP NetWeaver BI Data Warehousing Workbench: Funktionsbereich Modellierung: Das Werkzeug zur Modellierung von Daten ist die Data Warehousing Workbench. Je nach Anforderung für Analyse und Reporting Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde stehen verschiedene BI-Objekte zur Integration, Transformation, Konsolidierung, Bereinigung und Ablage von Daten zur Verfügung. Die BI-Objekte erlauben eine effiziente Bereitstellung der Daten zur Analyse und Interpretation. Quelle: SAP 3.2 Data Warehouse 81 3.2.3 ETL im SAP NetWeaver BI Data Warehousing Workbench (RSA1) Die Data Warehousing Workbench (DWB), ist für die Aufgaben im Data Warehousing Prozess das zentrale Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Werkzeug. Sie stellt die Funktionen zur Datenmodellierung sowie zur Steuerung, Überwachung und Pflege aller mit der Datenbeschaffung, -haltung und –verarbeitung verbundenen Prozesse im SAP NetWeaver BI zur Verfügung. Quelle: SAP NetWeaver BI Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.2 3.2.3 Extraktion im SAP NetWeaver BI Quelle: SAP Data Warehouse Extraktionsebene 82 3.2 Data Warehouse 3.2.3 Extraktion im SAP NetWeaver BI Einspeisung der Daten sowohl aus dem ERP als auch aus Fremdsystemen: Andere SAP NetWeaver BI-Systeme SAP CRM Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Flat-Files Datenbanksysteme XML PSA = Persisting Staging Area = Eingangsschnittstelle Quelle: SAP 83 3.2 Data Warehouse 3.2.3 ETL im SAP NetWeaver BI Der Weg zur PSA: InfoArea anlegen InfoObjectCataloge anlegen InfoObjects anlegen InfoCube anlegen Struktur fertig angelegt, jetzt mit Daten füllen! Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Anwendungskomponente anlegen DataSources anlegen Transformation anlegen InfoPackages laden Datentransferprozess anlegen Prüfen ob die Daten fehlerfrei in der PSA und im InfoCube angekommen sind! Quelle: SAP 84 3.2 Data Warehouse 3.2.3 Überblick einzelne Schritte Der Weg zur PSA: InfoArea anlegen InfoObjectCataloge anlegen (beinhaltet Merkmale / Kennzeichen) InfoObjects anlegen (kleinste Einheit!) InfoCube anlegen Struktur fertig angelegt, jetzt mit Daten füllen! Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Anwendungskomponente anlegen DataSources anlegen (woher kommen die Daten?) Transformation anlegen (Zuordnung) InfoPackages laden Datentransferprozess anlegen Prüfen ob die Daten fehlerfrei in der PSA und im InfoCube angekommen sind! Quelle: SAP 85 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.2 3.2.3 Extraktion im SAP NetWeaver BI Data Warehouse Quelle: SAP NetWeaver BI 86 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.2 3.2.3 Anlegen eines Merkmals Data Warehouse Quelle: SAP NetWeaver BI 87 3.2 Data Warehouse 3.2.3 ETL im SAP NetWeaver BI Der Weg zur PSA: InfoArea anlegen InfoProvider ist eine persistente Datenablage, er stellt die Daten für Analyse, Reporting und Planung zur Verfügung Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde (Modellierungsebene der Data Warehousing Workbench) Quelle: SAP 88 3.2 Data Warehouse 89 3.2.3 ETL im SAP NetWeaver BI Der Weg zur PSA: InfoObjectCataloge anlegen IOC beinhaltet mehrere InfoObjects (Merkmale oder Kennzahlen), dient somit einer besseren Strukturierung und ist im InfoObjectsbaum integriert. Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Ist ein IOC angelegt, kann er mit InfoObjects (kleinste Einheiten des BI) gefüllt werden. Quelle: SAP 3.2 Data Warehouse 3.2.3 ETL im SAP NetWeaver BI Der Weg zur PSA: InfoCube anlegen Mehrdimensionale Ablage für den Decision Support. Wird aus einer oder mehreren DataSources gefüllt und enthält zwei Arten von Daten: Merkmale und Kennzahlen Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Bildet das Datenmodell des SAP Business Information Warehouse. Technische Sicht: InfoCube besteht aus einigen relationalen Tabellen die nach dem Star-Schema zusammengestellt sind. Eine große Faktentabelle im Zentrum (Kennzahlen) und mehrere sie umgebende Dimensionstabellen (Merkmale). Struktur fertig angelegt, jetzt mit Daten füllen! Quelle: SAP 90 3.2 Data Warehouse 3.2.3 Exkurs: Stern (Star) Schema Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Zwei Arten von Tabellen: Faktentabellen beinhalten betriebswirtschaftliche Daten wie Umsatz, Verkaufsdaten usw. Zu jeder Faktentabelle sind Dimensionstabellen verbunden, die die Geschäftsstrukturen des Unternehmens beschreiben. Quelle: http://de.wikipedia.org/wiki/Sternschema 91 3.2 Data Warehouse 92 3.2.3 Szenario Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Sie sind Praktikant des anerkannten PC Vertriebsunternehmens WIF (Wir Informieren Fachleute). Im Rahmen Ihrer Praktikumsstelle will das Unternehmen testen wie fit Sie im Umgang mit spezieller Systemsoftware sind, in diesem Fall der SAP NetWeaver BI. Sie sollen mit Hilfe dieser Software Unternehmensdaten in das Data Warehouse laden und diese entscheidungsrelevant aufbereiten. Dazu empfiehlt es sich nach spezifischen Kennzahlen (Umsatz, Produktpreise,..) und Merkmalen (Buchungskreis, Kunden, Kundengruppen,..) zu suchen, welche anschließend in Form eines Daten-Würfels vorliegen und somit auch eine Analysebasis für zukünftig umfangreichere Daten bilden. Sind die Daten in Form einer aussagekräftigen Grafik mit Hilfe des Query Designers verfügbar, steht einer Festanstellung nichts mehr im Wege! 3.2 Data Warehouse 3.2.3 ETL im SAP NetWeaver BI Analysieren Sie zuerst die auf M:\Win\WI_Infos\SAP NetWeaver BI\Daten bereitgestellten Dateien. Übungen 11 - 17: Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Einführende Aufgaben zu SAP NetWeaver BI 93 Wiederholung 94 ETL Prozess Data Warehouse Laden Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Transformation Filterung Harmonisierung Anreicherung Aggregation Extraktion Interne / Externe Datenquellen ERP System Operative Systeme Wiederholung 95 Überblick SAP Prozessablauf 1 2 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3 Produkt Buchungskreis InfoObjects Kunde Kundengruppe Produktgruppe 3 Umsatz InfoObjects Preis Menge InfoArea Merkmale InfoObjectCatalog Kennzeichen 4 InfoCube InfoProvider Data Warehousing Workbench - Modellierung Wiederholung 96 Überblick SAP Prozessablauf 1 3 InfoArea 2 InfoObjectCatalog Merkmale Kennzeichen Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 4 3 Produkt InfoObjects Kunde Kundengruppe Produktgruppe Buchungskreis Umsatz InfoObjects Preis Menge InfoCube InfoProvider 5 9 Anwendungskomponente 6 7 DTP Transformation/ Synchronisation DataSources 8 InfoPackage 10 Prüfen! Data Source Data Warehousing Workbench - Modellierung 3.2 Data Warehouse 97 3.2.3 ETL im SAP NetWeaver BI Der Weg zur PSA: Anwendungskomponente anlegen (wichtig für Strukturierung der DataSources) Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde DataSources anlegen Anwendungskomponente Quelle: SAP 3.2 Data Warehouse 98 3.2.3 ETL im SAP NetWeaver BI DataSource Eine DataSource beschreibt das Datenangebot eines Quellsystems in Form von Feldstrukturen. Diese Feldstrukturen nennt man Transferstruktur. Sie beschreibt die Felder der DataSource in deren Reihenfolge. Definition Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Eine DataSource ist eine Menge von Feldern, die dem BI die Daten zu einer betriebswirtschaftlichen Einheit zur Datenübertragung zur Verfügung stellt. Technisch gesehen umfasst die DataSource eine Menge von logisch zusammengehörigen Feldern, die in einer flachen Struktur (Extraktstruktur) bzw. für Hierarchien in mehreren flachen Strukturen zur Datenübertragung ins BI angeboten werden. Verwendung DataSources liefern die Metadatenbeschreibung der Quelldaten. Sie werden für die Datenextraktion aus einem Quellsystem und Übertragung der Daten ins BI oder für den direkten Zugriff auf die Quelldaten aus dem BI heraus verwendet. Quelle: SAP NetWeaver BI 3.2 Data Warehouse 99 3.2.3 Extraktion im SAP NetWeaver BI Flatfiles Dateien mit fest strukturiertem Aufbau, der für jede Zeile der Datei identisch ist. Das SAP NetWeaver BI ist in der Lage, Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde eine vorgegebene Anzahl von Zeilen zu Beginn des Flatfiles zu überspringen. Dies ermöglicht, zu Anfang des Flatfiles Informationen wie beispielsweise Feldnamen abzulegen. Quelle: SAP NetWeaver BI; Mehrwald 2008, S. 341 3.2 Data Warehouse 100 3.2.3 Extraktion im SAP NetWeaver BI Feste Struktur vs. CSV-Format Zwei Möglichkeiten um Felder innerhalb der Datei zu beschreiben: Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Feste Datensatzlänge Feste Länge des Datensatzes und jeden einzelnen Feldes wird vorab bestimmt Quelle: Mehrwald 2008, S. 341 . Comma-Seperated Values 3.2 Data Warehouse 3.2.3 Extraktion im SAP NetWeaver BI Der Weg zur PSA: Transformation anlegen Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Konsolidierung, Bereinigung und Integration der Daten, entspricht der Synchronisation von Daten aus externen Quellen. Quelle: SAP 101 3.2 Data Warehouse 102 3.2.3 ETL im SAP NetWeaver BI Der Weg zur PSA: InfoPackages laden InfoPackages fordern die Daten einer gewünschten DataSource für ein Quellsystem Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde an Quelle: SAP 3.2 Data Warehouse 3.2.3 ETL im SAP NetWeaver BI Der Weg zur PSA: Datentransferprozess (DTP) anlegen Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Übertragung der Daten in das gewünschte Datenziel Quelle: SAP 103 3.2 Data Warehouse 3.2.3 ETL im SAP NetWeaver BI Der Weg zur PSA: Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Prüfen ob die Daten fehlerfrei in der PSA und im InfoCube angekommen sind! Quelle: SAP 104 3.2 Data Warehouse 105 3.2.3 Extraktion im SAP NetWeaver BI Persistent Staging Area (PSA): Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Eingangslayer für Daten im BI Quelle: SAP Stellt Eingangsablage von angeforderten Daten aus verschiedenen Quellsystemen dar. Die angeforderten Daten werden unverändert in Form der Transferstruktur in transparenten, relationalen Datenbanktabellen abgelegt. Der Eingangslayer wird über die Data Source verwaltet, dabei wird die PSA Tabelle erzeugt, wenn die Data Source aktiviert wird. Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.2 3.2.3 Extraktion im SAP NetWeaver BI Quelle: SAP Data Warehouse Aufgaben 18 - 29 106 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.2 3.2.3 SAP NetWeaver BI Quelle: SAP Data Warehouse Administrationsebene 107 3.2 Data Warehouse 108 3.2.3 SAP NetWeaver BI Administrationsebene Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Metadaten-Repository Quelle: SAP Data Warehouse Systeme geraten schnell zu einer „Black Box“, wenn die verwendeten Daten und Datenflüsse nicht transparent gehalten sind. Im Metadaten-Repository werden sämtliche Objekte zentral abgelegt. Die dort abgelegten Objekte erfüllen unterschiedliche technische oder betriebswirtschaftliche Funtionen und lasssen sich in 3 Schichten gliedern: Datenbank ABAP Dictionary Apllikationen (SAP NetWeaver BI Objekte Bsp.: InfoObject, InfoAreas,..) 3.2 Data Warehouse 109 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.2.3 Extraktion im SAP NetWeaver BI DATASOURCE INFOCUBE mit Transferstruktur INFOSOURCE Fortschreibungsregeln Kommunikationsstruktur mit Übertragungsregeln Quelle: SAP (heute: DSO!) 3.2 Data Warehouse 110 3.2.3 Extraktion im SAP NetWeaver BI Administrationsebene Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Master Data Dokumente für Stammdaten Stellt Konsistenz sicher Aktuelle und stichtagsbezogene Darstellung von Attributen und Merkmalen Texte eines Merkmals Attribute eines Merkmals Externe Hierarchien flache Struktur DataStore-Objekt Fasst Merkmale und Kennzahlen in Tabllenform zusammen! Quelle: SAP NetWeaver BI 3.2 Data Warehouse 111 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.2.3 ETL im SAP NetWeaver BI Quelle: SAP Sicherung der Daten in DataStore Objects und InfoCubes um Historisierung zu ermöglichen. Wichtig für Transparenz im Unternehmen. Bei Mitarbeiterwechsel oder Regionsverschiebungen besteht weiterhin die Möglichkeit der Nachvollzeihung der getätigten Geschäftsgänge. Vergleichsmöglichkeit aktueller zu historischer Daten. Dadurch Sicht auf Trendentwicklungen. 3.2 Data Warehouse 112 3.2.3 Historisierung im Rahmen des ETL-Prozesses Historisierung temporäre Daten historische Daten Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde ERPSystem non ERPSystem external data PSA ODS historische Basis PSA - Persistent Staging Area ODS - Operational Data Store InfoCubes 3.2 Data Warehouse 3.2.3 Historisierung Unterscheidung zwischen: Aktueller Sicht Historische Wahrheit Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Typisches Szenario Bis zum 30.11.2008 arbeitet Verkäufer Hr. Hesseuner im Vertriebsbüro Memmingen. Ab dem 1.12.2008 wechselt er in das Vertriebsbüro Augsburg. Ab dem 1.12.2008 wird Hr. Bidenk im Vertriebsbüro Ingolstadt neu eingestellt. 113 3.2 Data Warehouse 114 3.2.3 Historisierung Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Zuordnung in 11.2008 Zuordnung in 12.2008 Verkäufer Vertriebsbüro Verkäufer Vertriebsbüro Minsendeck Memmingen Minsendeck Memmingen Hesseuner Memmingen Hesseuner Augsburg Schland Augsburg Schland Augsburg Wichner Augsburg Wichner Augsburg Bidenk Ingolstadt 3.2 Data Warehouse Aktuelle Sicht 3.2.3 Historisierung Es kommt nur darauf an, zu welchem Vertriebsbüro der Verkäufer gehört, wenn die Query ausgeführt wird. Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Das bedeutet, dass auch die ursprünglich in einem anderen Vertriebsbüro angefallenen Umsätze des Verkäufers in der Query für das neue Vertriebsbüro angezeigt werden. Vereinfacht Vergleiche mit Vergangenheitszeiträumen (z.Bsp.: Vorjahr) 115 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.2 3.2.3 Historisierung Data Warehouse Umsätze in 11./12. 2008 116 Aktuelle Sicht 3.2 Data Warehouse 117 3.2.3 Historisierung Historische Wahrheit Es kommt darauf an, zu welchem Vertriebsbüro der Verkäufer zum Zeitpunkt seines Verkaufvorgangs gehört. Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Das bedeutet, dass die Umsätze dann beim damals gültigen Verkaufsbüro verbleiben. Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.2 3.2.3 Historisierung Data Warehouse Umsätze in 11./12. 2008 118 Historische Wahrheit 1 Grundlagen 2 SAP CRM 3 SAP BI 3.1 Übersicht 3.2 3.3 Einführung 3.1.1 Definition analytisches CRM 3.1.2 Closed-Loop-Prozess 3.1.3 SAP Data Warehouse 3.2.1 Definition Data Warehouse 3.2.2 ETL Prozess 3.2.3 SAP NetWeaver BI Business Intelligence 3.2.1 Definition BI 3.2.2 Analyse im SAP NetWeaver BI 3.3 Business Intelligence 3.3.1 Definition Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Definition Business Intelligence (BI) Systeme und Prozesse zum Sammeln von internen und externen Unternehmensdaten und –informationen Einer systematischen Analyse dieser gesammelten Daten Die Verwertung dieser Daten als nutzbringende Informationen Ziel des BI ist eine verbesserte und flexiblere Gewinnung von Erkenntnissen zu Entscheidungsunterstützung des Managements in planenden, steuernden und koordinierenden Tätigkeiten! Quelle: Kießwetter/Vahlkamp 2007, S. 21 120 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.3 3.3.1 Definition Business Intelligence Quelle: Humm/Wietek 2005, S. 4 121 3.3 Business Intelligence 122 3.3.1 Definition Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde BI unterteilt sich in 3 Phasen: Quelle: Kießwetter/Vahlkamp 2007, S. 21 1. Erfassung relevanter Daten in einem Datenspeicher 2. Analyse und Erweiterung der Daten 3. Aus den Daten gewonnene Informationen werden zur Entscheidungsunterstützung herangezogen 3.3 Business Intelligence 123 3.3.1 Definition Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Data Warehouse Bereinigte Rohdaten Extrakt Extrakt Interne Datenquelle Externe Datenquelle 1 Grundlagen 2 SAP CRM 3 SAP BI 3.1 Übersicht 3.2 3.3 Einführung 3.1.1 Definition analytisches CRM 3.1.2 Closed-Loop-Prozess 3.1.3 SAP Data Warehouse 3.2.1 Definition Data Warehouse 3.2.2 ETL Prozess 3.2.3 SAP NetWeaver BI Business Intelligence 3.2.1 Definition BI 3.2.2 Analyse im SAP NetWeaver BI 3.3 Business Intelligence 125 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.3.2 Beispiel: Management Cockpit Quelle: http://hitaki.net/diary/images/fs2004_737_cockpit.jpg , am 07.11.2008 http://www.juergendaum.com/news/11_01_2005_d-Dateien/image007.gif, am 07.11.2008 3.3 Business Intelligence 3.3.2 Beispiel: Management Cockpit Management Cockpit: Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Präsentation und Diskussion unterschiedlicher Strategien zur Visualisierung entscheidungsrelevanter Daten, wie man sie heute typischerweise in entscheidungsunterstützenden Informationssystemen (Management Support Systems) findet. Die zunehmende Bedeutung derartiger Systeme in der betrieblichen Praxis hat dazu geführt, dass Fragestellungen hinsichtlich adäquater Formen der computerbasierten Visualisierung von entscheidungsrelevanten Daten für das Management immer mehr an praktischer Bedeutung gewinnen! Quelle: Burger 2006, S. 4 126 3.3 Business Intelligence 127 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.3.2 Beispiel: Online Analytical Processing (OLAP) Pivoting bedeutet drehen des Datenwürfels Slicing ist das Setzen von Filtern; Dadurch wird eine Datenscheibe erzeugt Dicing ist das erzeugen eines „kleineren“ Datenwürfels durch Slicing auf ein Intervall Drill Down bedeutet allgemein das Hinzufügen zusätzlicher Informationen zu einem Report Roll up = Gegenteil von Drill Down Als einen Drill Across bezeichnet man das Austauschen der X- und YAchsen Einige Data Warehouse Systeme bieten die Möglichkeit, auch auf Daten zu reporten, die gar nicht im Warehouse selbst, sondern nur in den OLTPSystemen gespeichert sind. Ein Beispiel hierfür könnten einzelne Buchhaltungsbelege sein. Diese Fähigkeit wird Drill Through genannt. Quelle: SAP 3.3 Business Intelligence 3.3.2 Beispiel: OLAP Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Online Analytical Processing = OLAP Slicing, Dicing, Rotation! Quelle: IBI Institute for Business Intelligence 128 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.3 3.3.2 Beispiel: OLAP Business Intelligence Quelle: IBI Institute for Business Intelligence 129 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.3 3.3.2 Beispiel: OLAP Business Intelligence Quelle: IBI Institute for Business Intelligence 130 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.3 3.3.2 Analyse im SAP NetWeaver BI Quelle: SAP Business Intelligence Präsentationsebene 131 3.3 Business Intelligence 132 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.3.2 Präsentation im SAP NetWeaver BI In die Präsentationsebene oder auch Decision-Support-Schicht (DSS), fallen alle Tools, mit denen Daten des Data Warehouses abgefragt und entscheidungsrelevant aufbereitet werden. Zusätzlich zu der Möglichkeit auf externen DSS Tools mit Daten zu beliefern, verfügt das SAP NetWeaver BI über eigene entscheidungsunterstützende Tools. Diese sind in der Produktionssuite des Business Explorer (BEx) zusammengefasst. SAP BI Suite! Quelle: SAP 3.3 Business Intelligence 133 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.3.2 Business Explorer (SAP BI Suite) Quelle: SAP Komponente des SAP Business Information Warehouses Bietet flexible Reporting- und Analysewerkzeuge zur strategischen Analyse und Entscheidungsunterstützung Query-, Reporting und Analysefunktionen Auswertung historischer und aktueller Daten in unterschiedlichen Detaillierungsstufen und unterschiedlicher Perspektiven 3.3 Business Intelligence 134 3.3.2 Funktionsbereiche des BEx Nahtlose Integration in das SAP Enterprise Portal BEx Information Broadcasting BEx Web Web Application Design Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde BEx Web Application Designer BEx Web Analyzer BEx Mobile Intelligence Quelle: SAP BEx Analyzer 3.3 Business Intelligence 135 3.3.2 Business Explorer Analyzer Analyse- und Reportingwerkzeug des Business Explorer, eingebettet in Microsoft Excel Funktionsumfang: Definition von Queries Interaktive Auswertung und Präsentation der InfoProvider Daten Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Queries in Arbeitsmappen einfügen Navigation in Queries Queries können danach in Excel weiterverarbeitet werden oder im Web Browser angezeigt werden Ergebnis: Unterschiedliche Sichten auf die InfoProvider Daten Quelle: SAP 3.3 Business Intelligence Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.3.2 Business Explorer Query Designer Bietet grafische Oberfläche zur Modellierung von Abfragen aus dem Infoprovider Query: Datenbankabfrage, welche eine bestimmte Sicht auf den Datenbestand liefert. Die Dimensionen eines InfoCubes (Merkmale und Kennzahlen) können in beliebige Zeilen und Spalten angeordnet werden. Quelle: SAP 136 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.3 3.3.2 Analyse im SAP NetWeaver BI Quelle: SAP Business Intelligence Übungen 30 - 36 137 3.3 Business Intelligence Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.3.2 Analyseprozessdesigner Die Daten des SAP Netweaver BI enthalten oftmals noch versteckte Informationen oder komplexe Beziehungen zwischen den Daten. Dabei handelt es sich um weiteres, wertvolles Potential in Form von vollkommen neuen Informationen. Der Analyseprozessdesigner entspricht einer SAP Data Mining Lösung, mit folgenden Funktionen: Anlegen und Ändern von Data-Mining-Modellen Trainieren von Data-Mining-Modellen Ausführen von Data-Mining-Methoden Visualisierung von Data-Mining-Modellen Quelle: SAP 138 3 Analyse im Rahmen des Business Intelligence 3.3 Analyseprozessdesigner Einfache und intuitive Bedienbarkeit: angebotene Funktionen können per Drag & Drop zu einem Analyseprozess zusammengesetzt werden Ein Analyseprozess verläuft grob in 3 Phasen: 1. Datenquelle Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde In diesem Schritt werden die Quellen, aus denen die zu analysierenden Daten extrahiert werden, festgelegt. 2. Transformation Legt die Verarbeitungsvorschriften für die Aufbereitung und Analyse der Daten fest. 3. Datenziel Definiert wie und wo die Ergebnisdaten für die Präsentation und Analyse gespeichert werden. Quelle: SAP 139 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.3 3.3.2 Analyseprozessdesigner Business Intelligence TA: RSANWB Quelle: SAP 140 3.3 Business Intelligence 141 3.3.2 Analyseprozessdesigner Menüleiste Drucktastenleiste Navigationsbereich Kopfdaten Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Modellierungsbereich TIPP: Sichern Sie nach jedem Teilschritt!!! Quelle: SAP 3.3 Business Intelligence 142 3.3.2 Analyseprozessdesigner Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Einzelne Prozessphasen: 1. Auswahl der Daten 2. Vorbereitung der Daten 3. Transformation 4. Speichern der transformierten Daten 5. Anzeigen der Daten in BEx (Analyse) Dabei besteht die Möglichkeit zur Wahl zwischen verschiedenen Datenquellen, Transformationen und Datenzielen. Quelle: SAP Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.3 3.3.2 Analyseprozessdesigner Business Intelligence Datenquellen Quelle: SAP 143 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.3 3.3.2 Analyseprozessdesigner Business Intelligence Transformationen (Auswahl) Quelle: SAP 144 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.3 3.3.2 Analyseprozessdesigner Business Intelligence Datenziele Quelle: SAP 145 3.3 Business Intelligence 3.3.2 Analyseprozessdesigner Geschlossener Kreislauf Daten extrahieren Daten transformieren Daten laden Daten analysieren Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Daten visualisieren Daten nutzten (Kampagne, etc) Daten in CRM System überführen und profitieren!!! Quelle: SAP 146 3.3 Business Intelligence 147 3.3.2 Aufbau eines Entscheidungsbaums Wurzel Split Knoten Knoten Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Kanten Blatt Blatt Quelle: SAP Blatt Knoten Blatt Blatt Blatt 3.3 Business Intelligence 148 3.3.2 Beispielszenario Geschlecht Versicherungsnehmer weiblich männlich Alter Einkommen Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde > 35 < 3.200 € < 35 Nein Einkommen < 2.500 € Ja Ja > 2.500 € Nein Wird Versicherungsnehmer Schadensfall melden? Quelle: SAP > 3.200 € Nein Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.3 3.3.2 Entscheidungsbaum im SAP NetWeaver BI Quelle: SAP Business Intelligence 149 3.3 Business Intelligence 3.3.2 Nutzung von Prognosen in SAP – Closing the Loop Innerhalb SAP Netweaver BI: Speicherung in DSO Darstellung und Analyse mittels BEx oder Third-Party-Produkten In SAP Customer Relationship Management: Anlage von Marketingmerkmalen Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Information beim Kunden Weitere Pflege durch Mitarbeiter Selektionskriterien für Kampagnen Zielgruppenbestimmung für Kampagnen 3.3 Business Intelligence 3.3.2 Vom DW zum SAP NetWeaver BI Abfrage- und Analysewerkzeuge Direktzugriff Analysen Berichte Verdichtungsstufe n Verdichtungsstufe 2 Metadaten Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Benutzerschnittstelle bzw . Output-Schicht Data Marts Verdichtungsstufe 1 Datenbasis ArchivierungsArchivierungs systeme Datenschnittstelle bzw. Input-Schicht Transformationsprogramme Unternehmensinterne - und -externe transaktionsorientierte Daten Quelle: SAP 151 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 3.3 3.3.2 Analyse im SAP NetWeaver BI Quelle: SAP Business Intelligence Übungen 37 - 53 152 153 Closed-Loop-Prozess Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde Ziel: Operative Daten in analysierbare Informationen umzuwandeln, daraus Action Knowledge (handlungsauslösendes Wissen) zu generieren um damit wieder Einfluss auf die operativen Systeme zu nehmen. Quelle: Egger et al. 2007a, S. 27 Katholische Universität Eichstätt-Ingolstadt Lehrstuhl für ABWL und Wirtschaftsinformatik Prof. Dr. Klaus D. Wilde 154 Viel Erfolg bei der Klausur und schöne Ferien !!