Vortrag - HTW Dresden
Transcription
Vortrag - HTW Dresden
Fakultät Wirtschaftswissenschaften Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics Data Mining im betrieblichen Umfeld Prof. Dr. Andreas Hilbert [email protected] http://wiid.wiwi.tu-dresden.de 01062 Dresden Telefon Telefax +49 351 463-32268 +49 351 463-32736 Business Analytics in Action: Mobilfunk-Kunden und Talkline TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research S E R V I C E– IDATA N T E LMINING LIGENCE SERVICE INTELLIGENCE Der Mobilfunk-Anbieter TALKLINE sah sich 2001 dem Problem gegenüber, dass ca. 200.000 Kundenverträge kurz vor dem Vertragsende standen. Um nach dem „Gießkannen-Prinzip“ jedem Kunden ein neues Handy zu einem Preis anbieten zu können, der unter dem regulären Kaufpreis lag, hätte TALKLINE etwa 100 EURO pro Vertrag investieren müssen. Daraus ergab sich sofort die Frage: Welche Kunden sind besonders gewinnbringend, d.h. subventionswürdig, werden aber mit hoher Wahrscheinlichkeit zur Konkurrenz wechseln? Die Lösung fand sich im CHURN-Management: Mit Hilfe des Data Mining wurde auf Basis der vorhandenen Kunden- Business Analytics – Seite 2 Datenbank-Stammtisch 2015 – HTW Dresden Welche Kunden sind besonders gewinnbringend, Business Analytics d.h. undsubventionswürdig, werden aber mit hoher in Action: Talkline das CHURN-Management Wahrscheinlichkeit zur Konkurrenz wechseln? TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Die Lösung fand sich im CHURN-Management: Mit Hilfe des Data Mining wurde auf Basis der vorhandenen Kundeninformationen ermittelt, mit welcher Wahrscheinlichkeit ein Kunde abwandern wird. Schließlich wurden diese Informationen in Bezug zum Gewinnbeitrag des Kunden gesetzt, was letztlich eine Portfolio-Analyse ergab. hoch Gewinnbeitrag ! kritische Kunden Hinweis: Hier sind individuelle Angebote und hohe Subventionen sinnvoll ! mittel niedrig niedrig mittel hoch Abwanderungswahrscheinlichkeit Business Analytics – Seite 3 Datenbank-Stammtisch 2015 – HTW Dresden Business Analytics CHURN-Management und die zu lösenden Aufgaben TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Kündigungsprävention: Von der Analyse bis zur betrieblichen Umsetzung Im Rahmen eines systematischen Kundenmanagements besteht bezüglich der großen Bedeutung einer „Kündigungsprävention“ (CHURN) Konsens. In der betrieblichen Praxis erweist sich ihre Umsetzung jedoch schwierig – aus zwei Hauptgründen: 1. Es fehlen häufig Instrumente, um eine „Kündigungsgefahr“ im Bestand überhaupt „treffsicher“ erkennen zu können 2. Die Bearbeitung von „Kündigungsgefährdeten“ wird als Service-Aufgabe gesehen, die nicht unmittelbar zu „mehr“ Umsatz führt, gleichwohl sofort Ressourcen bindet: Damit fehlt die vertriebliche Akzeptanz Dabei bleiben aber auch andere Fragen offen: Sollen die „Hoch-Gefährdeten“ bedient werden; oder sind diese bereits verloren und man sollte sich eher auf die noch „Bekehrbaren“ konzentrieren. Dann bleibt allerdings die Frage, was identifiziert werden soll: Die Kündigungswahrscheinlichkeit oder die „Turn“Wahrscheinlichkeit. Business Analytics – Seite 4 Datenbank-Stammtisch 2015 – HTW Dresden Business Analytics Mehr Beispiele aus dem betrieblichen Umfeld TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Fragestellungen • Vorhersage der Kündiger von Versicherungen (Kündigungspräventionsmaßnahme) • Vorhersage der Kündiger von TelCo-Kunden (Kündigungspräventionsmaßnahme) • Vorhersage von Betrugsfällen beim Online-Kauf (Vorauskasse, Rechnungszahlung) • Vorhersage von Betrugsfällen beim Kreditkartengebrauch (Zahlungsverweigerung) • Vorhersage der Bonität eines Kreditkunden (Ausfallwahrscheinlichkeit, Zinsanpassung) • Zuordnung eines Kunden zur Gruppe der kredit(un)würdigen Kunden (Kreditverweigerung) • … Probleme • Welches Verfahren soll man verwenden? • Welche Daten braucht man dazu? • Wie überprüft man die Güte des gefundenen Modells? • Wie setzt man dieses Modell in der Realität um? • … Business Analytics – Seite 5 Datenbank-Stammtisch 2015 – HTW Dresden Agenda TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Intelligence Research Knowledge Discovery in Databases Methodenüberblick Meinungen und Trends Herausforderungen Ausblick Business Analytics – Seite 6 Datenbank-Stammtisch 2015 – HTW Dresden Fakultät Wirtschaftswissenschaften Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics Business Intelligence Research Prof. Dr. Andreas Hilbert [email protected] http://wiid.wiwi.tu-dresden.de 01062 Dresden Telefon Telefax +49 351 463-32268 +49 351 463-32736 Herausforderungen der Business Intelligence TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Informationsangebot Informationsnachfrage Informationsbedarf Wir ertrinken in Informationen, aber uns dürstet nach Wissen. (John Naisbitt) Business Analytics – Seite 8 Datenbank-Stammtisch 2015 – HTW Dresden Business Intelligence Research Corporate Mission TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Der Lehrstuhlversteht sich als Forschungs-, Lehr- und Transferzentrum der Wirtschaftsinformatik und angrenzender Gebiete der Betriebswirtschaftslehre. • Den zentralen Gegenstand der Forschungsaktivitäten bilden zum einen die Business Intelligence (BI) mit ihren Facetten Data Warehousing, Online Analytical Processing, Data, Text und Web Mining, Customer Relationship Management sowie Revenue Management und zum anderen der Einsatz von Business Intelligence in unterschiedlichen Anwendungsdomänen, z.B. im Energiebereich, Electronic Commerce, im Web 2.0 Umfeld oder im Bereich der Industrie 4.0 • Im Rahmen der Lehre erwerben die Studierenden wissenschaftlich fundierte Kenntnisse und Fähigkeiten zur Analyse, Beschreibung, Gestaltung und Bewertung von ManagementSupport-Systemen (BI-Systeme). Damit werden sie in die Lage versetzt, die zum erfolgreichen Führen von Unternehmen benötigten Daten und Informationen zu identifizieren, eine analyseorientierte Speicherung InformationsInformationsangebot nachfrage dieser Informationen in Data Warehouses zu konzipieren und zu implementieren sowie unbekannte Zusammenhänge in den Daten mit Hilfe des Data Mining aufzudecken und Informationssomit zur Wertschöpfung dieser Unternehmen beizutragen. bedarf Business Analytics – Seite 9 Datenbank-Stammtisch 2015 – HTW Dresden Business Intelligence Die Prognose: The New York Times, Mai 2000 TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Die Realität Warenkorbanalysen bei Wal Mart Kampagnenmanagement bei t-Mobile Betrugsprävention bei Amazon Absatzprognose beim Springer-Verlag Business Analytics – Seite 10 Datenbank-Stammtisch 2015 – HTW Dresden Business Intelligence Money Watch & University of California, Mai 2010 TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research http://moneywatch.bnet.com/saving-money/blog/college-solution/10-hottest-careers-in-america/2154/ Business Analytics – Seite 11 Datenbank-Stammtisch 2015 – HTW Dresden Business Intelligence Gartner, Januar 2015 TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research http://gartnerevent.com/NABI13Survey Business Analytics – Seite 12 Datenbank-Stammtisch 2015 – HTW Dresden Business Intelligence Research Lehre im Überblick TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Grundlagen Wirtschaftsinformatik Data Warehousing Data Mining Einführung in die Wirtschaftsinformatik Corporate Performance Management Bootcamps BI Minor-Modul Wirtschaftsinformatik: AWS & E-MSS Theorie Praxis Vertiefung Wirtschaftsinformatik Bachelor Mathematische Planungsverfahren Allgemeine Kompetenzen Allgemeine Qualifizierung (AQUA) Entscheidungslehre Master Diplom Schwerpunkt Business Intelligence Quantitative Kompetenzen Applied Data Analysis Business Analytics – Seite 13 Datenbank-Stammtisch 2015 – HTW Dresden Business Intelligence Research Lehre – Kooperationen TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Unique Selling Proposition (USP): – Ausbildung entlang der gesamten Wertschöpfungskette der BI – Kooperation mit weltweit führenden Softwareanbietern im Bereich BI • Seit 2005 mit Kooperation mit SAS • Seit 2009 Kooperation mit Microstrategy • Aktuell Gespräche mit OS-Anbietern (Lehr-)Vorträge aus der Praxis zu Themen der BI Business Analytics – Seite 14 Datenbank-Stammtisch 2015 – HTW Dresden Gartner’s Magic Quadrant for Business Intelligence and Analytics Platforms TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Kooperationspartner seit 2005: seit 2009: Quelle: Gartner 2015 Business Analytics – Seite 15 Datenbank-Stammtisch 2015 – HTW Dresden Business Intelligence Research Forschung – Diplom- und Masterarbeiten TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research seit 09/2005 (erste Vergabe) über 130 Abschlussarbeiten (Stand 01.03.2015) hoher Anteil an Arbeiten in Kooperation mit Praxispartnern – Altran GmbH – AMTC GmbH – BMW AG – Dresden Monarchs – Dresdner Bank AG – EADS GmbH – Infor AG – LSG Sky Chefs – Mummert Steria AG – SAP AG – Solar World AG – T-Systems MMS GmbH – Völcker Informatik AG Signifikant gute Erfolgsbilanz der Absolventen (Berufseinstieg) Business Analytics – Seite 16 Datenbank-Stammtisch 2015 – HTW Dresden Herausforderungen der Business Intelligence Wir ertrinken in Informationen, aber uns dürstet nach Wissen. (John Naisbitt) TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Intelligence Managementsupport Die Professur versteht sich als Forschungs-, Lehrund Transferzentrum der Wirtschaftsinformatik und angrenzender Gebiete der Betriebswirtschafts-lehre. Den zentralen Gegenstand der Forschungsaktivitäten bilden zum einen die Business Intelligence (BI) mit ihren Facetten Data Warehousing, Online Analytical Processing, Data, Text und Web Mining (Business Analytics) sowie der Einsatz von Business Intelligence in diversen Anwendungsdomänen, z. B. im Controlling, im eMarketing, im CRM, im HR-Management oder in der Produktion oder aus dem Web. Kooperationen Blog Mining Qualitätssicherung Executive Information System (EIS) BUSINESS Decision Support System (DSS) INTELLIGENCE Management Information System (MIS) Forschungsprojekte (Auswahl) Microblogging Reporting Opinion Mining Fraud Detection Weblogs Revenue Management Pattern Recognition Web Mining Business Analytics OLAP Data Mining Employer Branding Web Intelligence Social Network Unter Business Intelligence wird ein integrierter, unternehmensspezifischer, IT-basierter Gesamtansatz zur betrieblichen Entscheidungsunterstützung verstanden. Kemper, Mehanna, Unger, 2004 Business Analytics – Seite 17 Datenbank-Stammtisch 2015 – HTW Dresden Business Analytics Forschungs- und Kooperationsprojekte TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Pattern Recognition (im Management) Pattern Recognition (in der Produktion) Pattern Recognition ist die Fähigkeit, in einer Menge von Daten Regelmäßigkeiten, Wiederholungen, Ähnlichkeiten oder Gesetzmäßigkeiten zu erkennen. Pattern Recognition ist die Fähigkeit, in einer Menge von Daten Regelmäßigkeiten, Wiederholungen, Ähnlichkeiten oder Gesetzmäßigkeiten zu erkennen. Dabei stehen im Management vor allem unterstützende, nicht-wertschöpfende Prozesse im Fokus. Dabei stehen in der Produktion vor allem wertschöpfende Prozesse im Fokus, die allerdings durch eine extrem hohe Datendichte charakterisiert sind. • Business Analytics im Property Management: Verwaltungskostenprognose im Property Management für Gewerbeimmobilien (infor AG) • Financial lnformation Harvesting: Informationsextraktion aus OnlineDatenbanken zur Unterstützung des Risikomanagements (Dresdner Bank) • Fraud Detection: Vorhersage der Betrugsabsicht im Online-Vertrieb (Weltbild GmbH) • Role Mining: Administration von Nutzerdaten in IT-Systemen (Völcker Informatik AG) Blog Mining Qualitätssicherung Microblogging Reporting Opinion Mining Fraud Detection Weblogs Revenue Management Pattern Recognition • Process Quality Mining: Qualitätssicherung von Produktionsprozessen mit Hilfe von Data Mining (Advanced Mask Technology Center) • Entwicklung von Methoden zur Datenaufbereitung und -analyse im Qualitätsmanagement (Litronic GmbH) Web Mining Business Analytics OLAP Data Mining Employer Branding Web Intelligence Social Network Business Analytics ist eine Form der Datenauswertung zur strategischen Unternehmenssteuerung bzw. zur Steuerung von Geschäftsprozessen, bei der nicht nur Massendaten gesammelt, sondern auch … aufbereitet und ausgewertet werden. Davenport, Harris 2007, Business Analytics – Seite 18 Datenbank-Stammtisch 2015 – HTW Dresden Web Intelligence Forschungsprojekte TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Opinion Mining Employer Branding Mit Hilfe des Opinion Mining werden in (Online-)Texten wiedergegebene Meinungen extrahiert. Employer Branding ist eine unternehmensstrategische Maßnahme, bei der Konzepte aus dem Marketing, insb. der Markenbildung, angewandt werden, um das Unternehmen als attraktiven Arbeitgeber darzustellen und gegenüber Wettbewerbern zu positionieren. So können sich Unternehmen einen Überblick darüber verschaffen, wie ihre Produkte und Dienstleistungen von den Kunden (auch im Sinne eines Benchmarking mit Konkurrenten) wahrgenommen werden. Das Ergebnis ist die Arbeitgebermarke, Employer Brand, das vom Unternehmen gezielt gestaltete Image, als attraktiver Arbeitgeber wahrgenommen zu werden. • Web-Kundenbarometer: Exploration der Kundenstimmung durch Analyse von Meinungsäußerungen im Web • Beobachtung der Akzeptanz neu eingeführter Produkte oder Dienstleistungen • Identifikation von Meinungsführern in sozialen Netzwerken für den zielgerichteten Einsatz von Marketingmaßnahmen Blog Mining Qualitätssicherung Microblogging Reporting Opinion Fraud Detection Weblogs Mining Revenue Management Pattern Recognition Web Mining Business Analytics OLAP Data Mining Employer • Employer Branding Analytics: Branding Aktivitäten deutscher Daxund M-Dax-Unternehmen in Microblogs wie Twitter • Erfolgsfaktoren des Employer Branding in sozialen Netzwerken als Teil der Recruiting-Strategie von Unternehmen Branding Web Intelligence Social Network Der Begriff Web Intelligence bündelt Strategien und Technologien zur Optimierung der Online-Wertschöpfung im Unternehmen. Die gezielte Erfassung und Analyse von Nutzungsdaten sowie deren Korrelation mit weiteren betriebswirtschaftlichen Daten und Kennzahlen ermöglicht u.a. geringere Akquisitionskosten, Umsatzsteigerungen, verbesserte Kundenbindung und höheren ROI. Business Analytics – Seite 19 Datenbank-Stammtisch 2015 – HTW Dresden Business Intelligence und Industrie 4.0 Forschungs- und Kooperationsprojekte TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Herausforderungen der BI im Kontext von Industrie 4.0 In einer Smart Factory steuern, regulieren und gestalten die Beschäftigten die intelligent vernetzten Produktionsressourcen und Produktionsschritte nach situativen und kontextabhängigen Zielvorgaben. Die Nutzung von Prozessdaten sowie dem menschlichen Erfahrungswissen wird zum wettbewerbsrelevanten Faktor. Dabei stehen vor allem folgende Leitanbieterperspektiven und Handlungsbedarfe im Fokus: • Methoden und Beispielapplikationen im Bereich der automatisierungstechnischen Modellierung und Systemoptimierung mittels Data Mining (Identifikation von Erklärungs- und Planungsmodellen zur Komplexitätsbeherrschung) Forschungsprojekte & Kooperationen • Unterstützung der Beschäftigten in der Produktion (Nachvollziehbarkeit von Ereignissen und Entscheidungen, Auslegung von Regulierungsfunktionen) • Berechnung und Bewertung der End-to-EndPerformance (Prozessleistung und deren Einflussgrößen) Business Analytics – Seite 20 Datenbank-Stammtisch 2015 – HTW Dresden Business Intelligence und Industrie 4.0 Forschungs- und Kooperationsprojekte TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Forschungsschwerpunkte Process Data Intelligence Integration von Six Sigma und Data Mining ProcessPerformance-DataWarehouse Process Data Intelligence: Ziel ist die Beherrschung von komplexen, datenintensiven Produktionsprozessen durch den Aufbau von Erklärungsmodellen zur Integration einer intelligenten Steuerung sowie als Informationsbedarfsanalyse für analytische IS. • Identifikation von Erklärungsmodellen in komplexen Prozessen: Die Integration von Methodenfragmenten aus dem Six-SigmaDMAIC und dem Data Mining ermöglicht die Identifikation von Steuerungs-, Einflussgrößen und deren Ursache-Wirkungsbeziehungen. Dabei wird sowohl das menschliche Erfahrungswissen, als auch das Wissen innerhalb von Prozessdaten verwendet. • Integration von Entscheidungs- und Prognosemodellen: Identifizierte Modelle werden steuerungswirksam in den Prozess integriert und stellen die Prozessverbesserung dar. Process-Performance-Data-Warehouse Ziel ist die Schaffung eines industriellen Assistenzsystems zur taktischen Steuerung von industriellen Prozessen. • Überführung der Erklärungsmodelle in ein analytisches Informationssystem: Auf Basis des erzeugten Erklärungsmodells erfolgt eine modellgestützte Transformation in ein prozessorientiertes PerformanceData-Warehouse. Business Analytics – Seite 21 Datenbank-Stammtisch 2015 – HTW Dresden Business Intelligence und Industrie 4.0 Forschungs- und Kooperationsprojekte TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Process Data Intelligence Pattern Recognition ist die Fähigkeit, in einer Menge von Daten Regelmäßigkeiten, Wiederholungen, Ähnlichkeiten oder Gesetzmäßigkeiten zu erkennen. Dabei stehen im Management vor allem unterstützende, nicht-wertschöpfende Prozesse im Fokus. • Six Sigma: Verwaltungskostenprognose im Property Management für Gewerbeimmobilien (infor AG) Business Analytics – Seite 22 Datenbank-Stammtisch 2015 – HTW Dresden Working Capital Management Forschungsprojekte TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Ziel dieses Projektes ist die Erstellung eines softwaregestützten Beratungsansatzes für das Process Performance Measurement (PPM) im Bereich Working Capital Management. Das Working Capital Management (WCM) als unternehmensinterner und damit nahezu vom Markt unabhängiger Ansatz zur Liquiditäts- und Rentabilitätssteigerung ist in den letzten Jahren, v.a. im Zusammenhang mit einem volatilen Finanzumfeld und restriktiver Kreditvergabe, verstärkt in den Fokus vieler Unternehmen und Studien gerückt Entsprechend der Komponenten des Working Capital stehen drei zu optimierende Geschäftsprozesse im Fokus: Working Capital definiert als: Ziel der Optimierung ist u.a. eine Verkürzung der Kapitalbindung. • die Reduzierung der Vorratsbestandshöhen und Verkürzung ihrer Lagerdauer im Forecast-to-Fulfill-Prozess (Spitzenkennzahl DIO), • die Beschleunigung von Kundenanzahlungen bzw. Verkürzung von Forderungsaußenstandszeiten im Order-to-Cash-Prozess (Spitzenkennzahl DSO) sowie • die zeitliche Verschiebung eigener Zahlungsabgänge an Lieferanten in die Zukunft im Purchase-to-Pay-Prozess (Spitzenkennzahl DPO). • das durch die operative Geschäftstätigkeit gebundene Umlaufvermögen • dessen Positionen nicht zinstragend sind und • daher durch verzinsliches Kapital zu finanzieren ist. Quelle: Controlling Portal , http://www.controllingportal.de/Fachinfo/Grundlagen/Working-Capital-Management-alsInstrument-des-Finanzcontrolling.html, Abruf am 14.10.2014 Business Analytics – Seite 23 Datenbank-Stammtisch 2015 – HTW Dresden Business Intelligence Research Wissenstransfer – Kooperationen TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Gründungen zum Wissenstransfer Competence Center for Business Intelligence • Bündelung von Kompetenzen an der Fakultät und innerhalb der Universität • Wahrnehmung in der Öffentlichkeit, Plattform zum Austausch von Wirtschaft und Wissenschaft • Gründung am 01. September 2008 • Organisation von Workshops, Kolloquien und Praxisvorträgen Verein Business Intelligence Research e. V. • Unterstützung von Forschung und Lehre zur BI • Wahrnehmung in der nationalen Öffentlichkeit, Plattform zum Austausch von Wirtschaft und Wissenschaft • Gründung am 12. Dezember 2008 • Organisation von Workshops Business Analytics – Seite 24 Datenbank-Stammtisch 2015 – HTW Dresden Business Intelligence Research e.V. Internet via bi-research.de TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Gründungsmitglieder Prof. Dr. Andreas Hilbert, TUD Christian Langmayr, Microstrategy Erwin Mertens, Microstrategy Alexander E. Müller, TUD Tilman Prang, T-Systems MMS Karoline Schönbrunn, TUD Stefan Sommer, T-Systems MMS Dr. Tobias von Martens, Altran Joachim Weber Kooperationsvertrag mit Microstrategy Xing-Gruppe „Business Intelligence Research“ mit ca. 100 Mitgliedern Business Analytics – Seite 25 Datenbank-Stammtisch 2015 – HTW Dresden Competence Center for Business Intelligence Internet via bi.wiwi.tu-dresden.de TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics – Seite 26 Datenbank-Stammtisch 2015 – HTW Dresden Business Intelligence Research Internet via bi.wiwi.tu-dresden.de TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics – Seite 27 Datenbank-Stammtisch 2015 – HTW Dresden Business Intelligence Research Kontakt via Facebook TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics – Seite 28 Datenbank-Stammtisch 2015 – HTW Dresden Fakultät Wirtschaftswissenschaften Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics Knowledge Discovery in Databases Prof. Dr. Andreas Hilbert [email protected] http://wiid.wiwi.tu-dresden.de 01062 Dresden Telefon Telefax +49 351 463-32268 +49 351 463-32736 Business Analytics Definition TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business analytics (BA) refers to the • skills, • technologies, • practices for • continuous iterative exploration and investigation • of past business performance • to gain insight and drive business planning. Quelle: Beller, MJ; Barnett A (2009): Next Generation Business Analytics. Lightship Partners LLC http://www.docstoc.com/docs/7486045/Next-Generation-Business-Analytics-Presentation Business Analytics – Seite 30 Datenbank-Stammtisch 2015 – HTW Dresden Business Analytics Definition und Interpretation TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Quelle: Beller, MJ; Barnett A (2009): Next Generation Business Analytics. Lightship Partners LLC http://www.docstoc.com/docs/7486045/Next-Generation-Business-Analytics-Presentation Business Analytics – Seite 31 Datenbank-Stammtisch 2015 – HTW Dresden Business Intelligence vs. Business Analytics Abgrenzung TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business analytics focuses • on developing new insights and understanding of business performance • based on data and [complex] statistical methods. • can answer questions like why is this happening, what if these trends continue, what will happen next (that is, predict), what is the best that can happen (that is, optimize). In contrast, business intelligence traditionally focuses • on using a consistent set of metrics • to both measure past performance and guide business planning, • which is also based on data and [simple] statistical methods. • can answer questions such as what happened, how many, how often, where the problem is, and what actions are needed. Quelle: http://en.wikipedia.org/wiki/Business_analytics Business Analytics – Seite 32 Datenbank-Stammtisch 2015 – HTW Dresden Business Analytics Statistische Analysen TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research • Business analytics makes extensive use of statistical analysis, including explanatory and predictive modeling, … • Typische Analysen sind: – Descriptive Analytics: Gain insight from historical data with reporting, scorecards, clustering etc. – Predictive analytics predictive modeling using statistical and machine learning techniques – Prescriptive analytics recommend decisions using optimization, simulation etc. Prescriptive Analytics extends beyond predictive analytics by specifying both the actions necessary to achieve predicted outcomes, and the interrelated effects of each decision Quelle: http://en.wikipedia.org/wiki/Business_analytics, http://en.wikipedia.org/wiki/Prescriptive_analytics Business Analytics – Seite 33 Datenbank-Stammtisch 2015 – HTW Dresden Data Mining TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Data Mining – ein Bild aus dem Bergbau • Mining: Maschineller Abbau und Aufbereitung riesiger Gesteinsmengen mit großem technologischen Aufwand, um Edelmetalle und Edelsteine zu fördern. http://djitz.com • Data Mining: Maschinelle Aufbereitung riesiger Datenmengen mit anspruchsvollen, automatisierten Methoden, um neue, gesicherte und handlungsrelevanten Muster zu fördern. http://pinterest.com Business Analytics – Seite 34 Datenbank-Stammtisch 2015 – HTW Dresden Data Mining Definition und Einordnung TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research • „Data Mining is the process of extracting previously unknown, valid, and actionable information from large databases and then using the information to make crucial business decisions.“ (Cabena, et al. 1997) • „Data Mining, as we use the term, is the exploration and analysis, by automatic or semiautomatic means, of large quantities of data in order to discover meaningful patterns and rules.“ (Berry et al. 1997) • „Data Mining is the step in the KDD process consisting of particular data mining algorithms that, under some acceptable computational efficiency limitations, produces a particular enumeration of pattern Ej over F (where Ej is an expression and F is an set of facts).“ (Fayyad, U.M. et al. 1996) „Knowledge discovery in databases is the non-trivial process of identifying valid, novel, potential useful, and ultimately understandable patterns in data.“ (Fayyad, U.M. et al. 1996) Business Analytics – Seite 35 Datenbank-Stammtisch 2015 – HTW Dresden Knowledge Discovery in Databases Definition TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research • KDD (Knowledge Discovery in Databases) „bezeichnet den nichttrivialen Prozess der Identifikation valider, neuartiger, potentiell nützlicher und klar verständlicher Muster in Daten.“ • Data Mining „ist ein Teilschritt des KDD-Prozesses, der aus Algorithmen besteht, die in akzeptabler Rechenzeit aus einer vorgegebenen Datenbasis eine Menge von Mustern liefern.“ 90% 10% Quelle: KDD-Prozess-Modell nach FAYYAD ET AL. (1996), S. 9 Business Analytics – Seite 36 Datenbank-Stammtisch 2015 – HTW Dresden Knowledge Discovery in Databases vs. Data Mining TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research • Grundsätzlich ist Data Mining die Suche nach bestimmten Mustern in Datensätzen. • Eindeutige Definition des Begriffes fehlt, da es sich mehr um eine Ganzheit von Methoden und Anwendungen handelt: – Data Mining i.e.S.: Zusammenstellung von Algorithmen, die eine analytische und statistische Analyse von einer großen Datenbasis durchführt. – Data Mining i.w.S.: Anwendung, die alle Tools enthält, die dem Anwender helfen seine Daten zu analysieren und zu verstehen • Manche Autoren verwenden auch die Begriffe Knowledge discovery in databases (KDD) für das Data Mining i.w.S., während Data Mining (DM) auch als Data Mining i.e.S. gesehen wird Business Analytics – Seite 37 Datenbank-Stammtisch 2015 – HTW Dresden Vorgehensmodelle SEMMA im Überblick TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research http://www.sas.com Business Analytics – Seite 38 Datenbank-Stammtisch 2015 – HTW Dresden Vorgehensmodelle CRISP-DM im Überblick Cross Industry Standard Process for Data Mining TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research http://www.crisp-dm.org/ Business Analytics – Seite 39 Datenbank-Stammtisch 2015 – HTW Dresden CRISP-DM Business Understanding TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Understanding Determine Business Objectives Data Understanding Background Data Preparation Business Objectives Business understanding Modeling Evaluation Deployment Business Success Criteria This initial phase focuses on understanding the project objectives and Accessrequirements from a business perspective, then converting this Requirements, Inventory of Risk and Costs and Situation Assumptions Terminology Resources Contingencies Benefits knowledge into a data mining problem definition and a preliminary & Constraints plan designed to achieve the objectives. Determine Data Mining Goals Produce Project Plan Data Mining Goals Data Mining Success Criteria Project Plan Initial Assessment of Tools and Techniques Quelle: CRISP-DM 1.0, SPSS Handbuch Business Analytics – Seite 40 Datenbank-Stammtisch 2015 – HTW Dresden CRISP-DM Data Understanding TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Understanding Collect Initial Data Data Understanding Data Preparation Modeling Evaluation Deployment Initial Data Collection Report Data understanding The data understanding phase starts with an initial data collection and Describe proceeds with Data activities in order to get familiar with the data, to Data Description identify data quality problems, to discover first insights into the data Report or to detect interesting subsets to form hypotheses for hidden Exploreinformation. Data Data Verify Data Quality Business Analytics – Seite 41 Exploration Report Data Quality Report Datenbank-Stammtisch 2015 – HTW Dresden CRISP-DM Data Preparation TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Understanding Data Understanding Data Set Data Preparation Modeling Evaluation Deployment Data Set Description Select Data Rational for Data preparation Inclusion / Exclusion The data preparation phase covers all activities to construct the final Clean dataset (data Datathat will be fed into the modelling tool(s)) from the initial Data Cleaning Report raw data. Data preparation tasks are likely to be performed multiple times and not in any prescribed order. Tasks include table, record and Construct Derived Generated Data Attributes attribute selection as Records well as transformation and cleaning of data for modeling tools. Integrate Data Format Data Business Analytics – Seite 42 Merged Data Reformatted Data Datenbank-Stammtisch 2015 – HTW Dresden CRISP-DM Modeling TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Understanding Select Modeling Technique Data Understanding Data Preparation Modeling Modeling Parameter Settings Models Model Assessment Revised Parameter Settings Modeling Evaluation Deployment Assumptions ModelingTechnique In this phase, various modelling techniques are selected and applied and their parameters are calibrated to optimal values. Typically, there Generate Test are several Test techniques for the same data mining problem type. Some Design techniquesDesign have specific requirements on the form of data. Therefore, stepping back to the data preparation phase is often necessary. Build Model Assess Model Business Analytics – Seite 43 Model Description Datenbank-Stammtisch 2015 – HTW Dresden CRISP-DM Evaluation TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Understanding Evaluate Results Data Understanding Assessment of Data Mining Results Evaluation Data Preparation Modeling Evaluation Deployment Approved Models At this stage in the project you have built a mode! (or models) that Reviewappears to have high quality from a data analysis perspective. Before Review of Process proceedingProcess to final deployment of the model, it is important to more thoroughly evaluate the model and review the steps executed to Determine construct the List ofmodel to be certain it properly achieves the business Next Steps Possible Decision objectives.Actions A key objective is to determine if there is some important business issue that has not been sufficiently considered. At the end of this phase, a decision on the use of the data mining results should be reached. Business Analytics – Seite 44 Datenbank-Stammtisch 2015 – HTW Dresden CRISP-DM Deployment TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Understanding Plan Deployment Data Understanding Data Preparation Modeling Evaluation Deployment Deployment Deployment Plan Creation of the model is generally not the end of the project. Even if Plan the purpose of the model is to increase knowledge of the data, the Monitoring Monitoring gained will need to be organized and presented in a way And knowledge and Maintenance Maintenance Plan that the customer can use it. lt often involves applying “live“ models within an organization‘s decision making processes, for example in Produce of Web pages or repeated scoring of Final real-time personalization Final Final Report marketing Report databases.Presentation However, depending on the requirements, the deployment phase can be as simple as generating a report or as Reviewcomplex as implementing a repeatable data mining process across Experience Project Documentation the enterprise. Business Analytics – Seite 45 Datenbank-Stammtisch 2015 – HTW Dresden CRISP-DM Zusammenfassung TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics – Seite 46 Datenbank-Stammtisch 2015 – HTW Dresden Data Mining Domänenübergreifende Datenanalysemethoden TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Quellen: in Anlehnung an KÜSTERS (2001), S. 95 ff.; MEYER (2002) Business Analytics – Seite 47 Datenbank-Stammtisch 2015 – HTW Dresden Data Mining Lehre in Deutschland TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Prof. Daniel Keim, Uni Konstanz Dr. Johannes Steinmüller (ehemals Prof. Dilger), TU Chemnitz Prof. Michael Berthold , Uni Konstanz Dr. Thomas Seidl, RWTH Aachen Prof. Stefan Wrobel, Uni Bonn Prof. Rudolf Kruse , Uni Magdeburg Informatik Prof. Stefan Kramer , TU München Prof. Frank Klawonn, FH Braunschweig Prof. Katharina Morik, Uni Dortmund Prof. Javier Esparza , TU München Prof. Klemens Böhm, Uni Karlsruhe Prof. Hans-Peter Kriegel, Uni München Prof. Günther Palm, Uni Ulm Prof. Harald Kosch, Uni Passau Prof. Ralph Bergmann, Uni Trier Prof. Frank Puppe, Uni Würzburg Prof. Carsten Felden, TU Freiberg Prof. Hans-Georg Kemper, Uni Stuttgart Prof. Hans-Joachim Lenz, FU Berlin Prof. Günther Palm, Uni Ulm Prof. Klaus Wilde, KU Eichstätt Betriebswirtschaft Wirtschaftsinformatik Prof. Ulrich Küsters, KU Eichstätt Prof. Reinhold Decker, Uni Bielefeld Prof. Gholamreza Nakhaeizadeh, Uni Karlsruhe Prof. Peter Chamoni, Uni Duisburg Prof. Manfred Schwaiger, Uni München Prof. Rainer Thomé, Uni Würzburg Prof. Heinz Lother Grob, Uni Münster Prof. Myra Spiliopoulou, Uni Magdeburg Prof. Andreas Hilbert, TU Dresden Prof. Johannes Ruhland, Uni Jena Prof. Rudi Studer, Uni Karlsruhe Prof. Ralph Bergmann, Uni Trier Prof. Dirk C. Mattfeld, TU Braunschweig Statistik und Mathematik Prof. Peter Gluchowski, TU Chemnitz Prof. Antony Unwin, Uni Augsburg Prof. Robert Klein, Uni Augsburg Prof. Alfred Ultsch, Uni Marburg Prof. Rolf-Dieter Reiss, Uni Siegen Quelle: aufbauend auf MEYER (2002) Business Analytics – Seite 48 Datenbank-Stammtisch 2015 – HTW Dresden Gartner’s Magic Quadrant for Business Intelligence and Analytics Platforms – Software Quelle: Gartner 2015 TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics – Seite 49 Ausgewählte Angebote Datenbank-Stammtisch 2015 – HTW Dresden Einsatzbereiche Erfolgreicher Einsatz von Data Mining nach Branchen 2005 TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Quelle: in Anlehnung an http://www.kdnuggets.com/polls/2005/successful_data_mining_applications.htm Business Analytics – Seite 50 Datenbank-Stammtisch 2015 – HTW Dresden Einsatzbereiche Erfolgreicher Einsatz von Data Mining nach Branchen 2012 TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Quelle: in Anlehnung an http://www.kdnuggets.com/polls/2014/industries-applied-analytics-data-mining-data-science.html Business Analytics – Seite 51 Datenbank-Stammtisch 2015 – HTW Dresden Einsatzbereiche Erfolgreicher Einsatz von Data Mining nach Branchen 2014 TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Quelle: in Anlehnung an http://www.kdnuggets.com/polls/2014/industries-applied-analytics-data-mining-data-science.html Business Analytics – Seite 52 Datenbank-Stammtisch 2015 – HTW Dresden Fakultät Wirtschaftswissenschaften Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics Methodenüberblick Prof. Dr. Andreas Hilbert [email protected] http://wiid.wiwi.tu-dresden.de 01062 Dresden Telefon Telefax +49 351 463-32268 +49 351 463-32736 Data Mining Methodenüberblick TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Data Mining Problemtyp Beschreibungsprobleme Prognoseprobleme Deskription Klassifikation Abweichungsanalyse (Wirkungs-)Prognose Assoziation Segmentierung Business Analytics – Seite 54 Datenbank-Stammtisch 2015 – HTW Dresden Methodenüberblick Klassifikation und Identifikation TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research • Aufgabe ist es, von einer Menge von p Variablen {x1, x2,..., xp} auf die Klassenzugehörigkeit c{1,...,C} eines Objektes zu schließen. • Typisches Beispiel: Beim Kredit-Scoring soll mit Hilfe von z.B. mtl. Einkommen, Familienstand, Beruf etc. auf die Kreditwürdigkeit geschlossen werden. • Häufig wird diese Aufgabe auch als Identifikation bezeichnet, wobei dann zugleich auch die Prognose als Verfahrensvariante zu nennen ist. • Typische Verfahren sind Logistische Regression Entscheidungsbaum-Verfahren Künstliche Neuronale Netze Support Vector Machines Business Analytics – Seite 55 Datenbank-Stammtisch 2015 – HTW Dresden Methodenüberblick Regression und Prognose TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research • Modellierung von Abhängigkeitsbeziehungen zwischen (i.A.) einer abhängigen Variablen yi und einer Menge unabhängiger Variablen {xi1, xi2,..., xip}. • Dabei wird die Beziehung durch den Parametervektor B beschrieben und ist üblicherweise mit einem Fehler i behaftet (yi =f(xi1, xi2,..., xip, , i)). • Geschätzte Beziehung kann für erklärende und prognostische Zwecke eingesetzt werden: – Bei Zeitreihen variiert der Beobachtungsindex über die Zeit; bei autoprojektiven Verfahren werden die abhängigen Variablen yi-1, yi-2,... als verzögerte Regressoren anstelle der unabhängigen Variablen eingesetzt. – Querschnittsuntersuchungen dienen der Aufdeckung von Zusammenhangsstrukturen zwischen den Variablen. • Typische Verfahren sind (Nichtlineare) Regression Künstliche Neuronale Netze Business Analytics – Seite 56 Datenbank-Stammtisch 2015 – HTW Dresden Klassifikation Arten von Diskriminanzfunktionen im Zwei-Klassen-Fall TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Diskriminierung durch unterschiedliche Funktionen Y = f(X1, X2, ..., Xm) Nearest Neighbor Rekursive Zerlegung (Rules) Lineare Funktionen Nicht-lineare Funktionen Business Analytics – Seite 57 Datenbank-Stammtisch 2015 – HTW Dresden Methodenüberblick Clusterbildung und Segmentierung TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research • Im Gegensatz zur Klassifikation steht die Klassenzugehörigkeit der Objekte nicht im vorhinein fest. Aufgabe ist vielmehr die Bildung von Klassen, die in sich möglichst homogen und untereinander heterogen sind. • Formal findet eine Zerlegung des Wertebereichs X1 ... Xp von p Variablen {x1, x2,..., xp} in C (in der Regel) nicht überlappende Regionen {R1, R2,..., RC} statt. • Besonderheit der sog. Fuzzy-Clusteranalyse ist, dass Regionen {R1, R2,..., RC} ermittelt werden, die gemeinsame, nichtleere Schnittmengen aufweisen können. • Typisches Beispiel: Kundensegmentierung auf der Basis von sozioökonomischen Merkmalen, Verhaltensmustern, Einstellungsmerkmalen. Business Analytics – Seite 58 Datenbank-Stammtisch 2015 – HTW Dresden Methodenüberblick Clusterbildung und Segmentierung – Ziele der Clusteranalyse TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research • Die Segmentierung oder Clusteranalyse dient der Zusammenfassung von Objekten und/oder Merkmalen zu Klassen oder Gruppen, so dass zwischen den Elementen derselben Klassen größtmögliche Ähnlichkeit, zwischen den Elementen unterschiedlicher Klassen größtmögliche Verschiedenheit erreicht wird. • Die Cluster sind vorher nicht bekannt. • Einsatz finden z.B. sog. unüberwachte Lernverfahren wie Quick-Cluster-Algorithmus kMeans-Algorithmus SO(F)M … Business Analytics – Seite 59 Datenbank-Stammtisch 2015 – HTW Dresden Data Mining Gemäß Wikipedia im Mai 2009 – damals „Verfahren“ TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Quelle: http://de.wikipedia.org/wiki/Data_Mining, Abruf am 10. Mai 2009 Business Analytics – Seite 60 Datenbank-Stammtisch 2015 – HTW Dresden Data Mining Gemäß Wikipedia im März 2015 – heute „Aufgabenstellungen“ TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Quelle: http://de.wikipedia.org/wiki/Data-Mining, Abruf am 17. März 2015 Business Analytics – Seite 61 Datenbank-Stammtisch 2015 – HTW Dresden Klassifikationen … wohin das Auge schaut TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Quelle: Broschüre SAS® Enterprise Miner™ Software, SAS Institute GmbH Business Analytics – Seite 62 Datenbank-Stammtisch 2015 – HTW Dresden Fakultät Wirtschaftswissenschaften Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics Meinungen und Trends Predictive Analytics for Business Advantage Prof. Dr. Andreas Hilbert [email protected] http://wiid.wiwi.tu-dresden.de 01062 Dresden Telefon Telefax +49 351 463-32268 +49 351 463-32736 Research Methodology and Demographics Country and Position TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Reference: Fern Halper: Predictive Analytics for Business Advantage. TDWI Best Practice Report. TDWI Research, First Quarter, 2014. United States Europe Asia Canada Australia Central or South America Africa Middle East 0% 10% 20% 30% 40% 50% Position Business Sponsors/users Consultants Corporate IT professionals 0% 20% 40% 60% 80% Based on 373 survey respondents Business Analytics – Seite 64 Datenbank-Stammtisch 2015 – HTW Dresden Research Methodology and Demographics Company TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Company Size by Revenue Less than $100 million $100-500 million $500 million-$1 billion $1-10 billion More than $10 billion Unable to disclose Don't know 0% 5% 10% 15% 20% 25% Based on 373 survey respondents Business Analytics – Seite 65 Datenbank-Stammtisch 2015 – HTW Dresden Predictive Analytics A Technology whose time has come TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Drivers for Predictive Analytics Predict trends 3,95 Understand customers 3,93 Improve business performance 3,89 Drive strategic decision making 3,85 Predict behavior 3,85 Drive operational efficiency 3,78 Provide targeted products and services 3,74 Identify new business opportunities 3,73 Improve productivity 3,62 Identify risks 3,61 Faster response to business change 3,50 Competitive differentiator 3,48 Reduce fraud 3,14 1 Based on 329 survey respondents Business Analytics – Seite 66 2 3 4 5 1 = extremely unimportant … 3 = neither nor … 5 = extremely important Datenbank-Stammtisch 2015 – HTW Dresden Use Cases for Predictive Analytics What is predictive analytics used for in your company? TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Direct marketing 58% Cross-sell/upsell/propensity to spend 55% Retention analysis 55% Portfolio analysis/prediction 47% Optimization 46% Risk analysis 13% 21% Fraud detection Quality assurance Scientific investigation Loan default 15% 0% 10% 20% 50% 21% 29% 45% 40% 19% 27% 35% 30% 14% 32% 16% 9% 14% 21% 28% 20% 8% 17% 31% 24% 12% 15% 26% 19% 11% 18% 31% 30% 8% 17% 23% 34% 9% 16% 17% 43% Econometric forecasting 20% 31% 60% 70% Using today and will keep using Will use within 3 years No plans N/A or don't know 80% 90% 100% Based on 126 active respondents Business Analytics – Seite 67 Datenbank-Stammtisch 2015 – HTW Dresden Use Cases for Predictive Analytics Where is predictive analytics used in your company? TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Marketing and/or market analysis 64% Sales 24% 54% Executive management 20% 49% Customer service and support 25% 46% Finance 27% 39% Operations management 37% IT, network, or computer management 30% Engineering/R&D/scientific research 29% Online presence /social media 26% Product development/life cycle management 25% Manufacturing/supply chain HR 0% 10% 16% 11% 17% 17% 25% 17% 30% 11% 29% 17% 25% 29% 27% 12% 26% 36% 22% 20% 15% 17% 30% 17% 11% 18% 28% 15% 15% 26% 35% 19% 6% 6% 19% 30% 36% 40% 50% 25% 60% Using today and will keep using Will use within 3 years No plans N/A or don't know 70% 80% 90% 100% Based on 126 active respondents Business Analytics – Seite 68 Datenbank-Stammtisch 2015 – HTW Dresden Data, Data, Data What kind of data do you use for predictive analytics? TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Structured data (from tables, records) 98% Demographic data 2% 77% Times series data 11% 6% 6% 65% 14% 11% 10% Web log data 37% 33% 21% 9% Geospatial data 35% 37% 16% 12% Clickstream data from websites 32% Real-time event data 31% Internal text data (i.e. from e-mails, call center notes, claims, etc.) 31% External social media text data 29% 40% 19% 0% 14% 20% 45% 21% Machine-generated data (e.g., RFID, sensor, etc.) 25% 18% 44% 22% 9% 25% 38% 6% 10% 21% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Using today and will keep using Will use within 3 years No plans N/A or don't know Based on 126 active respondents Business Analytics – Seite 69 Datenbank-Stammtisch 2015 – HTW Dresden Current Value Which statement best describes the value you‘ve seen from your PA efforts? TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research We have measured positive top- and bottom-line impact We have measured top-line impact only We believe that we have besome more effective, but… We have measured a cost reduction olny We believe that we have become more efficient, but… We have gained more insight 0% 5% 10% 15% 20% 25% 30% 35% 40% Based on 126 active respondents Business Analytics – Seite 70 Datenbank-Stammtisch 2015 – HTW Dresden User Skills and Delivery Models Say Hello to the Business User TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Who in your organization (or company) is using predictive analytics to actually build models? Statistician/data scientist Business analyst IT developers External partner Other business user Casual user 0% 10% 20% 30% 40% 50% 60% 70% 80% Based on 126 active respondents Business Analytics – Seite 71 Datenbank-Stammtisch 2015 – HTW Dresden User Skills and Delivery Models Get Ready for a Different Skill Set TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research To what extent do you believe the following skills are necessary to perform predictive analytics? Knowledge of the business Critical thinking Knowledge and understanding of the source data and… Training in predictive analytics Communication skills Degree in statistics, math, or other quantitative discipline Training on the software 0% 10% 20% 30% 40% 50% 60% 70% 80% Based on 330 respondents Business Analytics – Seite 72 Datenbank-Stammtisch 2015 – HTW Dresden User Skills and Delivery Models Get Ready for a Different Skill Set TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research In the near future, who do you expect will be using predictive analytics tools in your company? Business analyst Statistician/data scientist Other business user IT developers External partners Casual users Customers 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Based on 126 active respondents Business Analytics – Seite 73 Datenbank-Stammtisch 2015 – HTW Dresden User Skills and Delivery Models Operationalizing Predictive Analytics TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Which statement best describes how predictive analytics is deployed in your organization? It is used by statisticians/data scientists and business analysts to develop models for decision making Models are built by statisticians or other internal staff and then operationalized as part of a business process Statisticians/data scientists develop the models and then analysts and other business users interact with them Models are built by external partners and then operationalized as part of a business process Models are built by external partners and then utilized for decision making 0% 5% 10% 15% 20% 25% 30% 35% 40% Based on 126 active respondents Business Analytics – Seite 74 Datenbank-Stammtisch 2015 – HTW Dresden Tools, Techniques, an Processes Top Techniques TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research 47% Linear regression 59% 57% 57% Decision trees 40% Cluster analysis 51% 45% 47% Time series models 28% 30% Logistic regression 7% Other regression 17% 18% 16% Neural networks 11% 12% 10% 11% Association rule learning Naive Bayes 2% Support vector machines Survival analysis Ensemble learning 0% 6% 7% 5% 6% 5% 10% 20% Investigating 30% 40% 50% 60% Active Based on 126 respondents in the active group and 195 in the investigating group. Business Analytics – Seite 75 Datenbank-Stammtisch 2015 – HTW Dresden Key Features and Processes Supporting PA How important are the following currently to your predictive analytics efforts? TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research 4,46 4,42 Data integration 3,94 Operationalizing it 4,29 4,17 Ease of use 3,65 Model management 3,99 4,06 3,98 Bata governance 3,80 3,86 Accessibility to all analysts In-database analytics 3,70 3,69 Analytic sandboxes 3,70 3,69 3,58 3,53 In-Memory analytics 3,18 3,03 Text analytics Open source analytics 2,83 Mobile delivery 2,82 Public cloud services 0,00 4,18 2,56 1,00 2,00 Investigating 3,13 3,13 2,82 3,00 4,00 5,00 Active Based on 126 respondents in the active group and 195 in the investigating group. Business Analytics – Seite 76 Datenbank-Stammtisch 2015 – HTW Dresden Infrastructure for Predictive Analysis What infrastructure do you have in place predictive analytics? TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Data warehouse/data marts 89% Desktop application only 7% 1% 3% 78% Flat files on servers 1% 75% An analytics platform 4% 55% Appliance 28% 41% Hadoop 21% 26% Public cloud 18% 0% 10% 20% 30% 50% 60% 6% 8% 14% 38% 40% 15% 17% 25% 29% 6% 9% 21% 35% 15% 15% 70% Using today and will keep using Will use within 3 years No plans N/A or don't know 80% 90% 100% Based on 126 active respondents Business Analytics – Seite 77 Datenbank-Stammtisch 2015 – HTW Dresden Fakultät Wirtschaftswissenschaften Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics Herausforderungen Prof. Dr. Andreas Hilbert [email protected] http://wiid.wiwi.tu-dresden.de 01062 Dresden Telefon Telefax +49 351 463-32268 +49 351 463-32736 Business Analytics Ist Modeling die ganze Kunst? TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics – Seite 79 Datenbank-Stammtisch 2015 – HTW Dresden Business Analytics Was bedeutet Evaluation? TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics – Seite 80 Datenbank-Stammtisch 2015 – HTW Dresden Business Analytics Weitere Herausforderungen TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics – Seite 81 Datenbank-Stammtisch 2015 – HTW Dresden Herausforderung Business Understanding TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics – Seite 82 Datenbank-Stammtisch 2015 – HTW Dresden Herausforderung Business Understanding – CHURN, FRAUD und Co. TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Kündigungsprävention: Von der Analyse bis zur betrieblichen Umsetzung Im Rahmen eines systematischen Kundenmanagements besteht bezüglich der großen Bedeutung einer „Kündigungsprävention“ (CHURN) Konsens. In der betrieblichen Praxis erweist sich ihre Umsetzung jedoch schwierig – aus zwei Hauptgründen: 1. Es fehlen häufig Instrumente, um eine „Kündigungsgefahr“ im Bestand überhaupt „treffsicher“ erkennen zu können (-> Data Mining auf vergangenen Bestandsdaten, Klassifikation der aktuellen Bestandsdaten) 2. Die Bearbeitung von „Kündigungsgefährdeten“ wird als Service-Aufgabe gesehen, die nicht unmittelbar zu „mehr“ Umsatz führt, gleichwohl sofort Ressourcen bindet: Damit fehlt die vertriebliche Akzeptanz (-> Deployment; es müssen Anreize geschaffen werden) Dabei bleiben aber auch andere Fragen offen: Sollen die „Hoch-Gefährdeten“ bedient werden; oder sind diese bereits verloren und man sollte sich eher auf die noch „Bekehrbaren“ konzentrieren. Dann bleibt die Frage, was identifiziert werden soll: Die Kündigungswahrscheinlichkeit oder die „Turn“-Wahrscheinlichkeit. Business Analytics – Seite 83 Datenbank-Stammtisch 2015 – HTW Dresden Herausforderung Business Understanding TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics – Seite 84 Datenbank-Stammtisch 2015 – HTW Dresden Herausforderung Business Understanding – Community Mining TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Semantic Tag Clustering Die Nutzer der Business Network Plattform Xing tragen in ihrem Profil Tags zur Beschreibung ihrer beruflichen Fähigkeiten und Interesse ein. Diese Information stellen neben den standardisierten Informationen wie bspw. „Alter“ und „Dauer der XING-Mitgliedschaft“ ein enormes Potential an Information dar. Besonders relevant sind dabei semantische Zusammenhänge zwischen unterschiedlichen Tags, bspw. zwischen BI und Data Mining. Auf Basis dieser Zusammenhänge lassen sich Cluster von semantischen zusammengehörigen Tags bilden. Diese Tag-Cluster wiederum bilden unter anderem die Grundlage für innovative Recommendation-Features. Business Analytics – Seite 85 Datenbank-Stammtisch 2015 – HTW Dresden Herausforderung Business Understanding – Adaptive Data Mining TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Adaptive Kampagnensteuerung Damit analytische Auswertungen mit der zunehmenden Automatisierung von Geschäftsprozessen Schritt halten können, empfiehlt sich für diverse Aufgabenstellungen eine Einbettung in operative Anwendungssysteme. Dieser Idee folgend wurde bei Cortal Consors eine dynamische Komponente in das Kampagnenmanagementsystem integriert, die periodisch Kundenreaktionen auf CrossSelling-Angebote auswertet und damit Scoring-Modelle verfeinert, die wiederum zur Selektion der Kundenkontakte für Angebote dienen. So entstand ein selbstlernendes System, das in einer prototypischen Implementierung seit 2008 operativ läuft. Business Analytics – Seite 86 Datenbank-Stammtisch 2015 – HTW Dresden Herausforderung Business Understanding – Revenue Management TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics – Seite 87 Datenbank-Stammtisch 2015 – HTW Dresden Herausforderung Data Understanding TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics – Seite 88 Datenbank-Stammtisch 2015 – HTW Dresden Herausforderung Data Understanding – Weblogs: Definition TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Weblogs: Weblogs Corporate Blogs Public Relations chronologisch dargestellt • Einträge sind einzeln über URLs adressierbar Information • Inhalte werden umgekehrt Externe Blogs Marktkommunikation Interne Kommunikation Service Blogs Knowledge Blogs Kampagnen Blogs • Kommentare zu jedem untereinander Blogosphäre: Die Gesamtheit aller Weblogs Business Analytics – Seite 89 Persuasion • Starke Verlinkung CEO Blogs Argumentation Eintrag möglich Produkt Blogs Customer Relationship Blogs Krisen-Blogs Kollaborations-Blogs Meinungsmacher Blogs Wahrnehmung in der Öffentlichkeit • Regelmäßige Updates Social Network Blogs Blogs im Nebel Datenbank-Stammtisch 2015 – HTW Dresden Herausforderung Data Understanding – Weblogs: Aufbau und Beispiel TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics – Seite 90 Datenbank-Stammtisch 2015 – HTW Dresden Herausforderung Data Preparation TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics – Seite 91 Datenbank-Stammtisch 2015 – HTW Dresden Herausforderung Data Preparation – Zeitreihen TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research • Zeitreihenanalyse im Rahmen von Datamining gefragtes Forschungsgebiet – Besondere Handhabung von Zeitreihen notwendig – Viele Ergebnisse von Publikationen schwer verallgemeinerbar – Evaluation und Anwendung unterschiedlicher Ansätze auf Industriedaten • Problem: Bislang manuelle Analysen von Daten des Ätzprozesses um Instabilitäten in der Linie zu analysieren – Annahme: Zeitreihendaten des Ätzens korrelieren mit Qualität einer Maske – Verstärkung bzw. Rückweisung der Annahme erhöht Prozessverständnis – Erweitertes Verständnis dieser Zusammenhänge könnte Anwendung von FDC (Fault Detection and Classification) ermöglichen Business Analytics – Seite 92 Datenbank-Stammtisch 2015 – HTW Dresden Herausforderung Data Preparation – Zeitreihen: Datenvorverarbeitung TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research • Aufwand für Datenvorverarbeitung oft unterschätzt • Vorverarbeitung von Zeitreihen – Missing Value Analysis (Autokorrelation, Interpolation, Zeitreihenmerkmal…) – Ausreißer und Datenrauschen (visuelle Erkennung…) – Normalisierung (Überführung der Wertebereiche auf vorgegebenen Bereich) – Diskretisierung (Anzahl der Merkmalsausprägungen verringern) – Datenreduktion (PCA, Fourier Transformation, Wavelet Transformation…) • Verringerung der Redundanz und Erhöhung der Verständlichkeit • Vorhersagemodelle aufbauend auf einzelnen Zeitreihencharakteristiken Business Analytics – Seite 93 Datenbank-Stammtisch 2015 – HTW Dresden Herausforderung Data Preparation – Zeitreihen: Datenvorverarbeitung: PCA & Fourier-Transformation TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research • Hauptkomponentenanalyse (PCA) – Hauptkomponenten = Linearkombinationen der Objektattribute – Hauptkomponenten stehen senkrecht aufeinander – Ersten k Hauptkomponenten genügen zur Repräsentation der Objekte – Kritik: • Hauptkomponenten schwer interpretierbar • Keine Berücksichtigung der Reihenfolge der Attribute (Zeitverlauf) • Die Fourier-Transformation – Überführung der Daten von Zeitraum in Frequenzraum – Darstellung der Zeitreihe mit Hilfe von Sinus- und Kosinuskurven – Erfassung globaler Eigenschaften – Windowed Fourier Transform Erfassung lokaler Eigenschaften möglich – Verwendung der k ersten oder k größten Fourierkoeffizienten zur Repräsentation der Objekte Business Analytics – Seite 94 Datenbank-Stammtisch 2015 – HTW Dresden Business Analytics Ist Modeling die ganze Kunst? NEIN TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics – Seite 95 Datenbank-Stammtisch 2015 – HTW Dresden Fakultät Wirtschaftswissenschaften Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Business Analytics Ausblick Prof. Dr. Andreas Hilbert [email protected] http://wiid.wiwi.tu-dresden.de 01062 Dresden Telefon Telefax +49 351 463-32268 +49 351 463-32736 Ausblick TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research Es gibt viel zu tun, packen wir‘s an. Process Mining Web Mining Text Mining Data Mining Statistik Business Analytics – Seite 97 Image Mining Music Mining Multimedia Mining Community Mining Link Mining Distributed Data Mining Data Mining as a Service Adaptive Data Mining Datenbank-Stammtisch 2015 – HTW Dresden