Was sind Produktdaten?
Transcription
Was sind Produktdaten?
„Die Pflege von Stammdaten ist die Grundlage für wichtige <Insert Picture Here> Geschäftsprozesse und – entscheidungen.“ Product Data Quality Verbesserung der Artikel-Stammdatenqualität, automatisch und in Echtzeit Ralf Kittel, Oracle Safe Harbor Statement The following is intended to outline our general product direction. It is intended for information purposes only, and may not be incorporated into any contract. It is not a commitment to deliver any material, code, or functionality, and should not be relied upon in making purchasing decisions. The development, release, and timing of any features or functionality described for Oracle’s products remains at the sole discretion of Oracle. Agenda 1. 2. 3. 4. 5. 6. 7. Datenqualität – Status Quo Produkt-Stammdaten Möglichkeiten der Qualitätssteigerung Nutzen von semantischen Technologien Integration in bestehende IT-Systeme Beispiele aus Retail, High-Tech, Life Science, Public Demo Datenqualität Jede Firma braucht saubere Daten. Viele glauben, sie trifft es nicht. Doch es kann schon zu spät sein. Quelle: Autobild.de Herausforderungen des Information Managements Kontinuierliches Steigern der Datenqualität Warum kann ich nicht die Berichtsergebnisse sehen, die ich brauche? Warum greifen meine Anwendungen auf veraltete Daten zurück? Warum habe ich so viele doppelte Daten? Die meinsten sind inkorrekt. Wie kommen schlechte Stammdaten in eine ITApplikation? „SAP-Anwender vertrauen der Qualität der eigenen Daten nicht!“ Quelle: http://www.e3cms.de/index.php?id=3223 Neue Barc-Studie (Februar 2010) untersucht Wahrnehmung von Datenqualität bei Anwendern von SAP-Systemen. Bild: Die wichtigsten Daten im Unternehmen Quelle: BARC Institut, Würzburg, März 2011 Wie kritisch ist die Qualität Ihrer Unternehmensdaten für unternehmerische Entscheidungen? Quelle: BARC Institut, Würzburg, März 2011 Top 5 Probleme beim Einsatz von BI-Software Quelle: The BI Survey 9 und BARC Institut, Würzburg, März 2011 Was sind Produktdaten? Bei Datenqualität denken viele zunächst nur an Kundenstammdaten Kunde (PLZ, Ort, etc.) Single format/ country Produkt (Benennung, Klassifizierung, Artikelnummer, Lieferant, Preis, Verfügbarkeit, Lagerort, Stückliste, SKU, Betriebsmittel, Verpackung, etc.) Over 30,000 categories … Kundenstammdaten Artikelstammdaten • • • • • Haben keine fixe Syntax – wenige Standards • Unendliche Variabilität - Format, Inhalt, Syntax • Haben unterschiedliche Regelungen für die einzelnen Artikelkategorien • werden oft von mehreren Anwendungen bzw. Abteilungen verwendet/erzeugt • sind bei analytischen Auswertungen oft die Kriterien, nach denen ausgewertet wird. • werden meistens langfristig gehalten. • Komplexe Lieferkette (Hersteller, Distributor, Zulieferer, …) Relativ feste Syntax Schreibfehler Namen Äquivalenten Abgleich basierend auf Wahrscheinlichkeiten Artikelstammdaten Unstrukturiert & nicht standardisiert Was ist das? 10hp motor 115V Yoke mount MOT-10,115V, 48YZ,YOKE mtr, ac(115) 10 horsepower 115volts This 10hp yoke mounted motor is rated for 115V with a 5 year warranty 10 Caballos, Motor, 115 Voltios TEAO HP = 10.0 1725RPM 115V 48YZ YOKE MTR Motor, TEAO, 1725 RPM, 48YZ, 15 Voltios, Montaje de Yugo, hp = 10 Item Classification Power Voltage Mounting Motor 26101600 10 horsepower 115 Yoke Artikelstammdaten Wie sie in IT-Systemen zu finden sind Inkonsistente Namen Viele Informationen, aber meistens nicht standardisiert und unberechenbar ABC123 ManufaDescription cturer AA Inc. 10hp motor 115V Yoke mount abc-123 A.A. Product ID mtr, ac(115) 10 horsepower 115volts Attribute nicht standardisiert, fehlend oder falsch Product Type Power Voltage Mount Motor, AC/DC 10hp 115V Yoke AC/DC Motor 10 115 AC. Mot-AC 10 H-pow 115 ABC/123/Q AA/Craft 10 Caballos, Motor, 115 Voltios QA-ST5 Craft TEAO HP = 10.0 1725RPM 115V 48YZ YOKE MTR Z99 Z99 MOT-10,115V,48YZ,YOKE Z99 Motor powered pulley, 3/4" Motor Inkonsisten tes Format Falsch klassifiziert 26101604 Inkonsistente und fehlerhafte Klassifizierung Vielfache Dubletten (oft schwer zu entdecken) Verwendung von Produktdaten im Order to Cash Prozess Vertrieb, Entwicklung, Beschaffung, Planung, Herstellung … • Lieferantendaten sind oft nicht standardisiert. • Produktdaten werden oft in verschiedenen Systemen geführt. • Ungenaue Daten führen zu Fehlern in der Planung und in der Fertigung. • Bestellung auf Grund von Fehlern im Produktkatalog. met European Ops Asia Operations Service Providers Supply Network Folgen schlechter Produktdaten Allgemein Folgen schlechter Produktdaten Kaizen: 7 Verschwendungsarten Überproduktion mehr als notwendig fertigen 1 Bestände End-, Halbfertigprodukte, Zulieferteile u. Materialien die als Bestände lagern sind nicht wertschöpfend Warten 7 2 6 Herstellung untätige Hände eines Mitarbeiters. Prozesstaktung nicht optimiert 3 7 Mudas Unzureichende Technologie oder Konstruktion 5 Nacharbeit/Fehler Fehlerhafte Produkte stören den Produktionsfluss und erfordern teure Nachbesserung 4 Transport Bewegung Bewegung von Materialien oder Produkten ist nicht wertschöpfend Jede Körperbewegung, die nicht zum Wertzuwachs beiträgt ist unproduktiv Muda = japanisch für Verschwendung Häufige Lösungsstrategien … reichen bei Artikelstammdaten nicht aus Manual – Viel zu teuer – Viel zu langsam – Nicht wirklich skalierbar Individualprogrammierung – Zeitaufwändig – Zu viele Ausnahmen – Unvollständige / zweideutige Antworten ;3.5 MM 20 MM * ^ | G = "MM" | ^ | G = "MM" | [{FM}="CATHETER" ] | [{T1}="BALLOON"]| [{BR}!="OPTIPLAST"] COPY [1] temp1 COPY_A [2] {Q1} COPY "X" {C1} COPY [3] temp2 COPY_A [4] {Q2} RETYPE [1] 0 RETYPE [2] 0 RETYPE [3] 0 RETYPE [4] 0 CALL Ballon_Measurements “Massenexport nach Excel” – Zu teuer – Zu langasam – Keine kontinuierliche Kontrolle SAP Excel-Export/Import für Stammdatenpflege Manuelle StammdatenPflege mit Excel-Unterstützung Quelle: http://www.e-3.de/ Der Lösungsansatz: Automatisches Extrahieren, Aufbereiten, Validieren und Speichern von Stammdaten Speichern Extrahieren Aufbereiten Validieren / Testen Die Lösung: Oracle Product Data Quality Lifecycle Iterativer Prozess zur langfristigen Verbesserung der Datenqualität Überwachen Analysieren Anreichern Bereinigen Die Lösung: DataLens™ Automatisches Aufbereiten & Validieren • • • • • DateLens™ entspricht einer optischen Linse Zeigt die Daten so an, wie gewünscht (eingestellt) keine „dauerhafte“ Datenhaltung Automatisch und in Echtzeit Aufbereiten & Validieren Enthält Kontextwissen über z.B.: • verschiedenen Produktkategorien • Vokabular • Abkürzungen • Regeln • Attribute • gültige Werte • Übersetzungen • Standards • Klassifizierungen • Informationserkennung im Zusammenhang (Kontext) und mit der richtigen Bedeutung(Semantik) • selbstlernend • in jeden beliebigen Prozess integrierbar (z.B. Stammdatenanlage) Semantik macht den Unterschied. Wikipedia: Semantik nennt man die Wissenschaft von der Bedeutung der Zeichen und Wörter. • Die Bank, 1000$ – Geldinstitut oder Sitzgelegenheit? • 3M, Medizin – 3 Meter oder Unternehmen? • Schuh, 4 polig – Laufschuh oder Klemmenschuh? Was leistet die Semantische Erkennung von Product Data Quality? • Standardisieren von Attributen - jeder Standard • Standardisieren von Beschreibungen - beliebige Länge oder Norm • Übersetzen - von jeder Sprache in jede Sprache • Klassifizieren mit jedem beliebigen Schema - UNSPSC, eClass, Zoll, etc. • Validieren – Attributwerte • Anreichern - aus externen Quellen • Abgleichen - ID Prüfung, funktionelle Übereinstimmung, usw. • Merge – Regelbasiertes Zusammenführen • Gap-Analyse – Erkennen von fehlenden Informationen und ggf. anreichern • Verbesserungsvorschläge Beispiel Product Data Quality Console Real-time interactive User Interface spart Zeit beim Testen Oracle Product Data Quality Erkennen von Standards & Konvertierung/Umrechnung Standardisieren von Varianten in ein Format • Standardformat kann jederzeit geändert werden • Standardformat kann allgemeingültig sein oder z.B. für einen speziellen ArtikelTyp Data Standardization Automatisches Data-Cleansing Keine Standarddaten (vorher) Standardisierte Data (nachher) Description English RESPCF AX300OHM1/4W5% Resistor 300 Ohm 5% 0.25 Watt Axial Carbon Film Spanish Resistor 300 Ohmio 5% 1/4 Vatio Película Axial de Carbón Russian Резистор 300 Ом 5% 1/4 Ватт Аксиальная Карбонная Пленка Resistance 300 Ohm Data Standardization Engine 220 ohm CF AX 0.5W 10 % ress Catalog Category 4 Resistor 2 Übersetzen von jeder Sprache in jede Sprache 4 Klassifizierung 5 Industrie-und Unternehmensstandards anwenden Power 0.25 Watt Tolerance 5% 3 UNSPSC 32121609 Procurement Class R-I 5 Resistor 220 Ohm 10% 0.5 Watt Axial Carbon Film Spanish Resistor 220 Ohmio 10% 0.5 Vatio Película Axial de Carbón Russian Резистор 220 Ом 10% 0.5 Ватт Аксиальная Карбонная Пленка Resistance 220 Ohm 3 Attribute extrahieren und standardisieren 2 Description English 1 Standardisierung der Item Beschreibung 1 Catalog Category Resistor Power 0.5 Watt UNSPSC 32121609 Tolerance 10% Procurement Class R-X Die Lösung: Oracle Product Data Quality (PDQ) Extrahieren und Publizieren von Stammdaten Extrahieren CRM Speichern/Publizieren Users EBS CRM SAP EBS GDSN SAP Other Custom Apps BI Extrahieren: Oracle PDQ kann Daten aus vielen verschiedenen Datenquellen extrahieren, z.B. Texte, Microsoft Excel-Tabellen, Web Services, XML und Datenbanken. Dabei kann PDQ sogar auf implementierte DBFunktionen/Prozeduren zugreifen. Publizieren: Oracle PDQ kann die bearbeiteten Daten in verschiedenen Zielsysteme speichern - auch gleichzeitig in mehrere Zielsysteme z.B. im XML-, Excel- oder Text-Format. Die Daten können auch automatisch an einen FTPServer versendet werden. Prozessintegration Oracle PDQ Integration in ein MDM/PIM-System und Prozess EBS Product Data Hub Record Share CRM Consolidate Govern Cleanse Users CRM SAP EBS GDSN SAP Other Custom Apps BI Integration in jedes beliebige MDM/PIM-System. Standardintegrationen verfügbar, oder via Web-Services u/o SOA-Architektur. Product Data Quality – Anwendungsbeispiel Prozess-/ Situationsabhängiger Workflow Typische Einsatzgebiete • Migrations-/Systemharmonisierungsprojekte • Datenintegrationsprojekte „Wie sehen die Daten aus, die zusammengeführt werden sollen“ • Business Intelligence („Garbage in garbage out“) • Kostenreduktion im Beschaffungswesen, z.B. Lieferantenreduktion – Wer liefert was? Ausgabenanalysen, etc. • Reduktion Time-to-Market, z.B. Teilereduktion • User Experience im Webshop steigern • Stammdatenübersetzung/-normierung • Funktionserhöhung innerhalb IT-Anwendungen (z.B. ERP, PLM, SCM) • Governance und Compliance • Integration in MDM/PIM • Risikomanagement • Fehlermanagement • Vollständigkeitsprüfung • Data Quality Firewall /-Lifecycle Product Data Quality – Auszug aus unsere Kundenliste Manufacturing & Distribution Healthcare MC Healthcare/ Nihon Hospital Retail BEISPIELE Beispiel: Elektronische Komponenten - Widerstand Analysieren, Extrahieren, Transformieren, Standardisieren pro Produktkategorie Extraktion und Standardisierung der Attribute DataLens Sehr variable Syntax (Muster) Semantische Erkennung identifiziert die Artikelkategorie und die Attribute mit sehr variablen Daten. Der Artikel kann dann wie gewünscht gereinigt (standardisierten) werden. Klassifikation gemäß verfügbaren Schemas und Industrie- oder eigene Standards Normierte Beschreibungen passen zu allen Standards und Formate Übersetzung in jede beliebige Sprache (inkl. double-byte Sprache) Beispiel: Büroordner Analysieren, Extrahieren, Transformieren, Standardisieren pro Produktkategorie DataLens™ Beispiel: Medizinische Handschuhe (Life Science) Description GLOVE PROTEGRITY SMTH GRIP MICRO PF LATEX SURG 6.0" LRG 100 / BX 5LBS GLOVE LARGE 100EA PROTEGRITY PF LATEX SURGICAL 6.0" TEXTURE GRIP GLVS LINER PWD 6.0" FR LTX SUG TEXT GRP ULTRATUFF CUT RESIST STRL LG PROTE GLVS SURG LARGE PF SMTH GRIP CASE OF 1000 LTX BLU 9.0IN. GLVE PROTGRITY TEXT SMT PF LATX SURG 7.5IN MD 250 CTN 10LBS GLVE PROTEGRITY TEXT 100 BOX PF LATEX SURGICAL 5.5IN 20-LBS. MEDIUM LF GLOVES TEXT ESTM SMT PF SYNTHETIC XLG SURG 7.5IN. 500 / CASE 20 LBS. GLOV EXAM LTX 7.5IN FREE SYN ( VINYL ) VHA+ PF N/S SM 17.5 LBS. XLRG GLOVES SMTH STERILE PWD LTX PROCEDURE 8.0IN GLOVE EXAM TEXT 6.5" LTX FR N/S PWD VINYL INSTAGARD SM TEXT GRIP GLOVE 8IN. SMTH MD NOVA PLUS PF NITRILE EXAM TEXTURE CR100BT BROWN 8" SMOOTH GRIP LATEX MED CLEANRM GLOVE 5.5 IN 10 LBS TUFFY ESTEEM 6.5" GLOVE EXAM BOX OF 100 LATEX VHA+ TEXT PF N/S LG 50LBS SMTH GRIP ESTM 7.5" GLOVE LF EXAM SYN VHA+ PF N/S MED 12 DOZ 100OZ. GLV PF ESTEEM NEU-THERA 8.5IN. NITRILE EX SZ XL 5PDS Item Type Size Materials GLV EXAM PF SYN ESTEEM W/NEU-THERA 7.0" SZ MD 200/BOX 20-LBS Large Surgical Latex MED GLVE EXAM N/S PF 500 COUNT LATEX POSITIVE TOUCH ESTEEM 7.5" Surgical Large Latex GLV EXAM ESTEEM LATEX VHA+ TXT PWDRLESS N/S 5.5"Surgical XS 100 PER CTN Large Latex TUFFY CR100BT BROWN LATEX CLEANROOM GLOVE 8.5 Surgical " SMOOTH GRPLarge 10LBS. XLRG Latex XS GLV CLN PROCES TXT GRP ULTRACLEAN 100 PER BXSurgical STER SYN DURAPRENE 12LBS. Medium CP 7.5IN Latex Sehr variable Syntax (Muster) Surgical Surgical Exam Procedure Exam Exam Cleanroom Exam Exam Exam Exam Exam Exam Cleanroom Cleanroom Medium Extra Large Small Extra Large Small Medium Medium Large Medium Extra Large Medium Medium Extra Small Extra Large Extra Small Latex Synthetic Latex Latex VINYL Nitrile Latex Latex Synthetic Nitrile Synthetic Latex Latex Latex Synthetic Extract & Standardize Grip Smooth Textured Textured Smooth Smooth Textured Textured Smooth Textured Smooth Smooth Textured Smooth Positve Textured Smooth Textured Brand Protegrity Protegrity Ultratuff Protegrity Protegrity Protegrity Esteem Instagard Nova Plus Tuffy Esteem Esteem Esteem Esteem Esteem Esteem Tuffy Ultraclean Length 6.0 IN. 6.0 IN. 6.0 IN. 9.0 IN. 7.5 IN. 5.5 IN. 7.5 IN. 7.5 IN. 8.0 IN. 6.5 IN. 8 IN. 8 IN. 6.5 IN. 7.5 IN. 8.5 IN. 7.0 IN. 7.5 IN. 5.5 IN. 8.5 IN. 7.5 IN. Shipping Weight 5 LBS. 10 LBS. 20 LBS. 20 LBS. 17.5 LBS. 10 LBS. 50 LBS. 100 OZ. 5 LBS. 20 LBS. 10 LBS. 12 LBS. Beispiel: Grundbuch Dokumente (Freitext) Beispiel: Grundbuchinformationen in Freitext. Wichtige Informationen sind aus dem Text extrahiert worden, um strukturierte Suche zu unterstützen. KUNDENBEISPIELE Data Mastering in Action Sampled 28k items across 20 categories 2120 Capacitors: 11976 Resistors: Before % Populated 23% 23% 21% 40% 15% 0% After % Populated 98% 99% 98% 100% 100% 100% Before Primary Resistor Attributes % Populated Resistance 39% Tolerance 36% Power 35% Classification - DRI 40% Classification - HTS 15% Classification - UNSPSC 0% After % Populated 96% 98% 98% 100% 100% 100% Primary Capacitor Attributes Capacitance Tolerance Voltage Classification - DRI Classification - HTS Classification - UNSPSC Corrected, enriched, standardized …in real-time 39 Drive Standards System-by-System, Process-by-Process Cleanup legacy Standardize & validate for load Item Hub Search X-Ref External DB Transform and integrate between systems 40 Data Challenges – How Many Ways Can You Say “3M”? 41 Data Challenges – Same Product, Different Numbers Different distributors and hospitals use different identification numbers Allegiance Owens & Minor BBMC-Colonial BBMC-Durr Kreisers Midwest Pacific UnitedUMS - M8630 - 4509008630 - 045098630 - 081048 - MINN8630 - TM-8630 - 3/M8630 - 001880 Industry Distributor Numbers for 3M Product # 8630: 42 3M™ DuraPrep™ Surgical Solution (Iodine Povacrylex [0.7% available Iodine] and Isopropyl Alcohol, 74% w/w) Patient Preoperative Skin Preparation Oracle PDQ - Zusammenfassung Quality Governance – Data Steward Dashboard Exception Management – Validation & Remediation Standardize • • • • Std. Classification(s) Std. Attributes Std. Descriptions Translate (inbound) Match • De-duplicate • Merge Enrich • Classify • Extract/append info Repurpose • • • • Translate (outbound) (Re-)classify (Re-)standardize (Re-)format Semantic Recognition – Contextual understanding & learning Fragen