Untitled
Transcription
Untitled
HANDBUCH ii – STATISTICA-Handbuch Copyright © StatSoft, 2009 HANDBUCH: INHALT Beispiel 1: Korrelationen ..............................................................................11 Beispiel 2: ANOVA ......................................................................................34 Beispiel 3: Variablenbündel ..........................................................................42 Beispiel 4: Analyse für Gruppen...................................................................46 Beispiel 1: Eingabedaten direkt aus Excel ....................................................57 Beispiel 2: Direkter Datenzugriff aus Datenbanken .....................................60 Beispiel 3: Datenaufbereitung – Bereinigung und Filterung ........................65 Beispiel 4: Tabellenformeln und Batch-Formeln .........................................74 Beispiel 5: Ergebniszusammenfassungen .....................................................79 Beispiel 6: STATISTICA Data Miner Recipes ..............................................86 Beispiel 7: WebSTATISTICA – Herunter-/Hochladen von Analysen vom bzw. auf den Server ........................................................................97 Beispiel 8: STATISTICA in regulierten Bereichen ......................................102 Beispiel 9: STATISTICA Enterprise............................................................ 110 Allgemeines ................................................................................................ 133 Unterstützung mehrerer Analysen .............................................................. 134 Interaktive Benutzeroberfläche ...................................................................136 STATISTICA Visual Basic und Steuerung von STATISTICA aus anderen Anwendungen..........................................................................149 Webbrowser-basierte Benutzeroberfläche: WebSTATISTICA ....................150 Microsoft Office-Integration .......................................................................152 STATISTICA-Handbuch – iii Copyright © StatSoft, 2009 HANDBUCH: INHALT Überblick.....................................................................................................157 1. STATISTICA-Arbeitsmappen ..................................................................158 2. Einzelfenster ........................................................................................... 160 3. Berichte ...................................................................................................162 4. Microsoft Word ....................................................................................... 165 5. Ausgabe über das Web............................................................................167 Arbeitsmappen ............................................................................................ 185 Tabellen (Multimedia-Tabellen) .................................................................189 Berichte .......................................................................................................194 Grafiken ......................................................................................................196 Makros (STATISTICA Visual Basic-Programme) ......................................197 STATISTICA-Projekte .................................................................................198 Data Miner Recipe ...................................................................................... 199 Einführung ..................................................................................................207 Anpassen von Grafiken ...............................................................................208 Allgemeine Grafikkategorien......................................................................214 Grafiken für Eingabedaten ..........................................................................215 Grafiken für Blockdaten .............................................................................218 Grafiken des Grafik-Menüs ........................................................................220 Brushing und Fallstatus...............................................................................222 Andere spezialisierte Grafiken ....................................................................226 Grafiken mit STATISTICA Visual Basic erstellen ......................................227 Anpassen der interaktiven Benutzeroberfläche ..........................................232 Anpassen von Dokumenten ........................................................................233 Lokale und permanente Anpassungen ........................................................ 233 Allgemeine Standardeinstellungen ............................................................. 234 Anpassen von Grafiken ...............................................................................235 Einrichten unterschiedlicher Konfigurationen von STATISTICA ...............236 Angepasste Konfigurationen für Einzelanwender im Netzwerk ................237 iv – STATISTICA-Handbuch Copyright © StatSoft, 2009 HANDBUCH: INHALT STATISTICA Visual Basic (SVB)-Makros aufzeichnen ............................. 242 Beispiel: Aufzeichnung einer Analyse........................................................248 ActiveX-Objekte und Dokumente (Technischer Hinweis) .........................257 OLE-Unterstützung .....................................................................................258 DDE-Unterstützung ....................................................................................259 Einführung ..................................................................................................263 Kurze Schritt-für-Schritt-Anleitung ............................................................ 264 Vor-Ort-Verarbeitung von Daten externer Server (IDP-Technologie) ................................................................................265 Das Einbinden der STATISTICA Object Library in das .NET-Projekt .......269 Manuelles Erstellen der COM Interop ........................................................271 Unterstützung mehrerer STATISTICA-Versionen .......................................272 Generierung der STATISTICA-Instanz ........................................................272 Die Library-Version von STATISTICA .......................................................273 Hilfe zur Programmbedienung ..........................................................................275 WebSTATISTICA............................................................................................... 281 STATISTICA-Produktfamilie ............................................................................293 STATISTICA-Handbuch – v Copyright © StatSoft, 2009 HANDBUCH: INHALT vi – STATISTICA-Handbuch Copyright © StatSoft, 2009 2 – STATISTICA-Handbuch Copyright © StatSoft, 2009 STATISTICA ist ein integriertes System für Datenmanagement, Analyse, Data Mining, Visualisierung und Anwendungsentwicklung mit einem breiten Spektrum von einfachen und höheren analytischen Verfahren für kaufmännische, wissenschaftliche und industrielle Anwendungen. STATISTICA enthält nicht nur allgemeine analytische und grafische Verfahren, sondern auch umfassende Implementierungen spezialisierter Analysen (z. B. für Data-Mining-Prognosen, Businessapplikationen, Sozialwissenschaften, Biometrie oder Ingenieuranwendungen). Alle Analysen stehen als Teil eines Gesamtpakets zur Verfügung, das sich über verschiedene Benutzeroberflächen bedienen lässt. Dies umfasst: eine hochoptimierte interaktive Benutzeroberfläche (mit Optionen, STATISTICA innerhalb von Microsoft Office und anderen Anwendungen auszuführen), eine komplett browserbasierte Benutzeroberfläche (in WebSTATISTICA), die dem Thin-Client-Prinzip folgt und jedem beliebigen Computer mit Internetzugang Zugriff auf STATISTICA ermöglicht und eine umfassende, dem Industriestandard folgende und .NET-kompatible Programmierschnittstelle (.NET-kompatibles Visual Basic) mit mehr als 13.000 extern aufrufbaren Funktionen. STATISTICA-Handbuch – 3 Copyright © StatSoft, 2009 KAPITEL 1: ÜBERSICHT Die interaktive Benutzeroberfläche lässt sich bequem mittels Makros automatisieren und anpassen, wobei eine Vielzahl von Methoden verwendet und die Makros in einem VB-Skript aufgezeichnet werden können. Mit der eingebauten Entwicklungsumgebung können Schnittstellen mit anderen Anwendungen oder benutzerdefinierten Erweiterungen jeglicher Komplexität erzeugt werden, von einfachen Verknüpfungen bis zu großangelegten Entwicklungsprojekten. Die STATISTICA-Produktlinie zeichnet sich durch eine breite Auswahl von implementierten Analyseverfahren sowie die Verwendung modernster Softwaretechnologien aus (siehe Softwaretechnologie unten). Diese Technologien ermöglichen die nahezu unbegrenzte Kapazität, Leistung und Vielfalt der Anpassungsoptionen von STATISTICA. Eine der wichtigsten Besonderheiten der STATISTICA-Anwendungen liegt darin, auch unerfahrenen Benutzern die Anpassung von STATISTICA an ihre Bedürfnisse zu ermöglichen. Nahezu jeder Aspekt von STATISTICA lässt sich anpassen, einschließlich der Benutzeroberfläche. STATISTICA kann eingesetzt werden: Sowohl von Neuanwendern zum Ausführen von Routinearbeiten mittels Standarddialogen für Analysen (nur wenige selbsterklärende Schaltflächen enthaltend) oder durch Aufrufen von STATISTICA mit Webbrowsern (und einem stark vereinfachten „Frontend“), als auch von erfahrenen Analytikern, professionellen Statistikern und Anwendungsentwicklern, die jede der hochoptimierten Verfahren von STATISTICA in Benutzeranwendungen oder Rechnerumgebungen einbinden können, wobei .NET und webkompatible Softwaretechnologien zum Einsatz kommen. 4 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 1: ÜBERSICHT Die Standardkonfiguration von STATISTICA (seine Benutzeroberfläche und Systemeinstellungen) sind das Resultat jahrelanger Aufmerksamkeit gegenüber Nutzerwünschen. Wir haben Rückmeldungen von Zehntausenden unserer Anwender erhalten, die Hunderttausende von Nutzern in allen Kontinenten und allen Berufsfeldern repräsentieren. Wichtigste Erkenntnis war die Unterschiedlichkeit der Bedürfnisse und Präferenzen unserer Anwender. Um diesen unterschiedlichen Anforderungen zu begegnen, bietet STATISTICA eine der flexibelsten und am leichtesten anzupassenden Benutzeroberflächen aller heutigen Anwendungen sowie eine Methodenvielfalt, die ihresgleichen sucht. Obwohl STATISTICA Zugang zu einem mächtigen Arsenal höherer Softwaretechnologien (siehe Softwaretechnologie unten) verschafft, müssen Sie diese nicht kennen, denn sie wurden auf eine automatische und intuitive Arbeitsweise hin ausgelegt. Ein Neuanwender sieht vielleicht nie mehr als einige wenige selbsterklärende Schaltflächen. Fortgeschrittene Optionen sind jedoch nur ein Register oder Mausklick davon entfernt. Nahezu alle Aspekte von STATISTICA (von der Startkonfiguration, Erstellung und Handhabung der Ausgabe bis zu STATISTICA-Meldungen zur Auswahl des nächsten Schrittes) lassen sich per Mausklick verändern. Außerdem „erinnert“ sich STATISTICA an Ihre Auswahl bis zur erneuten Modifikation. Fast jeder Dialog zur Analysenauswahl oder Ausführung einer Routineoperation lässt sich leicht ersetzen (z. B. vereinfacht, erweitert oder mit benutzerdefinierten Verfahren kombiniert). STATISTICA wird stets so aussehen und so arbeiten, wie Sie es möchten. Die Leistungsfähigkeit, Anpassungsfähigkeit und breite Auswahl von Optionen zur Ausrichtung auf Ihre Bedürfnisse wird dadurch möglich, dass STATISTICA nahezu alle derzeit verfügbaren führenden Softwaretechnologien benutzt und unterstützt. Jede der mehr als 13.000 Funktionen von STATISTICA ist für externe Anwendungen zugänglich. In Hinblick auf Umfang oder Komplexität der zu speichernden oder abzurufenden Daten gibt es praktisch keine Beschränkungen. STATISTICA ist für Web- und Multimedia-Anwendungen optimiert. STATISTICA-Handbuch – 5 Copyright © StatSoft, 2009 KAPITEL 1: ÜBERSICHT Berechnungsverfahren und grafische Verfahren werden von zahlreichen geeigneten Optimierungen getragen, wie beispielsweise das Berechnungsverfahren der „vierfachen Präzision“, das die Einschränkungen des Standards vom IEEEFließkomma überwindet. Hiermit wird eine rechnerische Präzision geliefert, die normalerweise nur in speziellen mathematischen Anwendungen (die über ArbitraryPrecision-Arithmetik verfügen) aber nicht in weitverbreiteten datenverarbeitenden Anwendungen wie Statistik- oder Data-Mining-Programmen gefunden wird. Im Ergebnis bietet STATISTICA unübertroffene Geschwindigkeit, numerische Präzision und Flexibilität, die durch Multithreading unterstützt wird (sowie der hochentwickelten Architektur verteilter asynchroner Verarbeitung, die in der ClientServer-Version und WebSTATISTICA angeboten wird, wobei letztere Variante direkten Zugang über das Internet ermöglicht). Der Datenzugriff basiert auf einer flexiblen Datenstromtechnologie, mit der STATISTICA einfache Eingabetabellen des lokalen Laufwerks sowie Abfragen aus multidimensionalen Datenbanken bearbeiten kann. Letztere können in externen Data-Warehouses Terabytes von Daten umfassen und werden vor Ort verarbeitet (d. h. ohne sie auf den lokalen Speicher zu übertragen; diese Funktion ist in den unternehmensweiten Versionen von STATISTICA verfügbar). Beispielsweise kann man STATISTICA zur gleichen Zeit mehrfach öffnen (in jeder Kombination von Umgebungen: lokal, im Netzwerk oder in einer Client-Server d. h. webbasierten Umgebung), jeweils mehrere Datenanalysen für mehrere simultan geöffnete Datendateien oder Abfragen durchführen und die Ergebnisse in separaten Projekten ablegen. Die Eingabe- und Ausgabetabellen sowie die Grafiken von STATISTICA können von nahezu unbegrenzter Größe sein und Hierarchien von Dokumenten unterschiedlichen Typs umfassen. Die Ausgabe lässt sich in unterschiedliche Ausgabekanäle leiten, wie beispielsweise Multimedia-Tabellen, Arbeitsmappen, Berichte (einschließlich PDF-Dateien und Microsoft OfficeDokumente), das Internet sowie das optionale STATISTICA Document Management System, das nahtlos in jede STATISTICA-Anwendung integriert werden kann. 6 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 1: ÜBERSICHT Eine der besonderen Eigenschaften der STATISTICA-Produktfamilie besteht in der vollständigen Webfähigkeit. Sofern ein STATISTICA-Server installiert ist, kann man von jedem beliebigen Computer mit Internetzugang auf die umfassenden Funktionen des STATISTICA-Systems zugreifen. Dies umschließt nicht nur die Optionen, vorbereitete Skripts über das Internet auszuführen, sondern eine Fülle von interaktiven Funktionalitäten, einschließlich solcher Arbeitsprozesse wie dem Erstellen eines Data-Mining-Prognosemodells, das durch das Ziehen von Pfeilen in der interaktiven Data Miner-Arbeitsfläche realisiert wird (wobei lediglich der Browser ohne installierte Client-Software verwendet wird). Für weitere Informationen siehe Anhang B – WebSTATISTICA, Seite 283. Die meisten in diesem Handbuch beschrieben Funktionen sind in allen STATISTICA-Produkten verfügbar. Daneben beziehen sich einige Abschnitte dieses Handbuchs auf bestimmte Produkte (wie z. B. bei den Serverfunktionen von WebSTATISTICA oder der Produktlinie STATISTICA Data Miner). STATISTICA hat seit dem Erscheinen der ersten Version in allen vergleichenden Untersuchungen von Statistiksoftware die besten Bewertungen erhalten. Nur wenige Produkte haben in der Geschichte der Softwareindustrie solch einen Rekord erzielt. Weitere Informationen über StatSoft und die Rekordbewertungen von STATISTICA finden Sie auf unserer Website unter www.statsoft.de. STATISTICA-Handbuch – 7 Copyright © StatSoft, 2009 KAPITEL 1: ÜBERSICHT 8 – STATISTICA-Handbuch Copyright © StatSoft, 2009 9/28/09 Nach der Installation von STATISTICA kann das Programm durch Auswahl von STATISTICA aus dem Menü Programme des Windows-Startmenüs gestartet werden. Alternativ kann man entweder auf STATIST.exe im Windows-Explorer oder ein beliebiges Symbol einer STATISTICADatei wie z. B. einer Tabelle doppelklicken, um das Programm zu starten. Beim ersten Start von STATISTICA erscheint ein Dialog, über welchen die Ansicht der Benutzeroberfläche festgelegt werden kann. Zur Auswahl stehen eine intuitive Multifunktionsleiste (Ribbon Bar) im Stil von Office 2007 und eine Ansicht klassischer Menüs und Symbolleisten. Auch später kann jederzeit zwischen den beiden Ansichten gewechselt werden (über die Option Menüs bzw. über Multifunktionsleiste aus dem Menü Ansicht). Die Angaben in diesem STATISTICAHandbuch beziehen sich auf die klassische Ansicht. STATISTICA-Handbuch – 11 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Anschließend öffnet sich eine leere Tabelle und der Dialog Willkommen bei STATISTICA wird aufgerufen. Der Dialog Willkommen bei STATISTICA enthält Optionen, die nützlich sind, um auf häufig verwendete Funktionen von STATISTICA zuzugreifen. Falls gewünscht, kann das Kontrollkästchen Diesen Dialog nicht wieder anzeigen aktiviert werden, so dass dieser Dialog beim nächsten Aufruf von STATISTICA nicht erneut erscheint. Nahezu jeder Aspekt des Verhaltens und der Erscheinung von STATISTICA (auch viele in diesem Beispiel dargestellte elementare Eigenschaften wie die Lenkung der Ausgabe) können dauerhaft den persönlichen Präferenzen angepasst werden. Bereits der erste Schritt, nämlich das Öffnen von STATISTICA, kann angepasst werden, zum Beispiel der StandardVollbildmodus, das Aussehen der Tabellen und Symbolleisten und viele andere Aspekte von STATISTICA, die in diesem Handbuch illustriert werden. 12 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Öffnen Sie für dieses Beispiel Adstudy.sta, indem Sie im Menü Datei den Befehl Beispieldatei öffnen wählen, so dass der Dialog STATISTICA-Daten öffnen aufgerufen wird. Führen Sie auf dem Ordner Datasets und anschließend auf der Datei Adstudy einen Doppelklick aus. Im Menü Datei können ebenfalls Datendateien mit dem Befehl Öffnen aufgerufen werden. Alternativ kann man auf die Schaltfläche klicken, die in jedem StartMenü (der erste Dialog, der nach Auswahl eines Befehls in den Menüs Statistik, Data-Mining oder Grafik aufgerufen wird) enthalten ist, oder die Schaltfläche klicken, die sich in der Symbolleiste befindet. STATISTICA-Datendateien werden immer in Tabellen angezeigt (d. h., eine Tabelle ist eine Datendatei). Die Anzeige aller STATISTICA-Tabellen verwendet die mächtige MultimediaTabellentechnologie von StatSoft. Die Tabellen können nicht nur praktisch unbegrenzte Datenmengen beinhalten, sondern auch Ton, Videos, eingebettete Dokumente, Automatisierungs-Skripts und benutzerdefinierte Schnittstellen. Es können mehrere Datentabellen gleichzeitig geöffnet und mit jeweils unterschiedlichen Analysen verbunden sein. Die mit STATISTICA produzierten Ergebnisse werden meistens in (Multimedia-)Tabellen ausgegeben. Optionen für das Datenmanagement sind über das Menü Daten verfügbar, sobald eine Tabelle geöffnet ist. Die Symbolleiste Tabelle zeigt die Schaltflächen (Variablen) und , die Menüs mit Befehlen zur Umstrukturierung der Datendatei enthalten (z. B. Variablen oder Fälle Hinzufügen oder Verschieben). - Menü: - Menü: STATISTICA-Handbuch – 13 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Alle oben aufgeführten Befehle werden im Elektronischen Handbuch erklärt. Markieren Sie hierzu einen Befehl, und klicken Sie auf Ihrer Tastatur F1, um das entsprechende Hilfe-Thema aufzurufen. Die Köpfe der Variablen (Spalten) in der Tabelle enthalten die Variablennamen. Ein Doppelklick auf den ersten Variablenkopf – Geschlecht – öffnet den Dialog mit den Spezifikationen für diese Variable. Mit den Optionen in diesem Dialog können unter anderem der Variablenname und das Format verändert und eine Formel zur Neuberechnung der Variablenwerte eingegeben werden. Beginnt der Inhalt des Feldes Langer Name mit einem Gleichheitszeichen (=), wird STATISTICA ihn als eine Formel interpretieren [hinter einem Semikolon (;) darf ein Kommentar folgen]. Gibt man zum Beispiel in das Feld Langer Name für die erste Variable =(v2+v3+v4)/3 oder =mean(v2:v4) ein, dann werden die aktuellen Werte dieser Variablen für jeden Fall (Zeile) der Tabelle durch den Durchschnitt der Variablen zwei bis vier ersetzt. Spezifikationen für alle Variablen können gemeinsam in einem kombinierten Variablenspezifikationen-Editor angezeigt und verändert werden. Er ist über die Schaltfläche Alle Spez. im Dialog für die Variablenspezifikationen erreichbar. 14 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Eine nützliche Eigenschaft von Tabellen ist die Liste der in ihren Kontextmenüs verfügbaren Befehle. Kontextmenüs sind dynamische Menüs, die durch Klicken der rechten Maustaste auf ein Element (z. B. wie in folgender Abbildung eine Tabellenzelle) angezeigt werden. Das Kontextmenü von Tabellen schließt eine Auswahl von DatenmanagementFunktionen und andere auf die aktuelle Variable (Spalte), den Fall (Zeile) oder einen Zellenblock bezogene Optionen ein. Die Ausgabe kann in STATISTICA angepasst werden (siehe Fünf Ausgabekanäle auf Seite 157). Jede Ausgabe kann in fünf Kanäle geleitet werden: STATISTICA-Handbuch – 15 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Arbeitsmappen (siehe Seite 158), Einzelfenster (siehe Seite 160), Berichte (siehe Seite 162), Microsoft Word (siehe Seite 165) und Das Web (siehe Seite 167) Die vier erstgenannten Ausgabekanäle werden über die Optionen im Register Ausgabemanager des Dialoges Optionen gesteuert (erreichbar über das Menü Datei Ausgabemanager oder das Menü Extras - Optionen). Es gibt eine Vielzahl von Möglichkeiten, die Ausgabe ins Web zu publizieren, abhängig von der verwendeten STATISTICA-Version. Die Ausgabekanäle lassen sich in vielen Kombinationen verwenden (z. B. Arbeitsmappe und Bericht gleichzeitig). Jeder der Ausgabekanäle lässt sich auf verschiedene Weise anpassen. Auch können alle Ausgabeobjekte (Tabellen und Grafiken) andere eingebettete und verknüpfte Objekte und Dokumente enthalten, so dass die Ausgabe von STATISTICA hierarchisch organisiert werden kann. Im Folgenden wird eine Korrelationsmatrix für die Variablen in der Datendatei Adstudy.sta berechnet. Um zum Start-Menü Elementare Statistik und Tabellen zu gelangen, wählt man Elementare Statistik aus dem Menü Statistik 16 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE oder aus dem Menü des STATISTICA-Startsymbols des Bildschirmes aus. in der linken unteren Ecke Es sollte kein Block (d. h. eine Gruppe von Zellen) markiert sein; um eine vorhandene Markierung aufzuheben, muss nur in eine beliebige Zelle der Tabelle geklickt werden. Ist ein Block markiert, geht STATISTICA davon aus, dass die zu diesem Block gehörenden Variablen absichtlich für die Analyse ausgewählt wurden. Wenn man dann später auf OK oder die Schaltfläche Zusammenfassung drücken würde, erzeugte STATISTICA automatisch Korrelationen für die Variablen des ausgewählten Blocks, anstatt die Auswahl von Variablen abzufordern. In dem Start-Menü Elementare Statistik und Tabellen (folgende Abbildung) STATISTICA-Handbuch – 17 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE wählen Sie Korrelationsmatrizen mit einem Doppelklick (oder wählen Sie die Option und klicken Sie auf die Schaltfläche OK), um den Dialog Produkt-Moment und partielle Korrelationen aufzurufen. Wie die meisten Analysedialoge (und verschiedene andere Dialogtypen von STATISTICA) ist der Dialog ProduktMoment und partielle Korrelationen in Register aufgeteilt, die sich nach den Typen von verfügbaren Optionen richten. Normalerweise gibt es wenigstens zwei Kategorien von verfügbaren Analyseoptionen. Das Dialogregister Standard enthält die üblicherweise meist genutzten Optionen. Hierüber kann man schnell eine Standardanalyse durchführen, ohne in einer Vielzahl von Optionen suchen zu müssen. 18 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Das Register Details/Grafiken enthält alle Optionen des Registers Standard sowie eine Auswahl weniger häufig genutzter Optionen (in diesem Fall z. B. Optionen zur Speicherung von Matrizen und zur Berechnung von selten geforderten Statistiken und Grafiken). Darüber hinaus existieren je nach spezifiziertem Analysetyp häufig weitere Register. In einigen Fällen gibt es auch nur das Register Standard. Wie in allen Dialogen in STATISTICA erhält man über die Taste F1 oder das Symbol in der oberen rechten Ecke ein Hilfethema mit Informationen zu den verfügbaren Optionen des gerade ausgewählten Registers. Alle Dialoge in STATISTICA folgen den Konventionen der „intelligenten Dialogführung“. Ist man sich nicht sicher, was als Nächstes ausgewählt werden soll, klickt man einfach auf OK oder die Schaltfläche STATISTICA-Handbuch – 19 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Zusammenfassung. STATISTICA springt dann zu dem nächsten logischen Schritt und fordert eventuell noch fehlende Eingaben ab (z. B. Variablen für die Analyse). Jeder Dialog für die Analysespezifikation in STATISTICA enthält wenigstens eine Schaltfläche Variablen. Das Anklicken dieser Schaltfläche öffnet einen Dialog zur Variablenauswahl, in dem die Variablen für die Analyse festgelegt werden. Die Schaltfläche 1 Liste (quadr. Matrix) (oder das Drücken der Tastenkombination ALT+1) führt in diesem Beispiel zu dem Dialog Auswahl: Variablen für Analyse. Dieser Dialog wird auch aufgerufen, wenn die Schaltfläche Zusammenfassung geklickt wird, sofern zuvor keine Variablen gewählt wurden. (Wie bereits angemerkt: Falls ein Block von Variablen in der Datendatei markiert wurde, werden diese Variablen automatisch für die Analyse ausgewählt, so dass beim Klicken der Schaltfläche Zusammenfassung eine Korrelationsmatrix dieser markierten Variablen erzeugt wird.) Der Variablenauswahldialog unterstützt verschiedene Wege der Auswahl (einschließlich der Windows-Standards UMSCHALT+Klick und STRG+Klick zur Auswahl von Bereichen bzw. unterbrochenen Listen von Variablen). Der Dialog bietet auch mehrere Abkürzungen und Optionen für die Betrachtung des Inhaltes der Datendatei. So kann man z. B. die Variablenliste erweitern, um die langen Namen oder Formeln der Variablen zu sehen (Klick auf die Schaltfläche Lang); oder man kann eine Variable zoomen (Klick auf die Schaltfläche Zoom), um eine Liste all ihrer Werte und einiger deskriptiver Statistiken zu erhalten (siehe folgende Abbildung). 20 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Wählen Sie in diesem Beispiel in dem Dialog Auswahl: Variablen für Analyse die Schaltfläche Alle auswählen und klicken anschließend auf OK, um in den Dialog Produkt-Moment und partielle Korrelationen zurückzukehren. Klicken Sie danach auf die Schaltfläche Zusammenfassung, um eine Standard-Korrelationsmatrix für die ausgewählten Variablen zu erhalten. Anstelle der Schaltfläche Zusammenfassung hätten Sie auch in den Registern Standard oder Details/Grafiken die Schaltfläche Zusammenfassung: Korrelationen anklicken können. Abhängig von den spezifizierten Einstellungen zur Ausgabe (im Register Ausgabemanager des Dialogs Optionen aus dem Menü Extras) kann die Korrelationstabelle auch in einem Bericht, einem Einzelfenster oder in einem Word-Dokument, und nicht in eine Arbeitsmappe – wie oben gezeigt – ausgegeben werden. STATISTICA stellt äußerst anpassungsfähige Werkzeuge und Methoden zur Verfügung, um die wichtigsten Ergebnisse in STATISTICA-Handbuch – 21 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Grafiken und/oder Tabellen zusammenzufassen. Zum Beispiel wird durch das Klicken der Schaltfläche eine Grafikzusammenfassung für jedes Variablenpaar der Korrelationsmatrix aufgerufen. Diese Grafiken bilden für jede einzelne Korrelation nicht nur die Punkte im Scatterplot ab, sondern auch die Verteilungen (Histogramme) für alle Variablen sowie die entsprechenden Korrelationskoeffizienten und Regressionsgleichungen. STATISTICA beinhaltet viele solcher Abbildungen, um deskriptive Statistiken, Korrelationen, Ergebnisse von Studien zur Messmittel- oder Prozessfähigkeit oder anderen Arten von Datenanalysen zusammenzufassen. In STATISTICA werden in Tabellen nicht nur Daten gespeichert, sondern auch numerische Ergebnisse dargestellt. Tabellen besitzen zahlreiche Eigenschaften und Optionen zur Darstellung. In diesem Beispiel werden signifikante Korrelationen in einem anderen Format markiert (per Voreinstellung in Rot), damit sie leichter zu erkennen sind (siehe in der Tabelle Korrelationen in der Spalte Geschlecht die zugehörige Zelle für Messung07). Tabellen können einzelne Zeilen oder auch Gigabytes von Output enthalten und bieten viele Optionen, um die Betrachtung der Ergebnisse zu erleichtern und sie in vordefinierten Grafiken zu visualisieren (siehe unten in diesem Beispiel). Wie oben bereits erwähnt, werden Tabellen in STATISTICA von der mächtigen Multimedia-Tabellentechnologie von StatSoft gesteuert. Neben nahezu unbegrenzten Datenmengen können sie Videos, Ton, benutzerdefinierte Schnittstellen und selbstablaufende Skripts beinhalten. Die 22 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Gestaltungsmöglichkeiten von Tabellen sind sehr vielfältig (weitere Einzelheiten zu Tabellen finden Sie ab Seite 189). Die meisten Tabellenoptionen erreicht man über die Schaltflächen der Tabellen-Symbolleiste und die Kontextmenüs (werden nach einem rechten Mausklick auf eine Tabellenzelle angezeigt). Eine Beschreibung dieser Optionen erhält man über die Hilfetaste (F1) oder durch Anklicken des Symbols in der Symbolleiste und anschließendem Anklicken des entsprechenden Symbols auf der Symbolleiste. Beispielsweise lassen sich die Anzeigeformate für jede Spalte verändern, Ausgaben editieren oder leere Fälle und Variablen für zusätzliche Bemerkungen oder einzufügende Ergebnisse aus anderen Quellen hinzufügen. Tabellen können flexibel ausgedruckt werden (per Voreinstellung in präsentationsreifer Qualität mit Gitterlinien). Da Tabellen auch als Eingabedaten verwendet werden, lässt sich auch leicht eine Analyse spezifizieren, die Ergebnisse früherer Auswertungen verwendet (z. B. könnte die Korrelationsmatrix für die Spezifikation einer Analyse zur Multidimensionalen Skalierung dienen). Um eine Ergebnistabelle als Eingabetabelle zu verwenden, aktivieren Sie die entsprechende Tabelle und wählen Eingabetabelle aus dem Menü Daten. Alle Ergebnisse lassen sich in individuellen Fenstern, Berichten, Word-Dokumenten oder Arbeitsmappen anzeigen und speichern. Arbeitsmappen stellen den voreingestellten und vielseitigsten Weg zur Behandlung von Analyseergebnissen dar (weitere Einzelheiten zu Arbeitsmappen finden Sie auf den Seiten 158 und 185). Abhängig von den Einstellungen im Ausgabemanager (erreichbar über das Menü Datei Ausgabemanager, siehe nächster Absatz) lassen sich Ergebnisse ausgeben in eine einzige Arbeitsmappe mit den Ergebnissen aller Analysen, separate Arbeitsmappe mit Ergebnissen (Tabellen und Grafiken) je Analyse, die Arbeitsmappe mit der originalen Datendatei oder eine bereits bestehende Arbeitsmappe. Des Weiteren lässt sich festlegen, ob Ergebnisse automatisch in eine Arbeitsmappe ausgegeben werden sollen, oder ob durch Anklicken des Schaltflächensymbols ausgewählte Tabellen oder Grafiken manuell in eine Arbeitsmappe geschrieben werden sollen. Welche Art der Arbeitsmappe Sie wählen, oder ob Sie überhaupt Arbeitsmappen verwenden, hängt allein von Ihren Präferenzen beim Speichern von Daten und Ergebnissen ab. Um die Ausgabe der Ergebnisse nur für eine bestimmte Analyse umzulenken, klicken Sie auf die Schaltfläche im STATISTICA-Handbuch – 23 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Spezifikationsdialog der Analyse oder Grafik und wählen dort Ausgabe, um den Dialog Analyse/Grafik Ausgabemanager anzuzeigen. Um Ausgabeoptionen für alle Analysen zu ändern, wählen Sie Optionsfeld Globale Ausgabeoptionen (Einstellungen gelten auch für globale Optionen) im Dialog Analyse/Grafik Ausgabemanager, oder nutzen Sie den (globalen) Ausgabemanager (Register Ausgabemanager im Dialog Optionen, erreichbar über Ausgabemanager im Menü Datei oder über Optionen im Menü Extras). In allen Arbeitsmappen können einzelne Dokumente (z. B. Tabellen und Grafiken) oder Gruppen von Dokumenten ausgedruckt, extrahiert, kopiert und aus einer Arbeitsmappe gelöscht werden. Weitere Einzelheiten finden Sie im Überblick zu den Arbeitsmappen auf Seite 185 sowie im Elektronischen Handbuch. Tabelleninhalte können entweder mit der Tastaturkombination STRG+C (kopiert nur den Inhalt des ausgewählten Blocks) oder über Auswahl von Mit Kopfzeile kopieren aus dem Menü Bearbeiten (kopiert den Block zusammen mit den Variablen- und Fallnamen) in die Zwischenablage kopiert werden. Beim Einfügen in ein Dokument eines Textverarbeitungsprogramms erscheinen die Tabellen abhängig von der im Textverarbeitungsprogramm unter Inhalte einfügen getroffenen Auswahl als aktive 24 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE (dort editierbare) STATISTICA-Objekte, als RTF-formatierte Standardtabellen, als unformatierter Text, als Grafik oder im HTML-Format. Zur Erstellung eines Ausdrucks der Ausgabetabelle wählen Sie Drucken aus dem Menü Datei (oder drücken STRG+P), um den Dialog Drucken anzuzeigen, in dem die Druckoptionen spezifiziert werden. Eine schnellere Methode ist das Anklicken des Druckersymbols . Dies führt nicht zur Anzeige des Dialoges Drucken, sondern druckt das gesamte aktuelle Dokument. Wollen Sie ein bestimmtes Dokument aus einer Arbeitsmappe drucken, aktivieren Sie das Dokument in der Arbeitsmappe und wählen die Option Markierung im Dialog Drucken. Sie können auch ein Dokument aus der Arbeitsmappe extrahieren (durch Ziehen aus der Baumansicht oder über Als Einzelfenster extrahieren im Menü Arbeitsmappe) und es dann drucken. Arbeitsmappen bieten die wohl flexibelsten Optionen zur Verwaltung der Ausgabe (siehe die Seiten 158 und 185). Manchmal kann es jedoch sinnvoll sein, automatisch ein Protokoll aller Ergebnisse (d. h. des Inhalts aller Tabellen und Grafiken) im Berichtsstil eines Textverarbeitungsprogramms zu produzieren, in das Kommentare und Anmerkungen an beliebige Positionen eingefügt, Objekte nebeneinander platziert werden können, usw. (siehe die Seiten 160 und 194 zu weiteren Einzelheiten über Berichte). STATISTICA-Handbuch – 25 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Um einen solchen Bericht zu erstellen, öffnen Sie im Register Ausgabemanager des Dialogs Optionen oder im Dialog Analyse/Grafik Ausgabemanager das Listenfeld für Ausgabe Bericht. Wählen Sie in diesem Listenfeld eine der Optionen Mehrere Berichte (einen für jede Analyse/Grafik), Gemeinsamer Bericht (für alle Analysen/Grafiken) oder Datei auswählen (wodurch der Dialog Öffnen aufgerufen wird, in dem ein bereits bestehender Bericht ausgewählt werden kann). Um den Ausgabemanager (für globale Veränderungen) aufzurufen, wählen Sie Ausgabemanager im Menü Datei oder Optionen im Menü Extras und anschließend das Register Ausgabemanager. Der Dialog Analyse/Grafik Ausgabemanager (für lokale Veränderungen) wird geöffnet, indem Sie im Spezifikationsdialog für die Analyse bzw. Grafik auf die Schaltfläche klicken und dort Ausgabe wählen. Im Ausgabemanager kann auch die Menge erweiterter Information festgelegt werden, die zu den Ergebnissen mitgeliefert werden soll. Zurück zu dem Beispiel und der berechneten Korrelationsmatrix. Abgesehen von den ersten beiden Spalten zu Mittelwert und Standardabweichung repräsentiert jede der Zellen in der Korrelationsmatrix einen Wert (im Bereich zwischen –1,00 und +1,00), der die Beziehung zwischen den Variablen widerspiegelt (siehe entsprechende Zeilen- und Spaltenbeschriftungen). Je höher der absolute Wert des Korrelationskoeffizienten, desto enger die Beziehung; ist der Wert positiv, dann ist die Beziehung „positiv“ (d. h. hohe Werte der einen Variablen korrespondieren mit hohen Werten der anderen Variablen; entsprechend niedrige Werte der einen Variablen mit niedrigen Werten der anderen Variablen). Ist der Wert negativ, dann ist es umgekehrt (d. h. niedrige Werte der einen Variablen korrespondieren mit hohen Werten der anderen Variablen). Weitere Hinweise zur Interpretation von Korrelationskoeffizienten erhalten Sie im Elektronischen 26 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Handbuch. Dieses beinhaltet den gesamten Inhalt des Elektronischen StatistikLehrbuchs von StatSoft (eine preisgekrönte allgemeine Informationsquelle zur Statistik, die von der Encyclopedia Britannica wegen ihrer Qualität, Genauigkeit, Gestaltung und Bedienbarkeit empfohlen wird). Siehe auch den Statistischen Berater (Seite 33). Um das Elektronische Handbuch aufzurufen, wählen Sie STATISTICA Hilfe aus dem Menü Hilfe. Geben Sie dann den entsprechenden Begriff (z. B. Korrelationen) in das Feld Suchbegriff(e) eingeben des Registers Suchen ein, klicken auf die Schaltfläche Themen auflisten und wählen dann das gewünschte Thema aus dem Feld Thema wählen aus (in diesem Fall Korrelationen – Einführung): STATISTICA-Handbuch – 27 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Eines der wichtigen (und oft übersehenen) im Elektronischen Handbuch behandelten Themen befasst sich mit der Bedeutung, die die Untersuchung von Scatterplots bei Korrelationen besitzt. So können z. B. sehr große und hoch signifikante Korrelationskoeffizienten ausschließlich auf einen einzigen ungewöhnlichen Datenpunkt („Ausreißer“) zurückzuführen sein. Ist dies der Fall, dann wäre der Korrelationskoeffizient wertlos, selbst wenn er statistisch signifikant wäre: Er besäße keinerlei Voraussagekraft. Diesen Bedenken sowie den Ratschlägen des Elektronischen Statistik-Lehrbuchs folgend untersuchen wir nun einen Scatterplot, der einen bestimmten Korrelationskoeffizienten der Tabelle, und damit die Beziehung zwischen zwei Variablen visualisiert. Bei der Untersuchung der Tabelle können Korrelationen – z. B. die zwischen den Variablen Messung09 und Messung05 – grafisch betrachtet werden. Um einen Scatterplot für diese beiden Variablen zu erstellen, klicken Sie mit der rechten Maustaste auf den entsprechenden Korrelationskoeffizienten (-0,467199). In dem sich öffnenden Kontextmenü wählen Sie Grafiken für Eingabedaten - Scatterplot mit Messung09 Regression, 95% Konf.: Die gewünschte Grafik wird am Bildschirm angezeigt. 28 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Wir erkennen in der Grafik, dass es keine ungewöhnlichen Muster in den Daten gibt. Wir müssen uns somit nicht um Ausreißer sorgen (siehe die kurzen Bemerkungen zu Ausreißern auf Seite 28 sowie das Thema über Ausreißer im Elektronischen Handbuch). Beachten Sie, dass sich in dem Moment, in dem das Grafikfenster in den Vordergrund kam, die Symbolleiste verändert hat. Die Symbolleiste Grafik-Werkzeuge (die bei allen Grafikfenstern erscheint) unterscheidet sich von der Symbolleiste der Tabellen. Sie enthält eine Vielzahl von Werkzeugen für die Grafikbearbeitung sowie zum Zeichnen. Alle diese Optionen sind auch in Menüs verfügbar, und die meisten lassen sich ebenfalls über das Kontextmenü erreichen, das man per Klick der rechten Maustaste auf spezielle Grafikelemente erhält. Dabei sind die Kontextmenüs hierarchisch aufgebaut: Die ersten ein oder zwei Optionen beziehen sich speziell auf das ausgewählte Grafikelement, während die unteren Optionen Dialoge anzeigen, die Optionen für weitere mit dem ausgewählten Grafikelement in Beziehung stehende Elemente enthalten. Klickt man mit der rechten Maustaste irgendwo in den leeren Raum jenseits der Grafikachsen, wird ein Menü mit globalen Optionen angezeigt (siehe unten). STATISTICA-Handbuch – 29 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Weitere Informationen zur Bearbeitung von Grafiken findet man ab Seite 208 und im Elektronischen Handbuch. Wir kehren zurück zur Tabelle. Tabellen können durch Ziehen des Teilungsfeldes (kleines Rechteck oben am vertikalen Rollbalken oder links am horizontalen Rollbalken) in bis zu vier Abschnitte geteilt werden. Dies ist sinnvoll, wenn man bei großer Informationsmenge Ergebnisse aus verschiedenen Bereichen der Tabelle betrachten möchte. Wenn man mit dem Mauszeiger auf das Teilungsfeld zeigt, verändert sich der Cursor in das Zeichen oder . Um die Teilung nun vorzunehmen, hält man die linke Maustaste gedrückt und zieht den Cursor an die gewünschte Position. Durch Ziehen des Teilungsfeldes, das sich jetzt zwischen den Abschnitten befindet, kann die Teilung verändert werden. 30 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Informationen zur Markierung von Datenbereichen über Ausschnittsgrenzen sowie zur unterschiedlichen Geschwindigkeit beim Markieren siehe Wie kann man einen Block in der Tabelle über den angezeigten Teil hinaus erweitern? im Elektronischen Handbuch. STATISTICA unterstützt alle Standardfunktionen zum Ziehen-und-Ablegen (Drag & Drop) wie gängige Tabellenkalkulationsprogramme (z. B. Microsoft Excel). Um zum Beispiel einen markierten Datenblock zu verschieben, führt man den Mauszeiger auf die Grenze der Auswahl (der Mauszeiger verändert sich in einen Pfeil) und zieht den Block an die neue Position. Zum Kopieren eines Datenblockes zeigt man auf die Grenze der Auswahl (der Mauszeiger verwandelt sich in einen Pfeil) und zieht bei gedrückter STRG-Taste die Auswahl an die neue Position. Während des Ziehens wird neben dem Mauszeiger ein Pluszeichen (+) angezeigt. Daran erkennt man, dass der Text kopiert und nicht verschoben wird (siehe unten). STATISTICA-Handbuch – 31 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Zum Einfügen eines Blockes zwischen Zeilen oder Spalten zeigt man auf die Grenze der Auswahl (der Mauszeiger verwandelt sich in einen Pfeil) und zieht dann bei gedrückter UMSCHALT-Taste die Auswahl an die neue Position. Beim Zeigen zwischen Zeilen wird zwischen diesen ein Einfügungszeichen angezeigt. Lassen Sie die Maustaste dann los, wird der Block zwischen diese beiden Zeilen eingefügt (und erzeugt dabei neue Fälle). Beim Zeigen zwischen Spalten wird zwischen diesen ein Einfügungszeichen angezeigt. Beim Loslassen der Maustaste wird dann der Block zwischen diese beiden Spalten eingefügt (und erzeugt dabei neue Variablen). Wird während des Ziehens der Auswahl auch die STRG-Taste gedrückt, wird der Block kopiert und eingefügt statt verschoben und eingefügt; neben dem Mauszeiger erscheint ein Pluszeichen (siehe nächste Abbildung). Des Weiteren kann eine Wertereihe im Block durch Ziehen des Ausfüllkästchens (ein kleines ausgefülltes Quadrat rechts unten an der Blockgrenze) extrapoliert werden (automatisches Ausfüllen). 32 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE STATISTICA bietet ein umfassendes kontextsensitives Elektronisches Handbuch für alle Prozeduren und Optionen des Programms (es bietet mehr als 100 Megabyte komprimierter Dokumentation). Man erreicht es durch Auswahl des Befehls STATISTICA Hilfe im Menü Hilfe oder durch das Klicken der Schaltfläche in der STATISTICA-Symbolleiste. Man kann auch ein Register eines Dialoges oder einen Menübefehl, für den weitere Information erwünscht wird, einfach auswählen (bzw. hervorheben) und anschließend die Taste F1 drücken, so dass das entsprechende Hilfethema aufgerufen wird. Alternativ kann man auf die Hilfeschaltfläche klicken, die sich in der Titelzeile aller Dialoge befindet. Dank seiner dynamischen Hypertext-Organisation, der Registerstruktur (z. B. Inhalte, Index, Suche und Favoriten) und weiterer Eigenschaften für die Anpassung des Hilfesystems findet man Informationen im Elektronischen Handbuch schneller auf als in traditionellen Handbüchern. Die Statusleiste am unteren Rand des STATISTICA-Fensters bietet ebenfalls kurze Erklärungen von Menübefehlen oder Symbolschaltflächen, wenn das entsprechende Element ausgewählt bzw. angeklickt wird. Im Elektronischen Handbuch ist ein Statistischer Wählt man aus dem Menü Hilfe die Option Statistischer Berater, werden einige einfache Fragen zu der Art des anstehenden Problems und dem Typ der Daten angezeigt. Nachdem für die Beantwortung der Fragen die entsprechenden Links geklickt werden, erscheinen Vorschläge zu relevanten/passenden statistischen Methoden, und es wird mitgeteilt, wo sie in STATISTICA zu finden sind. Berater integriert. STATISTICA-Handbuch – 33 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Direkte Verknüpfungen (Hypertext-Links) führen von den Themen des Statistischen Beraters zu den entsprechenden Einführenden Beschreibungen, in denen die statistischen Methoden und Prozeduren detailliert diskutiert werden. Für das Beispiel einer dreifaktoriellen Varianzanalyse mit Messwiederholung auf einem Faktor (2 x 2 x 3-Design) öffnen Sie die Datendatei Adstudy.sta. Um die ANOVA/MANOVA-Analyse zu starten, wählen Sie aus dem Menü Statistik den Befehl ANOVA, womit das Start-Menü ANOVA/MANOVA aufgerufen wird. 34 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE In diesem Dialog können sowohl sehr einfache Analysen (z. B. über Einfaktorielle ANOVA-Designs mit nur einem Faktor) als auch komplexere Analysen (z. B. Designs wie ANOVA mit Messwiederholungen mit Zwischen-Gruppen-Faktoren und Inner-Gruppen-Faktoren) spezifiziert werden. Wählen Sie ANOVA mit Messwiederholungen als Analysetyp und Standarddialog als Spezifikationsverfahren aus. Klicken Sie im ANOVA/MANOVA Start-Menü dann auf die Schaltfläche OK, um in den Dialog ANOVA/MANOVA mit Messwiederholungen zu gelangen. Der erste (Zwischen-Gruppen-) Faktor ist Geschlecht (mit zwei Stufen: männlich und weiblich). Der zweite (Zwischen-Gruppen-)Faktor ist Produkt (mit zwei Stufen: Produkt A und Produkt B). Die beiden Faktoren sind gekreuzt, d. h., es gibt sowohl männliche und weibliche Personen in den Gruppen Produkt A und Produkt B. Jede dieser Personen beantwortete drei Fragen. Diesen Messwiederholungsfaktor nennen wir Reaktion: Er besitzt drei Stufen, repräsentiert durch die Variablen Messung01, Messung02 und Messung03. Klicken Sie auf die Schaltfläche Variablen (im Dialog ANOVA/MANOVA mit Messwiederholungen), um in den Dialog zur Variablenauswahl zu gelangen. Wählen Sie Messung01 bis Messung03 als abhängige Variablen aus dem entsprechenden Listenfeld und Geschlecht und Produkt als Faktoren [aus dem Listenfeld Kategoriale Prädiktoren (Faktoren)]. STATISTICA-Handbuch – 35 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Klicken Sie auf OK, um in den Dialog ANOVA/MANOVA mit Messwiederholungen zurückzukehren. Das Design des Versuches, den wir auswerten wollen, kann wie folgt zusammengefasst werden: ZwischenGruppen Faktor 1: Geschlecht Person 1 Person 2 Person 3 . . . männlich männlich weiblich . . . ZwischenGruppen Faktor 2: Produkt Produkt A Produkt B Produkt B . . . Messwiederholungsfaktor: Reaktion Stufe 1: Messung01 Stufe 2: Messung02 Stufe 3: Messung03 9 6 9 . . . 1 7 8 . . . 6 1 2 . . . Die minimal erforderliche Auswahl ist nun abgeschlossen. Wäre man nicht an einem Messwiederholungsfaktor interessiert, müsste man nur noch auf die Schaltfläche OK drücken, um die Analyseergebnisse zu sehen. In diesem Beispiel muss allerdings spezifiziert werden, dass die drei ausgewählten abhängigen Variablen als drei Stufen eines Messwiederholungsfaktors (Inner-Gruppen-Faktor) interpretiert werden sollen. Anderenfalls würde STATISTICA davon ausgehen, dass diese drei „verschiedene“ abhängige Variablen wären und eine MANOVA (d. h. eine Multivariate ANOVA) durchführen. Um den gewünschten Messwiederholungsfaktor zu definieren, klicken Sie im Register Standard auf die Schaltfläche Innerhalb-Effekte, die zum Dialog InnerGruppen-Faktoren spezifizieren führt. 36 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE STATISTICA schlägt die Auswahl eines Messwiederholungsfaktors mit 3 Stufen vor (Standardname R1). Über diesen Dialog lässt sich lediglich ein Inner-GruppenFaktor (Messwiederholung) spezifizieren. Um mehrere Inner-Gruppen-Faktoren zu definieren, muss das Modul Allgemeine Lineare Modelle verwendet werden (verfügbar im Zusatzmodul Höhere lineare/nichtlineare Modelle). Um zu einer umfassenden Diskussion von Messwiederholungen und Beispieldesigns im Elektronischen Handbuch zu gelangen, drücken Sie auf Ihrer Tastatur die Taste F1 (oder auf das Symbol , das sich im Dialog in der rechten oberen Ecke befindet). Bearbeiten Sie für dieses Beispiel den Faktornamen (z. B. benennen Sie ihn von R1 auf REAKTION um) und klicken zum Beenden des Dialoges auf die Schaltfläche OK. Sie müssen nicht von Hand Codes für Zwischen-Gruppen-Faktoren eingeben [etwa STATISTICA mitteilen, dass Variable Geschlecht die zwei Stufen 1 und 2 (oder männlich und weiblich) aufweist], es sei denn, Sie wollen verhindern, dass STATISTICA standardmäßig alle Codes verwendet, die es in den ausgewählten Gruppierungsvariablen des Datenbestandes vorfindet. Wollen Sie eine solche benutzerdefinierte Codeauswahl vornehmen, dann klicken Sie auf die Schaltfläche Faktor-Codes, um in den Dialog Codes für unabhängige Variablen (Faktoren) wählen zu gelangen. Dieser Dialog bietet verschiedene Optionen. Beispielsweise können Sie sich vor Ihrer Auswahl über die Schaltfläche Zoom die Werte einzelner Variablen ansehen, den Datenbestand durchsuchen und die Code-Felder (z. B. Geschlecht und Produkt) für einzelne oder alle Variablen ausfüllen lassen. Klicken Sie im Dialog Codes für unabhängige Variablen (Faktoren) wählen auf die Schaltfläche OK, damit STATISTICA-Handbuch – 37 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE STATISTICA automatisch alle Code-Felder mit allen in den ausgewählten Variablen vorgefundenen Werten ausfüllt und den Dialog schließt. Klicken Sie nach Rückkehr in den Dialog ANOVA/MANOVA mit Messwiederholungen auf die Schaltfläche OK. Die Analyse wird durchgeführt und der Dialog ANOVA Ergebnisse wird angezeigt, der verschiedene Optionen zur Ausgabe von Ergebnistabellen und Grafiken enthält. Der Dialog ist in Register unterteilt, was das schnelle Auffinden der gewünschten Ergebnisoptionen erleichtert. Möchten Sie zum Beispiel geplante Vergleiche durchführen, klicken Sie auf Register Vergl. Für die Betrachtung von Residualstatistiken klicken Sie auf das Register Residuen. Für dieses Beispiel beschränken wir uns allerdings auf die im Register Standard verfügbaren Ergebnisse. Wir beginnen mit der Tabelle der Zusammenfassung aller Effekte, indem wir auf die Schaltfläche Alle Effekte (mit dem Symbol für Zusammenfassung) klicken. 38 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Der einzige statistisch signifikante Effekt der Analyse (wenn man die Konstante einmal ignoriert) ist Faktor REAKTION (p = 0,007). Dieses Ergebnis kann durch viele mögliche Muster von Mittelwerten des Effektes REAKTION verursacht sein (weitere Informationen hierzu entnehmen Sie bitte der ANOVA – Einführung im Elektronischen Handbuch). Zur Veranschaulichung werden wir die Gruppenmittelwerte dieses Effekts grafisch betrachten. Um zum Dialog ANOVA Ergebnisse zurückzukehren, kann man STRG+R drücken, aus dem Menü Statistik die Option Weiter auswählen oder die Schaltfläche ANOVA Ergebnisse in der Analyseleiste unten anklicken. Wird der Dialog ANOVA Ergebnisse angezeigt, klicken Sie auf die Schaltfläche Alle Effekte/Grafiken, um den Dialog Tabelle aller Effekte aufzurufen, so dass die Mittelwerte für einzelne Effekte betrachtet werden können. Dieser Dialog enthält eine zusammenfassende Tabelle aller Effekte (überwiegend mit Informationen, die wir bereits in der Tabelle Alle Effekte gesehen haben) und dient dazu, einzelne Effekte aus der Tabelle in Form von Grafiken der STATISTICA-Handbuch – 39 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE entsprechenden Mittelwerte zu zeigen (optional auch Tabellen mit den entsprechenden Mittelwerten). Führen Sie einen Doppelklick auf den signifikanten Haupteffekt REAKTION (markiert mit einem Stern in der Spalte p) aus, um die entsprechende Grafik anzuzeigen. Die Grafik zeigt einen deutlichen absteigenden Trend: Die Mittelwerte der drei aufeinanderfolgenden Fragen werden immer niedriger. Obwohl dieses Design keine signifikanten Interaktionen enthält (siehe oben die Diskussion der Tabelle aller Effekte), sehen wir uns dennoch die Interaktion höchster Ordnung an, um die Konsistenz dieses stark absteigenden Trends über die Stufen der Gruppierungsfaktoren zu untersuchen. Um die grafische Darstellung der Interaktion höchster Ordnung zu sehen, doppelklicken Sie (nach erneuter Auswahl der Schaltfläche Alle Effekte/Grafiken aus dem Dialog ANOVA Ergebnisse) im Dialog Tabelle aller Effekte auf die Zeile REAKTION*GESCHLECHT*PRODUKT; sie repräsentiert die Interaktion zwischen den Faktoren 1 (Geschlecht), 2 (Produkt) und 3 (Reaktion). Der Zwischendialog Anordnung der Faktoren im Plot spezifizieren, in dem sich die voreingestellte Anordnung der Faktoren in der Grafik umstellen lässt, wird angezeigt (anders als im vorhergehenden Plot eines einzelnen Faktors können die Effekte hier auf verschiedene Weisen visualisiert werden). 40 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Klicken Sie OK, um die vorgeschlagene Anordnung zu akzeptieren und die Mittelwertgrafik zu erzeugen. Man erkennt, dass das nach Stufen der Zwischen-Gruppen-Faktoren untergliederte Muster von Mittelwerten keine bedeutenden Abweichungen vom Gesamtmuster der Mittelwerte aufweist, das die erste Grafik (für den Haupteffekt REAKTION) aufzeigte. Um die Ergebnisse weiter zu erforschen, könnten Sie nun weitere Effekte interaktiv untersuchen, zum Beispiel multiple Mittelwertvergleiche anstellen oder viele weitere Analyseoptionen nutzen. Dieses Beispiel veranschaulicht, wie STATISTICA die interaktive Analyse unterstützt. Die Spezifikation der zu erzeugenden Ausgabe wird vom Benutzer nicht schon verlangt, ehe er die ersten Ergebnisse gesehen hat. Selbst ein einfaches Analysedesign kann offensichtlich große Mengen von Ausgabetabellen und zahllose Grafiken erzeugen. Was davon aber von Interesse ist, sieht man erst, wenn die ersten grundlegenden Ergebnisse vorliegen. In STATISTICA lassen sich nach Verarbeitung der Daten und STATISTICA-Handbuch – 41 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Begutachtung grundlegender Ergebnisse gezielt spezifische Ausgaben auswählen und interaktiv Folgetests und ergänzende Was-wäre-wenn-Analysen durchführen. Die flexiblen Berechnungsprozeduren in STATISTICA und die große Auswahl an Optionen zur Visualisierung beliebiger Kombinationen von Ergebniswerten bieten zahllose Möglichkeiten, Daten zu untersuchen und Hypothesen zu prüfen. Jede im Verlauf einer interaktiven Datenanalyse getroffene Auswahl (sowohl bei der Spezifikation der Analyse als auch bei der Auswahl von Ausgabeoptionen) wird automatisch als Visual Basic-Code (Industriestandard) aufgezeichnet. Solche Makros können für den wiederholten Gebrauch gespeichert werden. Man kann sie Schaltflächen zuordnen, bearbeiten und modifizieren, mit anderen Programmen kombinieren und vieles mehr. Weitere Information hierzu finden Sie in Kapitel 9 – STATISTICA Visual Basic auf Seite 239 oder im STATISTICA Visual Basic Primer. Zum schnellen und einfachen Auffinden einer Teilmenge von Daten innerhalb einer großen Datendatei bietet STATISTICA die besondere Option Variablenbündel. Bündel können erstellt werden, um große Mengen von Variablen zu gliedern und um die wiederholte Auswahl derselben Variablen zu vereinfachen. Öffnen Sie die Datei EnginePerformance.sta. Dieser Datensatz beschreibt die Leistung größerer Motoren und enthält verschiedene Prozessparameter, die während ihrer Herstellung aufgezeichnet wurden. Die Datei umfasst 128 Motoren, deren Effizienz, Kraftstoffverbrauch und Leistung (die anhand von Tests ermittelt wurden) sowie 74 Prozessparameter, die während der Herstellung der einzelnen Motoren aufgezeichnet wurden. Für dieses Beispiel wird angenommen, dass häufig Analysen erstellt werden, bei denen derselbe Satz von Variablen wiederholt verwendet wird. Wählen Sie im Menü Daten den Befehl Variablenbündel-Manager, um den Dialog Variablenbündel-Manager aufzurufen. 42 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Klicken Sie die Schaltfläche Neu, um den Dialog Neues Variablenbündel aufzurufen. Geben Sie unter Name Variablenbündel den Begriff Produktion ein und klicken Sie anschließend die Schaltfläche OK. Der Dialog Variablenauswahl für Bündel wird aufgerufen, der alle Variablen des Datensatzes EnginePerformance.sta enthält. Für diese Analysen ist die Auswahl der Variablen Input01-Input05, Input20, Input30-Input35 und Input70 erforderlich. Um Bereiche bzw. unterbrochene Listen STATISTICA-Handbuch – 43 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE von Elementen auszuwählen, können diese Variablen mit den WindowsKonventionen UMSCHALT+Klick und STRG+Klick gewählt werden. Klicken Sie die Schaltfläche OK, um den Dialog Variablenauswahl für Bündel zu schließen, so dass man zum Variablenbündel-Manager zurückkehrt. Die Liste auf der linken Seite des Dialogs zeigt die Namen aller Bündel auf, die für diese Tabelle definiert wurden (falls erforderlich, können in einzelnen Tabellen jeweils mehrere Bündel erstellt werden). Das Fenster auf der rechten Seite zeigt den Inhalt des Bündels an, das momentan im Fenster auf der linken Seite ausgewählt ist. Wenn beide Listen leer sind, wurden für diese Tabelle keine Bündel erstellt. Bündel können einer Tabelle mittels der Schaltfläche Neu hinzugefügt, über die Schaltfläche Bearbeiten verändert und mittels der Schaltfläche Löschen entfernt werden. Der Name eines Bündels lässt sich über die Schaltfläche Name verändern. Das Klicken der Schaltfläche Ausgabe an Tabelle erzeugt eine Tabelle, die die Information über die Bündel der aktiven Datentabelle aufführt. Klicken Sie in diesem Beispiel die Schaltfläche OK, womit Sie das soeben erstellte Bündel bestätigen und den Dialog Variablenbündel-Manager schließen. Wählen Sie im Statistik-Menü anschließend Multiple Regression, um den Dialog Multiple Lineare Regression aufzurufen. Klicken Sie im Register Standard die Schaltfläche Variablen, um den Dialog zur Variablenauswahl aufzurufen. Bündel werden in eckigen Klammern direkt am Anfang der Variablenliste (in alphabetischer Reihenfolge) aufgeführt. Wählen Sie in der Liste Unabhängige Variablen das Bündel Produktion, um – mit einem Mausklick – Input01-Input05, 44 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Input 20, Input 30-Input35 und Input 70 als die unabhängigen Variablen dieser Analyse festzulegen. Falls Sie unsicher sind, welche Variablen in dem Bündel erfasst wurden, können Sie in diesem Dialog einfach den Mauszeiger auf den Bündelnamen bewegen, so dass eine Kurzinfo mit den Variablennummern angezeigt wird. Zusätzlich kann man die Liste der Variablen (mit Namen) im VariablenbündelManager einsehen, wozu einfach die Schaltfläche [Bündeln] geklickt werden muss. Es ist zu beachten, dass Bündel lediglich für einzelne Tabellen definiert werden und nur für die Variablenauswahl verwendet werden. Sie werden demnach nie in einem Bericht oder einer anderen Ausgabe aufgeführt. Dieses Beispiel zeigt, dass man erheblich Zeit sparen kann, wenn statt der Suche nach den richtigen Variablen innerhalb eines großen Datensatzes lediglich ein einzelnes Bündel ausgewählt muss. STATISTICA-Handbuch – 45 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE STATISTICA bietet eine mächtige Option, die jede statistische oder grafische Analyse in eine Analyse für Gruppen umwandeln kann. Wenn im Ergebnisdialog von praktisch jeder beliebigen Analyse die Resultate betrachtet werden oder wenn die Grafik-Optionen verwendet werden, kann man eine oder mehrere Gruppierungsvariablen auswählen und dann folgende Ergebnisse erzeugen: 1) für alle Fälle in den Daten zusammen und/oder 2) gegliedert nach jeder einzelnen Kombination von Codes der Gruppierungsvariablen. Dies ist ein sehr leistungsstarkes neues Werkzeug für die interaktive und explorative Datenanalyse, das es erlaubt, schnell zu überprüfen, ob ein Muster oder bestimmtes Resultat in allen Untergruppen, Stichproben oder Schichten der Daten besteht. Wird beispielsweise eine Multiple Regressionsanalyse durchgeführt, und man entscheidet, die Ergebnisse gegliedert nach dem Geschlecht und einer anderen Gruppierungsvariablen zu betrachten, so ist dies möglich, ohne den aktuellen Dialog zu schließen. Nach der Aktivierung dieser Option (durch Klicken der Schaltfläche Gruppen) werden nach jedem weiteren Aufruf einer 46 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Ergebnisschaltfläche (z. B. beim Erstellen tabellarischer oder grafischer Ergebniszusammenfassungen) alle Ergebnisse nicht nur für alle Gruppen zusammen (optional), sondern auch für jede einzelne eindeutige Kombination der spezifizierten Gruppierungsvariablen berechnet (z. B. nach Geschlecht und einer weiteren Gruppierungsvariablen). In einer Arbeitsmappe können die Ergebnisse der Gruppen-Analyse entweder in separate Ordner platziert werden, die mit der entsprechenden Gruppen-Bedingung (z. B. Geschlecht=weiblich; Zeit=Nach1) gekennzeichnet sind oder in einen einzigen Ordner abgelegt werden. Beispielsweise könnte man mehrere Linienplots zur Beschreibung eines multivariaten Batchprozesses erstellen, wobei ein separater Graph („Trajektorie“) für jeden einzelnen Batch erstellt wird. Diesem Beispiel liegt die Datendatei Tomatoes.sta zugrunde, welches eine der Beispieldateien ist, die im STATISTICA Elektronisches Handbuch im Abschnitt Versuchsplanung (siehe Beispiel Versuchsplanung und -auswertung für einen 2332STATISTICA-Handbuch – 47 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Plan) genauer beschrieben wird. Connor und Young (in McLean und Anderson, 1984) berichten über einen Versuch (der von Youden und Zimmerman, 1936, stammt) über verschiedene Verfahren zur Produktion von Sämlingen für Tomatenpflanzen, die danach auf einem Feld eingepflanzt werden. Öffnen Sie zunächst den Datensatz Tomatoes.sta. Wählen Sie im Datei-Menü den Befehl Beispieldatei öffnen, um den Dialog STATISTICA-Daten öffnen aufzurufen. Öffnen Sie den Ordner Datasets und anschließend die dort enthaltene Datei Tomatoes.sta. In obiger Abbildung sind einige Zeilen (Fälle) dieser Datei aufgeführt. Es sei auch auf die Elektronische Hilfe zur Versuchsplanung hingewiesen, die ein Beispiel mit einer kompletten Analyse dieser Daten beinhaltet. Dieses Beispiel illustriert ein typisches Vorgehen, wie es häufig bei der Analyse von Daten einer diskreten Produktion bzw. Batchproduktion angewendet wird. D. h., das Ziel der Analyse besteht darin, dass (grafisch oder analytisch) verifiziert wird, dass einige Muster oder Verteilungen gleichmäßig für alle Stichproben, Teile oder Batches gelten. Im Folgenden wird der Effekt der Variablen Methode, Dünger und Topfgröße auf den Ertrag (Gewicht) untersucht und abgeschätzt, ob irgendwelche Muster für jede einzelne Sorte in der Studie gelten. Anstatt eine komplette Varianzanalyse durchzuführen (wie sie in der Elektronischen Hilfe im Beispiel zur Versuchsplanung beschrieben wird), werden in den folgenden Abschnitten vorwiegend grafische Methoden angewendet. 48 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Wählen Sie im Untermenü Grafik den Befehl Streuungsplots, um den Dialog Streuungsplot aufzurufen. Klicken Sie die Schaltfläche Variablen, und wählen Sie für diese Grafik im anschließenden Dialog Variablenauswahl Streuungsplot die Variable Gewicht als die Abhängige Variable und Dünger, Topfgröße und Methode aus der Liste der Gruppierungsvariablen. 2D Grafiken Im weiteren Verlauf dieses Beispiels werden für jede einzelne Sorte Grafiken erstellt, um die Gruppen-Funktion zu illustrieren. Klicken Sie nun im Dialog zur Variablenauswahl die Schaltfläche OK. Um den Plot informativer zu gestalten, werden die Variablen umsortiert, so dass Methode als erster Faktor in der Liste der Faktoren erscheint. Klicken Sie in der Faktoren-Liste auf diese Variable, und ziehen Sie die Variable dann, wobei Sie die linke Maustaste gedrückt halten, auf die oberste Position in dieser Liste. STATISTICA-Handbuch – 49 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Stellen Sie im Dialog Streuungsplot abschließend sicher, dass die Variable Methode in der Faktoren-Liste ausgewählt ist, und aktivieren Sie das Kontrollkästchen Rahmen für Gruppen. Für die Faktoren Methode, Dünger und Topfgröße sollen für alle Tomatensorten insgesamt und gegliedert nach den einzelnen Sorten (eine Grafik pro Sorte) jeweils Streuungsplots erstellt werden. Klicken Sie die Schaltfläche Gruppen, um den Dialog Gruppen aufzurufen. Klicken Sie die Schaltfläche Gruppierungsvariable(n), um den Dialog Auswahl nach Variable aufzurufen, und legen Sie dort Sorte als Gruppierungsvariable fest. Es ist zu beachten, dass man mehr als eine Gruppierungsvariable festlegen kann, wobei in diesem Fall alle nachfolgenden Analysen nach jeder eindeutigen Wertekombination der Gruppierungsvariablen gegliedert werden. Klicken Sie nun jeweils in den Dialogen Auswahl nach Variable und Gruppen auf OK, um diese Dialoge zu schließen. Klicken Sie anschließend im Dialog Streuungsplot auf die Schaltfläche OK, um die Grafiken zu erstellen. 50 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Man beachte, wie die Streuungsplots erstellt wurden: 1) für Alle Gruppen und 2) für die einzelnen Sorten (Bonny und Marglobe). Wenn man diese Grafiken näher betrachtet, stellt man fest, dass für Sorte=Bonny die Variable Methode anscheinend kaum einen Unterschied ausmacht (bzgl. der beobachteten Werte für Gewicht), wohingegen bei Sorte=Marglobe die Methode Ballaststoffe+NO3 die geringste Streuung in den Werten aufzeigt, wobei hier bezogen auf die Gesamtverteilung generell recht hohe Werte für die Variable Gewicht vorliegen. Als Nächstes werden die Optionen der Deskriptiven Statistik verwendet, um diesen Sachverhalt näher zu untersuchen. Um zum Startmenü Elementare Statistik und Tabellen zu gelangen, wählen Sie Elementare Statistik im Statistik-Menü. Wählen Sie Gliederung/einfaktorielle ANOVA, und klicken Sie die Schaltfläche OK, um den Dialog Gliederung/einfaktorielle ANOVA aufzurufen. Klicken Sie die Schaltfläche Variablen, und legen Sie dann im Dialog Gruppierungsvariablen und abhängige Variablen die Variable Gewicht als die abhängige Variable und Methode als Gruppierungsvariable fest. Klicken Sie anschließend OK, um den Dialog zur Variablenauswahl zu schließen. Wird dann im Dialog Gliederung/einfaktorielle ANOVA die Schaltfläche OK geklickt, so wird der Dialog Statistik nach Gruppen Ergebnisse aufgerufen. Die Statistik nach Gruppen soll weiter nach Tomatensorten untergliedert werden. Klicken Sie hierzu die Schaltfläche Gruppen und im dadurch aufgerufenen Dialog STATISTICA-Handbuch – 51 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Gruppen die Schaltfläche Gruppierungsvariable(n). Wählen Sie im Nach Variable die Variable Sorte als die Gruppierungsvariable. Dialog Auswahl Klicken Sie nun in diesem Dialog sowie im Dialog Gruppen jeweils auf OK. Klicken Sie im Dialog Statistik nach Gruppen - Ergebnisse nacheinander auf 1) die Schaltfläche Zusammenfassung, 2) die Schaltfläche Varianzanalyse und 3) die Schaltfläche Interaktionsplots. 52 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE Alle Ergebnisse werden in dem entsprechenden Ordner platziert, entweder im Ordner Alle Gruppen oder in den Ordnern Sorte=Bonny bzw. Sorte=Marglobe. Es ist nun also möglich, die Ergebnisse kombiniert für alle Gruppen sowie gegliedert nach Variable Sorte zu begutachten. Dabei ist ersichtlich, dass für Sorte=Marglobe die Variable Methode tatsächlich einen Effekt auf den Ertrag (Gewicht) hat, wohingegen es kein Anzeichen für einen derartigen Effekt bei Sorte=Bonny gibt. Mit STATISTICA kann man von fast jedem Ergebnisdialog aus ad hoc Gruppenanalysen durchführen, wobei die Ergebnisse kombiniert für alle Gruppen oder gegliedert nach einer oder mehreren Gruppierungsvariablen betrachtet werden können. Dieses sehr mächtige Feature für die explorative Datenanalyse kann dazu verwendet werden, Gruppen zu vergleichen und für jede Analyse die Konsistenz der Ergebnisse über alle Gruppen hinweg zu überprüfen. Bevor dieses Thema abgeschlossen wird, erscheinen einige Kommentare über die technischen Details der Implementierung dieses Features hilfreich. Wenn eine Analyse nach Gruppen durchgeführt wird, wie es in diesem Beispiel illustriert wurde, wiederholt das Programm tatsächlich alle Berechnungen der Analyse separat für jede einzelne Gruppe (und alle Gruppen kombiniert). Hierbei wird der STATISTICA Visual Basic-Makrocode verwendet, der automatisch während der interaktiven Analysen aufgezeichnet wird und der auch als Makro abgespeichert werden kann (siehe hierzu auch Kapitel 9 – STATISTICA Visual Basic). Bei der Analyse sehr umfangreicher Daten (z. B. sehr große unbalancierte Versuchspläne oder komplexe Analysen, die vor der Ergebnisausgabe iterative Berechnungen erfordern) können die einzelnen Analysen eine erhebliche Rechenzeit beanspruchen, speziell dann, wenn den Daten viele Gruppen zugrunde liegen (man stelle sich z. B. ein komplexes Allgemeines Lineares Modell vor, das für Hunderte von Gruppen geschätzt werden muss). Demnach ist es im Allgemeinen ratsam, eine explorative Analyse zunächst mit dem Erstellen einfacher deskriptiver Statistiken, Häufigkeitstabellen und Grafiken zu beginnen, um die Struktur der Daten zu verstehen, so dass man einen Überblick über die Anzahl der einzelnen Gruppen (die auch durch Wertekombinationen in den Gruppierungsvariablen erzeugt werden) in den Daten erhält. STATISTICA-Handbuch – 53 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE 54 – STATISTICA-Handbuch Copyright © StatSoft, 2009 STATISTICA-Handbuch – 55 Copyright © StatSoft, 2009 KAPITEL 2: EINFÜHRENDE BEISPIELE 56 – STATISTICA-Handbuch Copyright © StatSoft, 2009 Zusätzlich zu den herkömmlichen STATISTICA-Tabellen können bei der Durchführung einer Analyse auch Excel-Dateien direkt in STATISTICA geöffnet werden und als Datenquelle dienen. Um den Dialog STATISTICA-Daten öffnen aufzurufen, wählen Sie Beispieldatei öffnen im STATISTICA Datei-Menü. Wählen Sie Excel-Arbeitsmappe (*.xls) in der Liste unter Dateityp, die sich am unteren Rand des Dialogs befindet. Führen Sie auf dem Datasets-Ordner einen Doppelklick aus, und wählen Sie dann die Datei Weather report.xls. Klicken Sie die Schaltfläche Öffnen, so dass der Dialog Öffne Datei aufgerufen wird. Klicken Sie die Schaltfläche Als Excel-Arbeitsmappe öffnen, womit die Excel-Datei aufgerufen wird. Beim Öffnen der Excel-Arbeitsmappe werden in STATISTICA die Excel- und STATISTICA-Menüs zusammengefügt, womit man den Zugriff auf die wichtigsten Funktionen beider Anwendungen erhält. STATISTICA-Handbuch – 57 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Wählen Sie im Statistik-Menü die Option Elementare Statistik. Hierdurch wird der Dialog Excel-Datei aufgerufen. Bei einer geöffneten Excel-Arbeitsmappe im STATISTICA-Fenster wird dieser Dialog immer dann aufgerufen, sobald eine Option aus den Statistik-, Data-Miningoder Grafik-Menüs gewählt wird. Die von STATISTICA für diese Arbeitsmappe automatisch vorgenommenen Einstellungen können bei Bedarf geändert werden. Wenn in einer Excel-Arbeitsmappe keine Variablennamen enthalten sind, weist STATISTICA den Variablen die Namen Var1, Var2, Var3 usw. zu. Wie bei einer STATISTICA-Tabelle werden für die ausgewählte Analyse alle Werte in einer Spalte verwendet, sofern keine Fallauswahlbedingungen festgelegt wurden. Klicken Sie 58 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE für dieses Beispiel im Dialog Excel-Datei auf die Schaltfläche OK, um die Standardeinstellungen zu übernehmen und den Dialog zu schließen. Hierdurch wird der anschließende Dialog Ansicht/Bearbeiten Spaltentyp aufgerufen. STATISTICA ermöglicht es, für die einzelnen Spalten die Datentypen zu definieren. Die Datentypen umfassen Numerisch, Text, Numerisch mit Textlabels und Missing Data. Leere Zellen einer Excel-Arbeitsmappe werden stets als Missing Data (fehlende Werte) betrachtet, und falls eine numerische Spalte Textwerte enthält, werden auch diese Werte als Missing Data angesehen. STATISTICA bietet bezüglich der Datentypen eine Vorauswahl an, die jeweils auf den ersten Zeilen der Daten basiert (der Dialog Ansicht/Bearbeiten Spaltentyp kann auch übersprungen werden, wenn im Dialog Excel-Datei das Kontrollkästchen Ansicht/Bearbeiten der Spaltentypen vor Import deaktiviert wird). Bei Bedarf kann diese Vorauswahl der Datentypen verändert werden, indem auf dem Namen der zu ändernden Spalte ein Doppelklick ausgeführt wird (alternativ mit einfachem Klick auf entsprechender Spalte und Schaltfläche Bearbeiten), so dass der Dialog Spaltentyp für Import ändern aufgerufen wird, in dem der bevorzugte Datentyp festgelegt werden kann. Für dieses Beispiel wird die Vorauswahl übernommen, so dass der Dialog Spaltentyp für Import ändern mittels der Schaltfläche Abbrechen geschlossen wird. Wird anschließend im Dialog Ansicht/Bearbeiten Spaltentyp auf die Schaltfläche OK geklickt, erscheint das Startmenü der ausgewählten Analyse oder Grafik (in STATISTICA-Handbuch – 59 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE diesem Beispiel das Elementare Statistik und Tabellen-Startmenü), und man kann mit der Analyse wie gewohnt fortfahren. STATISTICA bietet mittels STATISTICA Query Zugriff auf nahezu alle Datenbanken (einschließlich der großen Systemdatenbanken wie Oracle, Sybase usw.). Auf das Modul STATISTICA Query kann über die Untermenüs Datei Externe Daten oder Daten - Externe Daten zugegriffen werden. STATISTICA Query importiert Daten aus einer Datenbank direkt in eine STATISTICA-Tabelle, so dass die Daten in diesem Format gespeichert werden können. STATISTICA Query ermöglicht den einfachen Datenzugriff mittels Microsofts OLE-DB-Konventionen (OLE DB – Object Linking and Embedding Database). OLE DB ist eine mächtige Datenbank-Technologie, die universelle Datenintegration in einem Unternehmensnetzwerk – von einem Server auf den Desktop – unabhängig vom Datentyp ermöglicht. STATISTICA Query unterstützt mehrere Datenbank-Tabellen. Durch Eingabe von SQL-Anweisungen, die STATISTICA Query automatisch erstellt, wenn Sie die Komponenten der Abfrage über eine einfache grafische Benutzeroberfläche und/oder intuitive Menüoptionen und Dialoge auswählen, können bestimmte Einträge (Datensätze, Zeilen von Tabellen) ausgewählt werden. Es sind daher keine besonderen SQL-Kenntnisse notwendig, um fortgeschrittene und umfassende Datenabfragen zu erstellen. Es können mehrere Abfragen, die auf einer oder vieler verschiedener Datenbank(en) basieren, erzeugt werden, die Daten an eine einzelne Tabelle zurückgeben. Darüber hinaus können Verbindungen zu mehreren externen Datenbanken gleichzeitig beibehalten werden. Erstellen Sie für dieses Beispiel eine neue Datenbankabfrage, indem Sie im Untermenü Datei - Externe Daten die Option Neue Abfrage erstellen wählen. Hierdurch werden das Modul STATISTICA Query und der Dialog Datenbankverknüpfung aufgerufen. 60 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE In diesem Dialog können Sie eine bereits bestehende Datenbankverknüpfung wählen oder eine neue Verknüpfung definieren. Für dieses Beispiel soll eine neue Datenbankverknüpfung erstellt werden, so dass in diesem Dialog die Schaltfläche Neu zu wählen ist, womit der Dialog Datenverknüpfungseigenschaften aufgerufen wird. Sie können entweder den OLE-DB-Provider wählen, der Ihnen vom Datenbankanbieter zur Verfügung gestellt wurde, oder einen der standardmäßigen OLE-DB-Provider von Microsoft, der mit Ihrem Datenbanksystem kompatibel ist. In diesem Beispiel wird eine Jet-Datenbank-Datei verwendet, die mit STATISTICA installiert wurde, so dass die Option Microsoft Jet 3.51 OLE DB Provider zu wählen ist. Um fortzufahren, klicken Sie die Schaltfläche Weiter >>, womit im Dialog Datenverknüpfungseigenschaften das Register Verbindung aufgerufen wird. STATISTICA-Handbuch – 61 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Klicken Sie die Schaltfläche , die sich neben dem Eingabefeld Geben Sie den Datenbanknamen ein, oder wählen Sie einen aus befindet, so dass der Dialog Access-Datenbank auswählen aufgerufen wird. Rufen Sie den Ordner STATISTICA Examples auf, öffnen Sie dort den Ordner Database, und doppelklicken Sie dort auf die Datei ProcessData.mdb. Hierdurch wird der Pfad- und Dateiname in dem Eingabefeld Geben Sie den Datenbanknamen ein, oder wählen Sie einen aus angezeigt. Klicken Sie im Dialog Datenverknüpfungseigenschaften auf OK, um den Dialog Datenbankverknüpfung hinzufügen aufzurufen. Geben Sie in dem Eingabefeld Name den Begriff Prozessdaten ein, und klicken Sie OK. Erneut wird der Dialog Datenbankverknüpfung aufgerufen, der die neu definierte Verknüpfung Prozessdaten aufführt. Wählen Sie diese Verknüpfung, und klicken Sie OK. Das STATISTICA Query-Fenster erscheint nun im Vordergrund, das im Fenster auf der linken Seite alle Datenbank-Tabellen in einer Baumansicht anzeigt: 62 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Führen Sie auf der RAWMAT-Tabelle einen Rechtsklick aus, und wählen Sie im Kontextmenü den Befehl Hinzufügen, so dass die Tabelle im Grafik-Teilfenster (auf der rechten oberen Seite des STATISTICA Query-Fensters) dargestellt wird. Fügen Sie anschließend auf gleicher Weise die Tabelle PERSONNEL in das GrafikTeilfenster hinzu. STATISTICA-Handbuch – 63 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Um die Felder auszuwählen, die die Abfrage umfassen soll, führen Sie im GrafikFenster auf der Tabelle PERSONNEL einen Rechtsklick aus, und wählen in dem aufgerufenen Kontextmenü den Befehl Alle Felder auswählen aus. Wiederholen Sie anschließend den Vorgang für die Tabelle RAWMAT. Beachten Sie, dass beide Tabellen ein Feld ID beinhalten, durch das die Tabellen verknüpft werden können. Um die Tabellen zu verknüpfen, wählen Sie ID in der Tabelle RAWMAT, und ziehen dieses Feld bei gedrückter Maustaste auf das Feld ID der Tabelle PERSONNEL. Wählen Sie nun in dem Fenster auf der unteren rechten Seite, das Register Vorschau Daten, um eine Vorschau der Abfrage zu erhalten: Wählen Sie das Register SQL-Ausdruck, so dass der SQL-Ausdruck dargestellt wird, der durch die Abfrage erzeugt wird. Um die Daten an eine STATISTICA-Tabelle zurückzugeben, muss der grüne Pfeil geklickt werden, der sich in der Symbolleiste von STATISTICA Query befindet. Der Dialog Externe Daten an eine Tabelle übergeben wird aufgerufen, in dem festgelegt werden kann, ob die Abfrage in die aktuelle oder in einer neuen Tabelle platziert werden soll. Darüber hinaus können weitere Abfrageparameter angepasst werden. Wählen Sie die Option Neue Tabelle, und klicken Sie die Schaltfläche Start, um die Abfrage auszuführen. Nach einer kurzen Bearbeitungszeit werden die Daten an die STATISTICA-Tabelle übergeben. 64 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Die Daten können nun mit jedem beliebigen STATISTICA-Tool analysiert werden. Beachten Sie, dass die Tabelle die Datenbankverbindung beibehält, d. h., dass die Abfrage zu jedem beliebigen Zeitpunkt erneut ausgeführt werden kann, indem aus dem Untermenü Datei - Externe Daten der Befehl Daten aktualisieren gewählt wird bzw. die Taste F5 gedrückt wird, während die Tabelle geöffnet ist. Bei der Bearbeitung einer Datenanalyse oder eines Data-Mining-Projektes wird in der Praxis die meiste Zeit auf die Aufbereitung der Daten aufgewendet. In einigen Fällen kann bis zu 90 % der Zeit, die zur Vervollständigung eines Projektes erforderlich ist, der ordentlichen Bereinigung und Aufbereitung der Daten zugerechnet werden. STATISTICA-Handbuch – 65 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Beim Erstellen von Vorhersagemodellen mittels Data-Mining-Tools oder selbst beim Berechnen einfacher deskriptiver Statistiken (Mittelwerte, Häufigkeitsverteilungen) können die Ergebnisse der Analysen zu groben Fehlschlüssen führen, wenn die Daten beispielsweise eine große Anzahl von Dubletten (beispielsweise wenn gleiche Teilnummern mehrmals erfasst wurden), Ausreißern, fehlerhaft kodierte Werte (außerhalb des gültigen Datenbereichs) oder Missing Data (fehlende Werte) beinhalten. In dem Untermenü Daten - Daten filtern/umkodieren bietet STATISTICA verschiedene Optionen, um diese Probleme der Datenqualität schnell und effektiv zu beheben, so dass eine aussagekräftige und stichhaltige Datenanalyse (oder DataMining-Projekt) mit erheblicher Zeitersparnis abgeschlossen werden kann. Diese Option bietet sich dann an, wenn man vermutet, dass die Datendatei Dubletten enthält (z. B. doppelte/identische Kundenaufzeichnungen). Angenommen, man möchte bei einer Analyse der Kundendaten, das typische Kundenverhalten („Profile“) analysieren, wobei jeder einzelne Kunde nur einmal berücksichtigt werden soll. Einige Kunden sind jedoch umgezogen und unbeabsichtigt mehrfach in der Datenbank aufgeführt. Um die Datendatei für die Analyse zu erstellen, bietet es sich in diesem Fall an, die Option Dubletten filtern zu verwenden, so dass anschließend jede einzelne Transaktion eindeutig einem Kunden zugeordnet werden kann. Öffnen Sie die Datendatei Duplicates.sta. Wählen Sie aus dem Untermenü Daten - Daten filtern/umkodieren die Option Dubletten filtern, um den Dialog Dubletten filtern aufzurufen. Klicken Sie im Rahmen Eingabe die Schaltfläche Variablen, und wählen Sie im Dialog zur Variablenauswahl die Variable Befragte, so dass alle Befragten auf Dubletten hin überprüft werden. 66 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Klicken Sie im Dialog zur Variablenauswahl auf OK, um zum Dialog Dubletten filtern zurückzukehren. Klicken Sie im Rahmen Eingabe auf die Schaltfläche Fälle, um den Dialog Fallauswahlbedingungen für Tabelle aufzurufen, der Optionen enthält, nur bestimmte Beobachtungen oder Fälle auf Dubletten zu überprüfen. Schließen Sie den Dialog Fallauswahlbedingungen für Tabelle mittels der Schaltfläche Abbrechen, da in diesem Beispiel alle Fälle überprüft werden sollen. In der Standardeinstellung ist das Kontrollkästchen Fallnamen verwenden deaktiviert, und für dieses Beispiel wird auch diese Einstellung beibehalten. Wenn das Kontrollkästchen aktiviert wird, werden die Fallnamen als eines der Unterscheidungskriterien verwendet, d. h., STATISTICA behandelt nur solche Fälle als Dubletten, die gleiche Fallnamen haben (vorausgesetzt, der Variableninhalt der Fälle stimmt auch mit denen der anderen spezifizierten Variablen überein). Wenn das Kontrollkästchen deaktiviert ist, werden Fallnamen ignoriert. Lassen Sie auch das Kontrollkästchen Sortierte Daten deaktiviert (da diese Datendatei bisher nicht sortiert wurde – wenn eine extrem große Datendatei vorliegt, ist es effizienter, die Daten zunächst zu sortieren). Überprüfen Sie im Rahmen Ausgabe, dass alle Variablen ausgewählt sind (der Begriff ALLE erscheint in diesem Fall neben der Schaltfläche Variablen). Diese Option wird dazu verwendet, die Variablen der Eingabetabelle auszuwählen, die in der gefilterten Ausgabetabelle enthalten sein sollen. Die Standardeinstellung ist ALLE. Überprüfen Sie, ob das Kontrollkästchen Neue Tabelle erzeugen ausgewählt ist (Standardeinstellung), und aktivieren Sie das Kontrollkästchen Tabelle der Dubletten erzeugen. Belassen Sie die anderen beiden Optionen bei der Voreinstellung: Das Kontrollkästchen Reihenfolge beibehalten ist deaktiviert (die STATISTICA-Handbuch – 67 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE neue Tabelle wird anhand der Variable(n) sortiert, die als Unterscheidungskriterium gewählt wurden; in diesem Beispiel die Variable Befragte) und das Kontrollkästchen Formate übernehmen ist aktiviert. Klicken Sie die Schaltfläche OK. Zwei neue Tabellen werden erzeugt. Eine der Tabellen besteht aus 10V * 51F (10 Variablen mit 51 Fällen) und enthält die Befragten der Originaltabelle, wobei die Dubletten ausgeschlossen wurden. Die andere Tabelle besteht aus 10V * 9F und enthält die Dubletten, die aus der Originaltabelle entfernt wurden. Wenn Sie die Originaltabelle Duplicates.sta betrachten, bemerken Sie, dass einige der Variablenüberschriften – Befragte, Staat und Farben – unübliche Formate enthalten. Wenn Sie die beiden neu erstellten Tabellen betrachten, fällt auf, dass die Variablenüberschriften für Befragte, Staat und Farben in allen drei Tabellen dieselben Formate haben. STATISTICA verwendet eine Untergliederung, um die neuen Tabellen zu erstellen, wobei sichergestellt wird, dass die Variableneigenschaften der vorherigen Tabelle beibehalten werden. Schließen Sie nun die beiden neuen Tabellen, lassen aber die Tabelle Duplicates.sta geöffnet (beachten Sie, dass die Tabelle 10V * 60F enthält). Um den Dialog Dubletten filtern ein weiteres Mal aufzurufen, wählen Sie im Untermenü Daten Daten filtern/umkodieren erneut die Option Dubletten filtern. Klicken Sie im Rahmen Eingabe die Schaltfläche Variablen, und wählen Sie im aufgerufenen Dialog zur Variablenauswahl die Variable Befragte und klicken OK. Lassen Sie im Rahmen Eingabe das Kontrollkästchen Sortierte Daten deaktiviert. Deaktivieren Sie darüber hinaus das Kontrollkästchen Neue Tabelle erzeugen, das sich im Rahmen Ausgabe befindet, und bestätigen Sie mit OK. Der Dialog schließt, aber statt des Erstellens einer neuen Tabelle wird nun direkt die Tabelle Duplicates.sta modifiziert. Alle Dubletten wurden aus der Tabelle entfernt, die nun 10V * 51F beinhaltet. Es ist zu beachten, dass die Funktion Dubletten filtern bei dem Vergleich auf Eindeutigkeit nicht zwischen Groß- und Kleinschreibung unterscheidet, d. h., wenn zwei Befragte vorliegen – C. Barrett und C. BARRETT – wird letzterer ausgeschlossen. Es ist nicht unüblich, dass einige Variablen (Parameter oder Datenfelder), die (beispielsweise) für Vorhersagemodelle verwendet werden, nur sehr wenige gültige 68 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Daten enthalten. Man nehme zum Beispiel an, dass in einer Kundendatenbank, die Variable Einkommen aufgezeichnet wird, wobei diese Daten direkt von den Kunden angegeben werden. Üblicherweise werden nur sehr wenige Kunden bereit sein, ihr derzeitiges Einkommen anzugeben, so dass die meisten dieser Daten (in diesem Feld der Datenbank) fehlen. Bei Produktionsdaten kann ein Datenfeld aufgeführt sein, das dazu dient, einen bestimmten Parameter aufzuzeichnen, wobei der zugehörige Sensor jedoch für einen längeren Zeitraum fehlerhaft arbeitet, so dass dies zu größtenteils fehlenden (ungültigen) Daten führt. Das Aufnehmen einer solch „unvollständigen“ Variablen in einer Analyse mag zu fehlerhaften Ergebnissen führen. Darüber hinaus können solche Variablen hinderlich sein, überhaupt ein Vorhersagemodell zu erstellen (abhängig davon, wie Missing Data in der späteren Analyse behandelt werden). Demnach erscheint es zweckdienlich, solche unvollständigen Variablen mithilfe der Option Unvollständige Daten filtern (aufrufbar über Untermenü Daten - Daten filtern/umkodieren) rechtzeitig zu erkennen, um sie von den nachfolgenden Betrachtungen auszuschließen. Ein ähnlicher Fall (verglichen mit unvollständigen Daten), der speziell bei Prozessdaten der verarbeitenden Industrie häufig die Datenqualität beeinträchtigt, STATISTICA-Handbuch – 69 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE liegt dann vor, wenn einige der aufgezeichneten Variablen (Parameter), die in die Analysen aufgenommen werden sollen, invariant sind, d. h., dass nahezu alle Werte identisch sind. Solche Variablen sind für die Modellbildung nicht nützlich, und die Optionen unter Invariante Variablen filtern (aufrufbar im Untermenü Daten - Daten filtern/umkodieren) ermöglichen, diese Variablen automatisch zu erkennen, so dass sie von den weiteren Analysen ausgeschlossen werden können. Extreme Datenwerte oder Ausreißer können verschiedenste Analysen stark beeinflussen und führen beim Data Mining zu Vorhersagemodellen geringer Qualität. Es gibt keine formale Definition, die einen „Ausreißer“ oder „extremen Wert“ festlegt, so dass STATISTICAs Grafikwerkzeuge den bevorzugten Ansatz darstellen, solche unüblichen Beobachtungen zu identifizieren (z. B. könnten für die wichtigsten Variablen Box-Plots erstellt werden, um extreme Beobachtungen zu identifizieren, die dann mittels der Brushing-Funktion näher untersucht werden und in den Daten gekennzeichnet werden). 70 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Für das automatische Erkennen und Entfernen von Ausreißern in Variablenlisten stellen die Optionen unter Ausreißer umkodieren (aufrufbar aus dem Untermenü Daten - Daten filtern/umkodieren) verschiedene Tests für Ausreißer (und Ansätze zum Erkennen von extremen Werten) zur Verfügung. Ausreißer können zu Missing Data aber auch auf gültige Datenwerte (z. B. auf das entsprechende Perzentil) umkodiert werden. Mit Missing Data oder ungültigen Datenwerten sollte man so umgehen, dass es mit den Zielen der Analyse vereinbar ist. In einigen Fällen stellen fehlende oder ungültige Werte an sich eine nützliche Information dar, die den Prozess oder zu untersuchende Variable näher charakterisieren. Zum Beispiel kommt es in der Marktforschung üblicherweise vor, dass die Befragten es verweigern, detaillierte persönliche Informationen bezüglich ihrer Gesundheit, finanzieller Angelegenheiten (z. B. Ersparnisse) usw. anzugeben, so dass die verweigerte Antwort an sich mit anderen signifikanten Variablen korreliert sein kann. (Z. B. kann das Verweigern der Antwort bezüglich des Einkommens an sich ein guter Indikator eines hohen Einkommens sein, wenn in der Umfrage die wohlhabenderen Befragten dazu tendierten, diese Fragen nicht zu beantworten.) STATISTICA-Handbuch – 71 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Die Optionen unter Missing Data bearbeiten (aufrufbar aus dem Untermenü Daten Daten filtern/umkodieren) ermöglichen das flexible Umkodieren von Missing Data, die Definition mehrerer Missing-Data-Werte bzw. -Codes für einzelne Variablen (diese Werte können dann zu einem einheitlichen Missing-Data-Code der Variablen umkodiert werden) oder die Kennzeichnung von Variablen, die einen bestimmten Prozentsatz an Missing Data überschreiten. Es ist häufig unklar, wie ein fehlender Wert am besten umkodiert werden soll. Tatsächlich kann es manchmal auftreten, dass durch das Umkodieren von Missing Data einer Variablen auf einen bestimmten Wert (z. B. der Mittelwert) in den abschließenden Ergebnissen Verzerrungen auftreten. Man betrachte beispielsweise wiederum einen Fragebogen, in dem tendenziell die Befragten mit höherem Einkommen es verweigern, ihr Einkommen anzugeben. In diesem Fall kann das Zuordnen des mittleren Einkommens zu diesen Befragten (d. h., dass das Missing Data für Variable Einkommen auf das mittlere Einkommen der gesamten Stichprobe umkodiert wird) zu sehr irreführenden Ergebnissen führen. STATISTICA beinhaltet eine sehr effiziente Methode (auch auf sehr große Datensätze und Datenbanken anwendbar) für das Ersetzen von Missing Data mit gültigen Datenwerten, die konsistent mit den anderen Beobachtungen der 72 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Stichprobe sind. Details zum k-nearest neighbor-Algorithmus befinden sich in der Elektronischen Hilfe für das Modul Machine Learning des STATISTICA Data Miner. Es lässt sich zusammenfassend sagen, dass das Verwenden der Optionen unter MD ersetzen (KNN) (aufrufbar unter Daten - Daten filtern/umkodieren) dazu führt, dass der k-nearest neighbor-Algorithmus in einem ersten Durchlauf der Daten eine (kleinere) Stichprobe aller verfügbaren Daten wählt. Im zweiten Durchlauf der Datendatei werden beim Auftreten von Missing Data dort gültige (beobachtete) Werte eingesetzt, die in der kleineren Stichprobe bei ähnlichen Beobachtungen (mit Bezug auf alle anderen Variablen, die gewählt wurden) gefunden wurden. Bezogen auf das obige Beispiel folgt hieraus: Wenn tatsächlich die Befragten höheren Einkommens ihr Einkommen mit einer geringeren Wahrscheinlichkeit angeben, aber bezüglich anderer Indikatoren hohen Einkommens Angaben liefern (z. B. der Besitz eines Luxuswagens, größere Wohnfläche usw.), dann wird der k-nearest neighborAlgorithmus diese Befragten (die ihr Einkommen nicht angegeben haben) richtigerweise der hohen Einkommensschicht zuordnen. Der k-nearest neighbor-Algorithmus ist schnell und effizient und bietet eine effektive Methode zum Ersetzen von Missing Data in der Eingabedatei mit „vernünftigen Vermutungen“, die auf ähnlichen Datenpunkten in der Stichprobe basieren. Dieser Ansatz macht keine bestimmten Annahmen über den Zusammenhang zwischen den Variablen (d. h., dass für die einzelnen Variablen kein Modell geschätzt werden muss, um die Missing-Data-Werte zu ersetzen), sondern verwendet einfach die beobachteten Daten als das „Modell“. STATISTICA-Handbuch – 73 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Für STATISTICA-Tabellen können neue Variablen in Abhängigkeit anderer Variablen definiert werden, was gelegentlich auch als Variablentransformation bezeichnet wird. Mittels sogenannter Tabellenformeln kann die Prüfung, Transformation und Umkodierung der Daten einer einzelnen Variablen realisiert werden (ein Satz aufeinanderfolgender Transformationsformeln wird hingegen als Batch-Formel bezeichnet). Um auf die Tabellenformeln zuzugreifen, doppelklicken Sie auf den Variablenkopf in einer STATISTICA-Tabelle, so dass der Dialog der Variablenspezifikation aufgerufen wird. Die Formel wird in dem Feld Langer Name (Label oder Formel mit Funktionen) (auch Formel-Editor genannt) eingegeben, das sich am unteren Rand des Dialogs befindet. Beginnt die Eingabe in dem Formel-Editor mit einem Gleichheitszeichen, interpretiert STATISTICA dies als eine Formel, und überprüft den Inhalt auf formale Korrektheit. Innerhalb der Formel kann auf andere Variablen entweder mittels des Namens (z. B. MESSUNG01 oder ZEIT) oder mittels der Variablennummer verwiesen werden. Im letzteren Fall wird hierbei der Ausdruck Vx verwendet, wobei x die Variablennummer darstellt. Zum Beispiel verweist V3 auf die Variablennummer 3. V0 hat eine besondere Bedeutung und verweist auf die aktuelle Fallnummer. Tabellenformeln werden fallweise (zeilenweise) ausgewertet. Die Formel wird für jeden einzelnen Fall in der Tabelle ausgewertet, wobei die Verweise auf andere Variablen dann mit dem entsprechenden Variablenwert des aktuellen Falls ersetzt werden. In STATISTICA ermöglichen Tabellenfunktionen mit Random Access, dass auf Variablenwerte von anderen Fällen zugegriffen werden kann. Ein Standardbeispiel hierfür ist die Lag-Funktion, die bezüglich einer Variablen Lags einfügt, d. h. eine bestimmte Anzahl von Fällen vor- oder zurückspringt. Die folgende Tabelle führt einige Tabellenformeln und ihre Ergebnisse auf. 74 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Formel =mean(v1:v3) =(v0<=10)*1+(v0>10)*2 =((v1=1) AND (v2=5))*5 =student(v4;15) =iif(V0<= 1; V3; V3+LAG(VCUR; 1)) =contains(v1, "B12C") Ergebnis Berechnet jeweils den Mittelwert der ersten drei Variablen. Kodiert Fälle 1-10 auf den Wert 1 um. Die anderen Fälle werden auf den Wert 2 gesetzt. Ergibt den Wert von 5 wenn v1=1 und v2=5, andernfalls den Wert 0. Diese Formel berechnet Werte der Wahrscheinlichkeitsdichte der Studentschen t-Verteilung, basierend auf den Werten von v4 mit 15 Freiheitsgraden. Bildet die kumulative Summe von Variable 3. Liefert 1 (bzw. Zeichenposition), wenn der Text „B12C“ in Variable 1 gefunden wird. Ergibt 0, wenn kein Treffer gefunden wird. Beachten Sie, dass im Dialog zur Variablenspezifikation die Schaltfläche geklickt werden kann, so dass der Dialog Funktions-Browser aufgerufen wird, der alle verfügbaren Funktionen und Operatoren (=, +, >, and, or…) aufführt. Öffnen Sie die Datendatei Adstudy.sta. Es soll eine neue Variable erstellt werden, die den Mittelwert der Variablen 3 bis 25 darstellt (d. h., MESSUNG01 bis MESSUNG23). Doppelklicken Sie hierzu auf den ersten leeren Variablenkopf (direkt nach Variable 25). Der Dialog Fälle und/oder Variablen einfügen wird aufgerufen. Klicken Sie die Schalfläche OK, um die Standardeinstellung zu bestätigen und eine Variable hinzufügen. Hierdurch wird der Dialog zur Variablenspezifikation aufgerufen. Wählen Sie im Rahmen Anzeigeformat die Option Zahl. Geben Sie in dem Eingabefeld Langer Name folgende Formel ein: STATISTICA-Handbuch – 75 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE =mean(v3:v25) Klicken Sie die Schaltfläche OK. Ein Dialog wird aufgerufen, der darüber informiert, ob die Syntax der Formel korrekt ist. Klicken Sie die Schaltfläche Ja, um fortzufahren. Die neue Variable wird nun für jeden einzelnen Fall mit dem über die Variablen 3 bis 25 gebildeten Mittelwert gefüllt. Da man auf die Variablen mit ihren Namen oder Nummern verweisen kann, kann die eben erstellte Formel auch wie folgt ausgedrückt werden: =mean(MESSUNG01:MESSUNG23) Tabellenformeln sind nützlich, wenn die Formeln jeweils für eine einzelne Variable definiert werden sollen. Es gibt jedoch viele Situationen, bei denen das gleichzeitige Auswerten von mehreren Formeln für verschiedene Variablen erforderlich ist. Innerhalb von STATISTICA kann dies mit Batch-Formeln realisiert werden. Öffnen Sie die Datendatei Characteristics.sta. Diese Datendatei enthält Informationen über die Patienten in einer Studie. In diesem Beispiel wird 1.) der Body-Mass-Index (BMI) der Patienten berechnet und 2.) die Körpergröße zu Zentimeter (cm) konvertiert, und anschließend werden diese beiden Variablen dem Datensatz hinzugefügt. 76 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Wählen Sie im Menü Daten die Option Formeln für Batch mit Transformationen, um den Dialog Batch Formeltransformationen aufzurufen. Bezüglich der Syntax von Batch-Formeltransformationen und Tabellenformeln liegen die Unterschiede darin, dass in der Batch-Option auch mehrere Formeln unterstützt werden und dass die Batch-Formeln nicht einer bestimmten Variablen angehängt werden (sie können ohne weiteres von einer zur nächsten Datendatei kopiert werden). Zudem beginnen die Ausdrücke nicht mit einem Gleichheitszeichen, sondern mit der Zielvariablen (z. B. v1=... oder Messung03=...), so dass STATISTICA erkennt, auf welche Variablen die einzelnen Formeln angewendet werden sollen. Darüber hinaus gibt es die Option, die Batch-Formeln den entsprechenden Variablen in der Tabelle zuzuweisen und mit der Datendatei abzuspeichern, womit gegebenenfalls vorhandene Tabellenformeln ersetzt werden. Es folgen die Berechnungen für den BMI und die Umrechnung der Variable Größe (in) von Zoll (Inch) in Zentimeter. Die notwendigen Formeln, die in dem Dialog Batch Formeltransformation eingegeben werden, lauten: Berechnung Eingabe unter Batch-Transformation BMI Gewicht (lb ) * 703 Größe(in ) 2 Größe(cm) Größe(in) * 2,54 BMI = ('Gewicht (lb)' / 'Größe (in)' **2)*703 'Größe (cm)' = 'Größe (in)' *2,54 Geben Sie im Feld Formeln die Liste der Formeln für die Transformationen an, die auf die aktive Datentabelle angewendet werden sollen. Trennen Sie die einzelnen Formeln mittels der Eingabetaste. STATISTICA-Handbuch – 77 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Klicken Sie im Dialog Batch Formeltransformationen die Schaltfläche OK. Hierdurch wird der Dialog Neue Variablen hinzufügen? aufgerufen. Klicken Sie die Schaltfläche Ja, um die beiden neuen Variablen der Datendatei Characteristics.sta hinzuzufügen. Ein Dialog wird aufgerufen, der darüber informiert, ob die Ausdrücke, die in dem Dialog Batch Formeltransformationen eingegeben wurden, bezüglich der Syntax korrekt sind. Ist dies der Fall, können Sie mit Schaltfläche Ja fortfahren. STATISTICA berechnet die Formeln und fügt der Tabelle zwei neue Spalten mit den zwei Variablen BMI und Größe (cm) hinzu. Die Optionen im Dialog Batch Formeltransformationen sind speziell für die Transformation großer Datensätze geeignet und optimiert. Die Formeln werden 78 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE hierbei eine nach der anderen, d. h. sequentiell, ausgewertet, so dass beliebige Ergebnisse von einer der aufgeführten Transformationen als Eingabe einer nachfolgenden Transformation dienen können. Es ist demnach möglich, mit einer Formel eine neue Variable zu erstellen, die direkt in einer nachfolgenden Formel verwendet werden kann. Klicken Sie in der oberen rechten Ecke des Dialogs Batch Formeltransformationen die Schaltfläche , um das entsprechende Thema in der STATISTICA Hilfe aufzurufen, das diese Optionen näher beschreibt. Darüber hinaus wird hier auf verschiedene andere Themen verwiesen, die Beispiele von Formeln und SyntaxRegeln enthalten. In STATISTICA wird eine Zusammenfassung von Grafiken und Berichten in ein einzelnes (Grafik-)Dokument von verschiedenen Analysen unterstützt. Dies ist besonders im Bereich Six Sigma und in der industriellen Fertigung ein beliebtes Instrument, um die Qualität einer einzelnen Variable mit sechs (oder weniger) Einzelgrafiken und -tabellen zusammenfassen. STATISTICA beinhaltet viele solcher Darstellungen (siehe diese und folgende Abbildung), um die grundlegenden deskriptiven Statistiken, Korrelationen, Ergebnisse von Studien zur Messmittel- oder Prozessfähigkeit oder andere Arten der Datenanalyse zusammenzufassen. STATISTICA-Handbuch – 79 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE In den letzten Jahren haben europäische (und andere internationale) Hersteller Standards für die Berechnung von Prozessfähigkeitsindizes entwickelt, die explizit der systematischen und zufälligen Prozessstreuung im Zeitablauf sowie NichtNormalverteilungen Rechnung tragen. Diese Indizes wurden unter anderem in der Automobilindustrie und von deren Zulieferern übernommen. STATISTICA unterstützt diese Standards vollständig. Prozessfähigkeitsindizes messen den Anteil der beobachteten (Normal-)Verteilung, der innerhalb der Spezifikationsgrenzen des betrachteten Teils liegt. Diese Indizes können demnach die Qualität eines Prozesses zusammenfassen, der zur Herstellung von Produkten oder Teilen dient, die konsistent mit Entwurfsspezifikationen sein müssen. Kurz gesagt beschreiben DIN (Deutsche Industrie Norm) 55319 und ISO (International Organization for Standardization) 21747 die anzuwendenden Regeln, wenn zwischen verschiedenen Verteilungsmodellen gewählt wird und wie man einer zeitabhängigen Streuung des Prozesses Rechnung trägt. Beispiel: Selbst dann, wenn die Verteilungen von Datenpunkten innerhalb der einzelnen Stichproben jeweils einer Normalverteilung folgen, verursacht eine 80 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE systematische oder zufällige Streuung, die bei der Entnahme der aufeinanderfolgenden Stichproben im Zeitablauf auftritt, dass die resultierende Verteilung der Werte nicht mehr einer Normalverteilung folgt. Es gibt demnach viele Fälle, in denen auf einer Normalverteilung basierende Berechnungen der Prozessfähigkeit nicht anwendbar sind. Darüber hinaus ist es von Interesse, jegliche zeitabhängige Streuung oder Trends zu erkennen, da sie auf Maschinenverschleiß oder andere Prozessprobleme hinweisen können. Das folgende Beispiel illustriert Schritt-für-Schritt, wie Prozessfähigkeitsindizes nach diesen internationalen Standards berechnet werden und wie eine effiziente Ergebnisübersicht in einem einzelnen Dokument erstellt werden kann. Der diesem Beispiel zugrundeliegende Datensatz ist in Montgomery (1985, Seite 177, 1991, Seite 234) aufgeführt. Es wird die Datendatei Pistons.sta verwendet, die sich im Ordner der Beispieldateien befindet. Hierbei ist speziell die Überwachung der Größe (Durchmesser) der Kolbenringe für Fahrzeugmotoren von Interesse. Daher wurden mehrere Stichproben mit jeweils fünf Beobachtungen dem fortlaufenden Herstellungsprozess entnommen. Wie es bei vielen laufenden Herstellungsprozessen der Fall ist, erfolgt die Stichprobenentnahme im Zeitablauf, so dass eine Streuung der Prozessqualität im Zeitablauf die Gesamtstreuung beeinflusst. Wählen Sie im Menü Datei den Befehl Beispieldatei öffnen (um direkt den Dateiordner mit den Beispieldateien zu öffnen), anschließend den Ordner Datasets, und doppelklicken Sie auf Pistons.sta (bzw. wählen Sie die Datei und klicken Sie die Schaltfläche Öffnen). Wählen Sie im Untermenü Statistik - Industrielle Statistiken & Six Sigma die Option Prozessanalyse. Wählen Sie anschließend im Dialog Verfahren der Prozessanalyse die Option Prozessfähigkeit ISO/DIN (Verteilungszeitmodelle). STATISTICA-Handbuch – 81 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Bestätigen Sie dann im Dialog Verfahren der Prozessanalyse die Auswahl mittels der Schaltfläche OK. Klicken Sie im Register Standard des Dialogs ISO 21747 Einstellungen Prozessfähigkeit die Schaltfläche Variablen. Wählen Sie im Dialog Variablen auswählen (Gruppierungsvariable optional) die Variable Größe als die Variable für die Analyse und Stichprobe als Zeit/Gruppierungsvar. und bestätigen Sie mit OK. Klicken Sie im Dialog ISO 21747 - Einstellungen Prozessfähigkeit die Schaltfläche Toleranzen, um den Dialog Toleranzen eingeben/ändern aufzurufen, wo die entsprechenden Grenzwerte festgelegt werden können. Die Grenzwerte definieren den maximal und (oder) minimal zulässigen Wert des entsprechenden Teils. Legen Sie in diesem Fall den unteren und oberen Grenzwert (UGW, OGW) mit 74 +/- 0,05 (UGW=73,95; OGW=74,05) fest. Geben Sie hierzu im Feld Sollwert den Wert 74 und im Feld Delta den Wert 0,05 ein. 82 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Klicken Sie OK, um die Eingaben zu bestätigen. In diesem Dialog stehen zahlreiche weitere Optionen zur Verfügung, um die Regeln zu modifizieren, die dazu verwendet werden, für die Daten die angemessensten Verteilungen und Verteilungszeitmodelle zu bestimmen, so dass die passenden Prozessfähigkeitsindizes berechnet werden können. Sie können in der oberen rechten Ecke des Dialogs die Schaltfläche klicken oder F1 drücken, um das entsprechende Thema der STATISTICA Hilfe aufzurufen, das zu allen Optionen in diesem Dialog genaue Angaben enthält. Beispielsweise Details bezüglich der (kleinen) Unterschiede zwischen DIN und ISO, die hier diskutiert werden. Klicken Sie nun im Dialog ISO 21747 - Einstellungen Prozessfähigkeit die Schaltfläche OK, um die Analysen für die Variable Größe durchzuführen. Klicken Sie im Dialog ISO 21747 - Ergebnisse die Schaltfläche Zusammenfassung, um die Ergebnisübersicht der Analyse zu betrachten. Prozessfähigkeit STATISTICA-Handbuch – 83 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Wie ersichtlich sind alle relevanten Details (nach ISO 21747 und/oder DIN 55319) auf einer einzelnen Seite zusammengefasst, die für die Beurteilung notwendig sind, ob der Prozess als fähig oder nicht fähig (oder fragwürdig) eingestuft werden soll. Als weiteres Beispiel für diese Art der Ergebniszusammenfassungen in STATISTICA wird eine attributive Messsystemanalyse durchgeführt. Im Allgemeinen muss jedes Messsystem, das in der Fertigung verwendet wird, validiert werden, um sicherzustellen, dass die entsprechenden Messmittel die zu betrachtenden Qualitätsmerkmale mit hinreichender Genauigkeit und Präzision messen. Es liegt häufig der Fall vor, dass ein Messmittel von besonderer Bedeutung vorhanden ist, das bestimmt, ob ein gefertigtes Teil von hinreichender Qualität ist. Anders ausgedrückt, misst dieses Messmittel einfach das Attribut Annahme/Ablehnung. Um die Qualität eines Messmittels zu bestimmen, wird wiederholt eine Studie durchgeführt, wobei das Messmittel (Annahme/Ablehnung-Entscheidung) auf Referenzteile mit bekannten Abweichungen von den Sollwerten angewendet wird. Dieser Vorgang wird in dem entsprechenden Abschnitt der STATISTICA Hilfe sowie dem AIAG (Automotive Industry Action Group) Measurement System Analysis (MSA) Manual (2000) beschrieben. Das folgende Beispiel illustriert die Analyse, die im MSA-Manual auf den Seiten 81-86 beschrieben ist. Wählen Sie im Menü Datei den Befehl Beispieldatei öffnen (um direkt den Dateiordner mit den Beispieldateien zu öffnen), anschließend den Ordner Datasets, und doppelklicken Sie auf AttributeGageStudy.sta (bzw. wählen Sie die Datei und klicken Sie die Schaltfläche Öffnen). Diese Datei enthält die Daten, mit bereits zusammengefassten Annahme-Daten, der attributiven Messsystemanalyse, die im MSA-Manual (S. 84) beschrieben ist. Wählen Sie im Untermenü Statistik - Industrielle Statistiken & Six Sigma die Option Prozessanalyse. Wählen Sie anschließend im Dialog Verfahren der Prozessanalyse die Option Attributive Messsystemanalyse (analytische Methode), und klicken Sie die Schaltfläche OK. Klicken Sie im folgenden Dialog Attributive Messsystemanalyse (analytische Methode) auf die Schaltfläche Variablen. Wählen Sie in der Liste Teilenummern die Variable Teile, in der Liste Referenzwerte die Variable Referenz und in der Liste Annahme/Antwort 84 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE die Variable Annahme. Klicken Sie anschließend die Schaltfläche OK, um diesen Dialog zu schließen und um zum Dialog Attributive Messsystemanalyse (analytische Methode) zurückzukehren. Legen Sie im Rahmen Toleranzen für Berechnung die Untere Grenze auf den Wert -0,01 fest. Aktivieren Sie das Kontrollkästchen Andere Grenze anzeigen, und spezifizieren Sie diese Grenze mit dem Wert 0,01. In diesem Beispiel sind wir daran interessiert, die Messmittel-Leistung eines Prozesses zu beurteilen, wobei ein gefertigtes Teil als nicht akzeptabel (es sollte abgelehnt werden) gilt, wenn der wahre Wert unterhalb der unteren Grenze von -0,01 fällt (ausgedrückt als Abweichung vom Sollwert). Von insgesamt jeweils 20 Referenzteilen und Messungen werden in der Datendatei in der Spalte Annahme die Anzahl derjenigen Referenzteil-Messungen zusammengefasst, die als nicht akzeptabel gewertet wurden (d. h., dass sie abgelehnt wurden). Klicken Sie nun im Dialog Attributive Messsystemanalyse (analytische Methode) auf die Schaltfläche OK, und klicken Sie im anschließenden Dialog Ergebnisse auf die Schaltfläche Zusammenfassung, um die Ergebnisübersicht zu betrachten. STATISTICA-Handbuch – 85 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Alle wichtigen Ergebnisse, um den Bias oder die Wiederholbarkeit (der Messungen) des attributiven Messsystems zu bestimmen, sind auf einer einzigen Seite zusammengefasst. Für Details bezüglich der Interpretation der aufgeführten Statistiken und Grafiken siehe das Elektronische Handbuch. Ein allgemeiner Trend im Data Mining besteht in der wachsenden Bedeutung von Lösungen, die statt auf immer ausgefeilteren Analysetools eher auf einfachen analytischen Prozessen basieren. STATISTICA Data Miner Recipes (SDMR) bietet eine intuitive grafische Oberfläche, die es auch Neueinsteigern ermöglicht, einen analytischen Data-Mining-Prozess gemäß eines „Kochrezeptes“ Schritt für Schritt auszuführen. Mit diesen intuitiven Dialogen lassen sich die verschiedenen DataMining-Aufgaben wie Regressionen und Klassifikationen durchführen. Für nutzerangepasste Lösungen lassen sich schnell passende Recipes bilden. Vervollständigte Recipes können als Projektdateien gespeichert werden, mit deren Hilfe sich schnell Neudaten auswerten lassen. 86 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE SDMR umspannt den gesamten Data-Mining-Prozess – von der Abfrage externer Datenbanken bis zur abschließenden Anwendung der Lösungen – und beinhaltet im Allgemeinen die folgenden Schritte. 1. Datenaufnahme – das Identifizieren der Datenquellen Verbindungsaufbau zu ODBC- oder OLE-DB-Datenbanken Verbindung mit STATISTICA-Datendateien 2. Datenbereinigung und das Entfernen redundanter Prädiktoren Flexible und effiziente Methoden der Stichprobenziehung (einfach, geschichtet, systematisch usw.) Weitere flexible Möglichkeiten zum Erkennen und Umkodieren von Missing Data Erkennen von Ausreißern Transformieren der Daten vor der Durchführung nachfolgender Schritte Erkennen und Entfernen redundanter Prädiktoren 3. Erkennen der wichtigen Prädiktoren aus einer großen Anzahl von Variablen Feature Selection von sehr großen Datensätzen (mit mehr als Tausenden von Variablen) Aufspüren wichtiger Interaktionen zwischen den Prädiktoren mittels BaumMethoden 4. Erstellen eines Pools performanter Modelle Wirksames Einsetzen einer umfassenden Auswahl innovativer Techniken, die für das prädiktive Data Mining in SDMR zur Verfügung stehen Übergabe rechenintensiver Aufgaben an WebSTATISTICA, so dass der lokale Rechner für andere Aufgaben zur Verfügung steht 5. Durchführung einer automatischen Modellbewertung, um bezüglich der Perfomance und Komplexität das optimale Modell zu identifizieren 6. Anwendung des Modells auf Neudaten mittels einer effizienten DeploymentEngine Das folgende Beispiel zeigt, wie schnell und effizient Data-Mining-Projekte mit STATISTICA Data Miner Recipes abgeschlossen werden können, selbst dann, wenn sich die beste Lösung des Prognoseproblems erst nach dem (automatischen) STATISTICA-Handbuch – 87 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Vergleich von verschiedenen hochentwickelten Data-Mining-Algorithmen abzeichnet. In diesem Beispiel wird der Nutzen von STATISTICA Data Miner Recipes für das Kreditscoring aufgezeigt. Diesem Beispiel liegt die Datendatei CreditScoring.sta zugrunde, die Beobachtungen von 18 Variablen bezüglich der letzten 1.000 Kreditkunden enthält. Jeder einzelne Kredit wurde entweder als „gut“ (700 Fälle) oder als „schlecht“ (300 Fälle) bewertet. Im Folgenden soll ein Kreditscoring-Modell entwickelt werden, mit dem das Kreditrisiko neuer Kunden beurteilt werden kann. Das Modell soll hierbei auf den Werten einer oder mehrerer Prädiktorvariablen basieren. Die Datendatei enthält zusätzlich eine Variable, mit welcher der Datensatz für Modellbewertungen in eine Trainings- und TestStichprobe zerlegt wird. Gehen Sie wie folgt vor, um SDMR für diese Aufgabe zu verwenden: Öffnen Sie STATISTICA, und wählen Sie im Data Mining-Menü die Option Data Miner - Recipes, um den Dialog Data miner recipe aufzurufen. Klicken Sie die Schaltfläche New, um ein neues Projekt zu erstellen. 88 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Die Übersicht der einzelnen Analyseschritte befindet sich im Register Steps. Die Übersicht enthält vier Hauptknoten: Data preparation, Data for analysis, Data redundancy und Target variable. Jedem Knoten (oder Schritt) wird ein Status zugewiesen, wobei in Abhängigkeit davon, ob der Schritt optional ist, es bis zu drei unterschiedliche Statusanzeigen gibt. Jeder Status wird durch ein Symbol dargestellt: Ein rotes zeigt den Status Warten an, d. h., dass ein Schritt nicht gestartet werden kann, da ein vorangehender Schritt noch nicht abgeschlossen wurde; ein gelbes bedeutet Status Bereit, d. h., dass mit diesem Schritt gestartet werden kann, da alle vorangehenden Schritte abgeschlossen wurden; ein grünes symbolisiert einen vervollständigten Schritt. Um vom Status zum Status zu gelangen, muss die Schaltfläche Next Step/Run to completion geklickt werden. Der Statuswechsel wird nur dann vollzogen, wenn der Schritt erfolgreich vervollständigt wurde. Klicken Sie im Register Data preparation auf die Schaltfläche Open/Connect data file, und doppelklicken Sie anschließend auf die Datendatei CreditScoring.sta (diese Datei befindet sich im Ordner Datasets, der während der STATISTICA-Installation erstellt wurde). Klicken Sie die Schaltfläche Select variables, und wählen Sie in dem aufgerufenen Dialog Select variables die folgenden Variablen: Variable 1 (Credit Rating) als Target, categorical, Variablen 3, 6 und 14 als Continuous predictors Variablen 2, 4-5, 7-13 und 15-18 als Categorical predictors und Variable 19 (TrainTest) als Testing sample. STATISTICA-Handbuch – 89 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Klicken Sie anschließend die Schaltfläche OK. Wählen Sie im Dialog Data miner recipe das Register Advanced, und aktivieren Sie das Kontrollkästchen Use sample data. Wählen Sie als Methode der Stichprobenziehung die Option Stratified random sampling, um sicherzustellen, dass jede einzelne Klasse der abhängigen Variablen Credit Rating mit ungefähr gleicher Fallanzahl in den Trainings- und Teststichproben vertreten ist. Klicken Sie anschließend die Schaltfläche More options, um den Dialog Stratified sampling aufzurufen. Klicken Sie die Schaltfläche Strata variables, und wählen Sie dort Credit Rating als Schicht-Variable, und klicken Sie anschließend im Dialog zur Variablenauswahl sowie Stratified sampling jeweils auf OK. Um den Schritt Data preparation abzuschließen, klicken Sie die Schaltfläche Next Step/Run to completion, so dass sichergestellt wird, dass dieser Schritt erfolgreich vervollständigt wurde (in der Übersicht der Analyseschritte wechselt die Statusanzeige für Data preparation von auf ). Nachdem der Schritt Data preparation vervollständigt wurde, wird automatisch der Schritt Data for analysis aufgerufen. Klicken Sie im Register Data for analysis die Schaltfläche Select testing sample, und wählen Sie anschließend im Dialog Testing Sample Specifications die Option Variable. Überprüfen Sie, dass die Kategorie (der Wert) Train in dem Feld Code for training sample und Test in dem Feld Code for testing sample angezeigt wird. Klicken Sie anschließend die Schaltfläche OK. Die Modelle werden unter der Verwendung der Trainingsstichprobe angepasst und anschließend mittels der Beobachtungen in der Teststichprobe evaluiert. Durch Verwendung von Beobachtungen, die nicht in den Berechnungen der Modellanpassung eingeflossen sind, können die Statistiken der Anpassungsgüte (bzw. Prognosewerte), die für die 90 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE verschiedenen Data-Mining-Modelle (bzw. -Algorithmen) ermittelt wurden, für die Bewertung der Vorhersagekraft der einzelnen Modelle herangezogen werden. Diese Berechnungen lassen sich demnach dafür verwenden, die einzelnen Modelle zu vergleichen und eines oder mehrere Modelle für die weitere Analyse auszuwählen. Dieser Schritt berechnet auch die deskriptiven Statistiken für alle in dieser Analyse enthaltenen Variablen. Die deskriptiven Statistiken der einzelnen Variablen bieten nützliche Informationen bezüglich der Spannweiten und Verteilungen der Daten, die in diesem Projekt enthalten sind. Klicken Sie die Schaltfläche Next Step/Run to completion, um sicherzustellen, dass dieser Schritt erfolgreich vervollständigt wurde. Als Nächstes wird der Schritt Data redundancy aufgerufen. Der Zweck dieses Schrittes liegt darin, Prädiktoren auszuschließen, die zu einem hohen Grade redundant sind. Wären im Datensatz beispielsweise zwei Messungen für die Größe Gewicht vorhanden, eines in Kilogramm und das andere in Pfund gemessen, wäre eine dieser Variablen redundant. Wählen Sie im Register Data redundancy die Option Correlation coefficient, und legen Sie den Wert für Criterion value auf 0,8 fest, um die redundanten Prädiktoren auszuschließen, für die eine hohe Korrelation vorliegt (r≥0.8). Da in dem Datensatz für dieses Beispiel keine Redundanzen vorliegen, führt das Klicken der Schaltfläche Next Step/Run to completion ohne Warnhinweis zum nächsten Analyseschritt. Die Datenaufbereitung für die Modellbildung ist nun abgeschlossen. Als Nächstes wird für die Zielvariable dieses Beispiels ein Prognosemodell erstellt. In der Übersicht der Analyseschritte weist der Knoten der gewählten Zielvariablen Verzweigungen zu den vier Unter-Knoten Important variables, Model building, Evaluation und Deployment auf. STATISTICA-Handbuch – 91 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Der Knoten Important variables ist automatisch ausgewählt. In diesem Schritt besteht das Ziel darin, die Dimension des Prognoseproblems zu reduzieren, d. h., eine Teilmenge von Variablen zu wählen, die am wahrscheinlichsten mit der Zielvariablen (in diesem Beispiel Credit rating) im Zusammenhang stehen, so dass sich am ehesten akkurate und sinnvolle Prognosemodelle ergeben. Diese strategische Herangehensweise wird auch als Feature Selection bezeichnet. Hierbei sind zwei Strategien verfügbar. Wenn die Option Fast predictor screening gewählt ist, führt das Programm bezüglich Tausender von Eingabevariablen ein Screening durch, so dass diejenigen Variablen herausgesiebt werden, die in einem starken Zusammenhang mit der zu untersuchenden abhängigen Variablen stehen. Falls die Option Advanced Screening gewählt ist, werden Baummethoden angewendet, um wichtige Interaktionen unter den Prädiktoren aufzuspüren. Wählen Sie in diesem Beispiel die Option Advanced Screening, und klicken Sie auf die entsprechende Schaltfläche, um den Dialog Advanced Screening aufzurufen. Geben Sie in dem Feld Number of predictors to extract den Wert 12 ein, und wählen Sie in dem Feld Prior class probabilities die Option Equal. 92 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Klicken Sie in diesem Dialog OK und anschließend die Schaltfläche Next Step/Run to completion, um diesen Schritt zu vervollständigen. Um eine Übersicht der bisherigen Analyse zu betrachten, klicken Sie im Register Steps die Schaltfläche Report, und wählen Sie in dem Menü den Befehl Summary report, um sich die Arbeitsmappe Results anzeigen zu lassen. Diese Prädiktoren werden im Folgenden mittels verschiedener hochmoderner DataMining- und Machine-Learning-Algorithmen, die in SDMR verfügbar sind, genauer untersucht. Beim Öffnen der Arbeitsmappe Results wurde der Dialog Data miner recipe minimiert. Klicken Sie in der Analyseleiste auf die Schaltfläche Data miner recipe, so dass der Dialog wieder angezeigt wird. Momentan ist der Knoten Model building ausgewählt. In diesem Schritt können für die gewählten Variablen eine Reihe von Modellen erstellt werden. Im Register Model building sind die Optionen C&RT, Boosting tree und Neural network voreingestellt, die als Modelle oder Algorithmen automatisch an den Daten „versucht“ werden. Die Berechnungen für die Modellbildung können entweder lokal oder auf dem WebSTATISTICA Server durchgeführt werden. Die letztere Option ist allerdings nur dann verfügbar, wenn Sie über ein gültiges WebSTATISTICA Server-Konto STATISTICA-Handbuch – 93 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE verfügen und eine Verbindung zu der Server-Installation besteht. Klicken Sie in diesem Beispiel die Schaltfläche Build model, um die Berechnungen lokal auf Ihren Rechner auszuführen. Dies wird einige Zeit in Anspruch nehmen. Klicken Sie nie Abschluss der Berechnungen die Schaltfläche Next Step/Run to completion, um diesen Schritt zu vervollständigen. Der Knoten Evaluation ist nun ausgewählt. Klicken Sie im Register Evaluation auf die Schaltfläche Evaluate models, um eine Modellbewertung durchzuführen, mit der man dasjenige Modell erhält, das bezüglich der Teststichprobe am besten abschneidet. Man beachte, dass beim Boosting Trees-Modell die minimale Fehlerrate von 35,94 % vorliegt. Demnach wurden 64,06 % der Fälle der Teststichprobe durch das Modell korrekt vorhergesagt. Die Ergebnisse Ihrer Analyse können hiervon leicht abweichen, da bei diesen hochentwickelten Data-Mining-Methoden das Bilden von Teilmengen aus den Testdaten randomisiert ist, um zuverlässige Schätzungen der Fehlerraten zu erhalten. Klicken Sie im Register Steps auf die Schaltfläche Report, und wählen Sie in dem Menü den Befehl Summary report, um die Arbeitsmappe Results erneut aufzurufen. Diese Tabelle zeigt die Performance des besten Modells bezüglich des Testdatensatzes an. Die Spalten repräsentieren die gemäß des Boosting TreesModells geschätzten Klassenhäufigkeiten, und die Zeilen geben die tatsächlichen bzw. beobachteten Werte innerhalb der Teststichprobe an. In dieser Matrix ist ersichtlich, dass dieses Modell 65 von 87 „faulen Krediten“ korrekt vorhergesagt hat, demnach allerdings 22 von ihnen fehlklassifiziert wurden. Dieses Ergebnis ist 94 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE im Allgemeinen sehr viel informativer als die Gesamt-Fehlklassifikationsrate, die aussagt, dass die Genauigkeit insgesamt bei 64,06 % liegt. Rufen Sie erneut den Dialog Data miner recipe auf, und klicken Sie die Schaltfläche Next Step/Run to completion, um diesen Schritt zu vervollständigen. Der abschließende Schritt Deployment beinhaltet das Anwenden des besten Modells auf neue Daten, um die Bonität der Kunden einzuschätzen. In diesem Fall wird das Boosting Trees-Modell angewendet, das im Vergleich mit den anderen Modellen bezüglich der Teststichprobe die beste Vorhersagegenauigkeit lieferte. Dieser Schritt bietet auch die Möglichkeit, die Scoring-Information (die berechnete Klassifikation oder Klassifikationswahrscheinlichkeit usw.) in die ursprüngliche Datendatei oder Datenbank zurückzuschreiben. Diese Option ist extrem hilfreich, wenn die Modelle auf sehr große Datensätze angewendet werden (z. B. bei Anwendung von Scoring-Verfahren auf große Datenbanken). Klicken Sie im Register Deployment auf die Schaltfläche Data file for Deployment, und doppelklicken Sie auf die Datendatei CreditScoring.sta (die Datei befindet sich im Ordner Datasets, der während der STATISTICA-Installation erstellt wird). Es wird für Demonstrationszwecke also dieselbe Datendatei für das Deployment des besten Modells verwendet. Klicken Sie die Schaltfläche Next Step/Run to completion, um diesen Datensatz mithilfe des ausgewählten Modells auszuwerten. Die ausgewertete Datei Summary STATISTICA-Handbuch – 95 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE of Deployment mit den Klassifikationen und Klassifikationswahrscheinlichkeiten befindet sich wie unten aufgeführt im Ordner Deployment der ProjektArbeitsmappe. Dieses Beispiel dient dazu, die Effizienz des in STATISTICA Data Miner Recipes implementierten Arbeitsablaufes aufzuzeigen. Mit nur wenigen Mausklicks wird man von dem Programm durch den gesamten Analyseprozess geführt – von der Definition der Eingabedaten und des Analyseproblems über die Datenaufbereitung und Modellbildung bis zur Auswahl und dem Deployment des bevorzugten Modells. Selbst wenn die meisten der komplexen Berechnungen der Data-Mining-Analyse automatisch in STATISTICA Data Miner Recipes ausgeführt werden, was selbst Einsteigern auf dem Gebiet des Data Mining ermöglicht, von der Problemstellung bis zur Lösung schnell voranzuschreiten, wird von dem Programm eine große Anzahl fortgeschrittener Data-Mining-Algorithmen „angewendet und getestet“, um automatisch den erfolgreichsten Ansatz zu bestimmen. Die Methodologie und Benutzeroberfläche von STATISTICA Data Miner Recipes ermöglicht demnach, eine große Auswahl an Data-Mining-Algorithmen in einem einzelnen Paket wirksam einzusetzen. 96 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE WebSTATISTICA Server erweitert die Einsatzmöglichkeiten der STATISTICAPlattform, indem mehrere Einzelplatzversionen in ein leistungsstarkes unternehmensweites Informationssystem umgewandelt werden. Eines der Hauptmerkmale der Client-Server-Architektur von WebSTATISTICA besteht darin, dass es den Anwendern ermöglicht, die Ressourcen des Servers für mehrere womöglich zeitaufwendige oder sich periodisch wiederholende Analysen zu nutzen (das „Hochladen“ von Aufgaben auf den Server), so dass sich der lokale Rechner anderen Aufgaben zuwenden kann, die sofortige Beachtung erfordern. Dies kann entweder mittels eines Webbrowsers (Thin Client) oder der STATISTICADesktopversion (Thick Client, WebSTATISTICA-Client) realisiert werden. Während es die erstgenannte Option ermöglicht, von nahezu jedem beliebigen Computer auf den WebSTATISTICA Server zuzugreifen, erfordert die zweitgenannte Option auf dem entsprechenden Rechner eine STATISTICA-Installation. Die enge Integration von WebSTATISTICA mit der STATISTICA-Anwendung bietet das gewohnte Arbeitsumfeld für client- und serverseitige Operationen, eine ansprechende Benutzeroberfläche mit zusätzlichen Optionen und gegebenenfalls weiteren Komponenten und Werkzeugen der verwendeten STATISTICA-Desktopversion. Stellen Sie zunächst sicher, dass die WebSTATISTICA-Integration aktiviert ist. Wählen Sie im Menü Extras den Befehl Optionen, um den Dialog Optionen aufzurufen, und wählen Sie dort das Register Server / Web. Aktivieren Sie das Kontrollkästchen WebSTATISTICA ServerIntegration zulassen. Geben Sie den Netzwerkpfad des WebSTATISTICA Servers an (und gegebenenfalls die Verbindungseinstellungen, wenn sie von den Standardeinstellungen abweichen). Fragen Sie Ihren Netzwerk-Administrator nach diesen Werten. Wählen Sie die Option Integrierte Anmeldung zulassen, falls diese Option vom Server unterstützt wird und aktiviert wurde. Andernfalls ist es bei der Anmeldung zum WebSTATISTICA Server notwendig, den Benutzernamen und das Passwort einzugeben. STATISTICA-Handbuch – 97 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Klicken Sie auf die Schaltfläche OK, nachdem Sie die Optionen in diesem Register festgelegt haben. Das Menü Server wurde nun der STATISTCA-Menüleiste hinzugefügt. Wählen Sie im Menü Server den Befehl Log In, und geben Sie falls erforderlich Ihren Benutzernamen und Passwort an. Nach der erfolgreichen Anmeldung werden die weiteren Menübefehle verfügbar. Die Menübefehle Open, Save und Save As werden dazu verwendet, eine momentan geöffnete Datei auf den Server hochzuladen oder eine Datei vom Server herunterzuladen, so dass sie lokal geöffnet werden kann. In den entsprechenden 98 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Ordnern des Servers oder Clients sind diese Befehle auch in expliziter Form (Upload File to und Download File from) vorhanden. Hinweis: In der Praxis sind gewöhnlich gerade die Analysen zeitaufwendig oder ressourcenintensiv, die auf großen Datensätzen basieren und/oder iterative Algorithmen beinhalten, die STATISTICA-Komponenten voraussetzen, die nicht in allen STATISTICA-Konfigurationen vorliegen. Im Folgenden wird bewusst ein Beispiel verwendet, das nicht viel Zeit in Anspruch nimmt. Aber selbst wenn eine einzelne Analyse schnell und mit wenig Ressourcen abgehandelt werden kann, ist es eventuell notwendig, eine komplizierte, zeitaufwendige Sequenz von Tasks wiederholt durchzuführen, die zu bestimmten Zeitpunkten ausgeführt werden müssen. In diesem Fall besteht die Möglichkeit, die Ablaufplanung von WebSTATISTICA zu verwenden, sofern ein benutzerdefiniertes Skript erstellt und hochgeladen wurde, das die erforderten Tasks beinhaltet (beispielsweise durch Kombination der Makros, die während einer STATISTICA-Sitzung aufgezeichnet wurden). Zeichnen Sie ein Analysemakro auf, beispielsweise auf Basis der einzelnen Schritte in Beispiel 2: ANOVA (Seite 34). Nachdem Sie die einzelnen Schritte nachvollzogen haben, klicken Sie im Dialog ANOVA Ergebnisse auf die Schaltfläche Optionen, und wählen Sie aus der Auswahlliste den Befehl Erzeuge Makro. Übernehmen Sie in dem Dialog Neues Makro alle Standardeinstellungen, und bestätigen Sie mit OK. Klicken Sie auf das Makrofenster, so dass es im Vordergrund steht, und führen Sie das Makro aus. Überprüfen Sie, ob die korrekten Ergebnisse wiedergegeben werden. Wählen Sie anschließend im Menü Server den Befehl Offload Task, um den Dialog Offload a task aufzurufen. STATISTICA-Handbuch – 99 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE In diesem Dialog muss ein Task (ein Skript oder Data Miner-Projekt) und optional der zu verwendende Datensatz zum Hochladen ausgewählt werden. Die Auswahl eines Datensatzes ist nicht zwingend erforderlich, da die Daten in Data MinerProjekten eingebettet sein können, Makros die Datensätze explizit laden oder überhaupt nicht verwenden. Da ein Datensatz (Adstudy.sta) und ein STATISTICA-Makro geöffnet sind, ist die Standardeinstellung im Dialog Offload a task, diese Dateien zum Hochladen zu verwenden. Stattdessen wird sich in diesem Beispiel der Task auf einen serverseitigen Datensatz beziehen. Diese Option ist nützlich, da sie die Vorteile des zentralen serverseitigen Speicherns bedient, das besonders im Falle großer (unter Umständen dynamisch aktualisierter) Datensätze hilfreich ist, die von mehreren Benutzern gleichzeitig verwendet werden. Um das Makro auf einen serverseitigen Datensatz anzuwenden, wählen Sie im Rahmen Data Source die Option Select data file stored on the server, so dass der Dialog WebSTATISTICA Repository aufgerufen wird. Die Verzeichnisstruktur in der Baumansicht des Dialoges stellt das WebSTATISTICA Server Repository dar (in Abhängigkeit der Zugriffsrechte wird eventuell eine gekürzte Verzeichnisstruktur wiedergegeben). Klicken Sie im Fenster auf der linken Seite auf den Ordner Datasets, und wählen Sie im Fenster auf der rechten Seite die Datei Adstudy.sta (alternativ kann der entsprechende Pfad in dem Eingabefeld angegeben werden). Klicken Sie in den Dialogen WebSTATISTICA Repository und Offload a task jeweils auf OK. STATISTICA übermittelt den Task und lädt gegebenenfalls auch Dateien hoch. Sie können sich nun anderen Aufgaben widmen, wobei Sie im Server-Menü 100 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE in periodischen Abständen den Status des hochgeladenen Tasks mittels des Befehls Task Status abfragen können. Hierdurch wird der Dialog Task Status aufgerufen, der in der folgenden Abbildung dargestellt ist. Der Status der Taskliste kann durch Klicken der Schaltfläche Refresh manuell aktualisiert werden. Aktivieren Sie das Kontrollkästchen Automatic, falls eine automatische Aktualisierung gewünscht ist. Tasks durchlaufen die Stufen Pending und Running und münden entweder in Completed oder Script Error. Falls Ihr Task fehlschlägt, können Sie mit einem Doppelklick auf dem entsprechenden Eintrag zusätzliche Information bezüglich des Fehlers aufrufen. Wenn der Fehler behoben ist (durch Aktualisieren des SVB-Skripts oder Data Miner-Projekts), können Sie den fehlgeschlagenen Task auswählen und mittels der Schaltfläche Resubmit erneut hochladen. Sofern der Task erfolgreich abgeschlossen wurde, können die Ergebnisse abgerufen werden. Da sich die Ergebnisse auf dem Server befinden, können Sie von jedem beliebigen STATISTICA-Client aus aufgerufen werden, sofern man dort mit gleichen Zugriffsrechten angemeldet ist. Wenn im Rahmen Results die Kontrollkästchen Task und Data aktiviert werden, kann der Client darüber hinaus die Task-Datei und Datenquelle (falls verfügbar) abrufen. Wird das Kontrollkästchen In Browser aktiviert, werden die Ergebnisse im Sinne eines Thin Clients zunächst im Browser dargestellt. Diese Option ist hilfreich, wenn eine große Datenmenge an Ergebnissen erwartet wird. Wenn die Analyse beispielsweise viele Datensätze und Grafiken erzeugt, kann man sich zunächst im Browser einen Überblick verschaffen, und nur bestimmte Ergebnisse zum Herunterladen auf den STATISTICA-Handbuch – 101 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Desktop auswählen. Das Aktivieren des Kontrollkästchens Trace report liefert einen Diagnosebericht der Taskausführung. Da ein Server nicht entscheiden kann, wie lange die Taskergebnisse verfügbar sein sollen, steht Ihnen die Option zur Verfügung, die Ergebnisse zu löschen. Um demnach die Speicherkapazitäten des Servers zu schonen, wird jedes Mal nach Ergebnisabruf die Meldung aufgerufen, die danach fragt, ob die Ergebnisse nun vom Server gelöscht werden sollen (es sei denn, dass das Kontrollkästchen Delete task after retrieval deaktiviert wurde). Rufen Sie nach Abschluss des Tasks die Ergebnisse ab, und schließen Sie den Dialog Task Status. Unabhängig davon, ob das Skript lokal oder auf dem Server ausgeführt wird, sind die Ergebnisse äquivalent. In regulierten Bereichen haben die gemäß GxP-Richtlinien (GxP – Good Manufacturing Practices, Good Clinical Practices, Good Laboratory Practices) durchgeführten Analysen den Verbraucherschutz zu berücksichtigen, wie z. B. im Rahmen klinischer Tests, der Herstellung und Qualitätssicherung. Wenn ein Unternehmen Analysen nach GxP-Richtlinien durchführt, empfehlen die Regulierungsbehörden, dass das Unternehmen nachweisen kann, dass für die Ergebnisse des validierten Analysesystems (z. B. STATISTICA) die Vorgaben der 102 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Verfahrensdokumentation erfüllt sind. STATISTICA bietet mit den Features Audit Trail und Datentabelle/Bericht sperren die Werkzeuge an, um diese Regulierungen zu erfüllen. Um das Kriterium der Rückverfolgbarkeit gemäß GxP-Richtlinien zu erfüllen, sind zumindest drei Sachverhalte zu berücksichtigen: 1) die Kontrolle über die Eingabedaten der Analyse (d. h., dass dokumentiert wird: wer – zu welcher Zeit – aus welchem Grund – Veränderungen vornahm, sowie das Speichern der alten und neuen Werte), 2) Kontrolle über die Ergebnistabellen und Grafiken (es muss sichergestellt sein, dass sie nach Erstellung nicht mehr modifiziert wurden) und 3) die Rückverfolgbarkeit zwischen der Version der Eingabetabelle und entsprechender Ergebnisausgabe. STATISTICA stellt diese Informationen mittels der Funktion Audit Trails und GxP-Berichten bereit. Weitere Details über die Versionsverwaltung/Historie von STATISTICADokumenten innerhalb des STATISTICA Document Management System sind in der Elektronischen Hilfe zu finden. Öffnen Sie eine STATISTICA-Tabelle. Wählen Sie in dem Untermenü Extras - Audit Trail den Befehl Einstellungen, um den Dialog Einstellungen Audit-Trail aufzurufen. Aktivieren Sie das Kontrollkästchen Audit-Trail aktivieren, um die Protokollierung für die aktuelle Tabelle zu starten. Aktivieren Sie das Kontrollkästchen Bei Änderungen Eingabe des Anwenders für Grund erzwingen, so dass der Anwender bei Änderungen der Tabelle aufgefordert wird, diese näher zu erläutern. Die Schaltfläche Protokoll kürzen ist nur dann verfügbar, wenn Audit-Trail bereits zuvor aktiviert wurde, so dass der Tabelle ein Protokoll Audit-Trail Daten hinzugefügt wurde. Das Klicken dieser Schaltfläche kürzt das Protokoll und löscht damit alle vorhandenen Einträge. Es erfolgt ein Warnhinweis, der zur Bestätigung STATISTICA-Handbuch – 103 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE dieser Aktion auffordert, bevor alle aktuellen Einträge gelöscht werden. Nach dem Kürzen des Protokolls erscheint dieses Kürzen als erste Aktion in dem neuen Protokoll. Klicken Sie im Dialog Einstellungen Audit-Trail auf OK, um die Protokollierung zu starten. Hiernach wird direkt der Dialog Grund für Änderung eingeben aufgerufen, der ein Eingabefeld beinhaltet, in dem der Grund für das Aktivieren des Protokolls eingegeben werden soll. Geben Sie eine Begründung ein, und klicken Sie anschließend OK. Führen Sie nun auf dem Variablenkopf der letzten Variablen in der Tabelle einen Rechtsklick aus, und wählen Sie aus dem Kontextmenü den Befehl Variablen einfügen. Übernehmen Sie in dem Dialog Variablen hinzufügen alle Standardeinstellungen, und klicken Sie OK. Der Dialog Grund für Änderung wird aufgerufen, und es muss zunächst eine Begründung eingegeben und mit OK bestätigt werden, bevor die Änderung in Kraft tritt. Bei aktiviertem Audit-Trail wird jede Änderung der Tabelle dokumentiert. Wird darüber hinaus das Kontrollkästchen Bei Änderungen Eingabe des Anwenders für Grund erzwingen aktiviert, werden auch die Kommentare der Anwender im Protokoll Audit-Trail Daten gespeichert und angezeigt. Wählen Sie im Untermenü Extras - Audit Trail den Befehl Protokoll, um das Protokoll Audit-Trail Daten aufzurufen. Die Protokollansicht liefert u. a. Informationen zu: Versionsnummer der Tabelle, Zeit der Änderung, verwendeten Computer, Anwender, Art der Änderung und Grund der Änderung. Die Spaltenbreiten des Protokollgitters können mit den üblichen Windows-Konventionen verändert werden. Die Protokolle sind hierbei in der entsprechenden Tabelle eingebettet, d. h., sie werden mitsamt der Tabelle als Einheit abgespeichert. 104 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Eine Tabelle kann verschlüsselt werden, so dass die Datei nur mittels des korrekten Passwortes geöffnet werden kann. Nur diejenigen Anwender, die das Passwort kennen, können die Tabelle öffnen. Sofern eine passwortgeschützte Tabelle geöffnet ist, kann sie bearbeitet werden. Als Alternative bietet sich das teilweise Sperren der Tabelle an, so dass einige oder auch alle Elemente der Tabelle mit einem Schreibschutz versehen werden. Die Tabelle kann von jedem beliebigen Anwender geöffnet werden, die schreibgeschützten Elemente jedoch nicht verändert werden. Das Sperren und Verschlüsseln einer Tabelle kann auch gleichzeitig miteinander kombiniert werden. Öffnen Sie eine STATISTICA-Tabelle. Wählen Sie im Menü Datei den Befehl Eigenschaften, um den Dialog Dokumenteigenschaften aufzurufen. Wählen Sie dort das Register Passwort. Geben Sie in dem Feld Passwort für Dokument ein Passwort ein, und klicken Sie auf OK. Der Dialog Passwort wird aufgerufen, der dazu auffordert, das Passwort zu bestätigen. Beachten Sie, dass bei Passwörtern zwischen Groß- und Kleinschreibung unterschieden wird. STATISTICA-Handbuch – 105 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Klicken Sie im Dialog Passwort auf OK, und schließen Sie die Datendatei. Ein Dialog wird aufgerufen, in dem Sie wählen können, ob die Änderungen gespeichert werden sollen. Bestätigen Sie mit Ja, so dass die Verschlüsselung durchgeführt wird. Beim nächsten Versuch diese Tabelle zu öffnen, wird der Dialog Passwort aufgerufen, wobei sich die Tabelle dann nur nach Eingabe des korrekten Passwortes öffnen lässt. Um Compliance-Anforderungen zu erfüllen, muss die Verlässlichkeit der Eingabedaten gewährleistet sein. Mit den Optionen zum Sperren von Datentabellen können Änderungen jeglicher Tabellenelemente unterbunden werden – vom Erscheinungsbild der Daten (d. h. Schriftart, Formate, Variableneinstellungen) bis zu den tatsächlichen Daten und Fallauswahlbedingungen oder Fallgewichten, die für die Tabelle definiert wurden. Wenn Bedarf besteht, an den Daten Änderungen vorzunehmen (z. B. bei inkorrekter Dateneingabe), kann mit aktiviertem Audit-Trail jede einzelne Änderung aufgezeichnet werden. Beim Mehrbenutzersystem STATISTICA Enterprise können nur Anwender mit Administrator-Rechten die Audit-Trail-Einstellungen modifizieren. Für weitere Information siehe die Elektronische Hilfe zu STATISTICA Enterprise. Wählen Sie im Menü Extras den Befehl Sperren, um den Dialog Datentabelle sperren aufzurufen. In diesem Dialog kann festgelegt werden, welche Tabellenelemente gesperrt werden sollen. Wenn Anwender versuchen, ein gesperrtes Element zu ändern, erscheint eine Meldung, die über die Sperrung der Tabelle informiert. Aktivieren Sie das Kontrollkästchen Daten, so dass Änderungen der Daten unterbunden werden. Anwendern ist es somit nicht mehr möglich, die Datenwerte oder den Missing-Data-Code zu ändern. Darüber hinaus wird jegliches 106 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Datenmanagement verhindert, das Einfluss auf diese Tabelle hat (z. B. Änderung von Datentypen oder Länge der Textvariablen). Wenn dieses Kontrollkästchen deaktiviert ist, haben Anwender die Möglichkeit, die Daten zu bearbeiten (z. B. durch aktualisierende Abfragen, neue Tabellenformeln oder durch das Eintippen neuer Werte). Aktivieren Sie das Kontrollkästchen Anzeige (Schriftart, Formate usw.), um das Ändern der verwendeten Schriftarten und Formate zu unterbinden. Die Formatierungsoptionen in der Symbolleiste werden hierdurch deaktiviert. Zusätzlich wird das Anwenden neuer Tabellenlayouts (erreichbar über Menü Format - Tabelle) unterbunden. Aktivieren Sie das Kontrollkästchen Fallauswahl und Gewichte, um das Ändern von Fallauswahlbedingungen und Fallgewichten zu unterbinden. Anwendern ist es demnach nicht mehr möglich, das Verwenden von Fallauswahlbedingungen einoder auszuschalten oder die aktuell definierten Auswahlbedingungen anderweitig zu verändern. Die meisten Optionen im Register Auswahlbedingungen des Dialogs Tabellen-Auswahlbedingungen werden hierdurch deaktiviert, die Optionen in den anderen Registern dieses Dialogs (z. B. das Erstellen einer Zufallsauswahl oder Formatänderungen für ausgewählte Fälle) sind jedoch weiterhin verfügbar. Die Optionen im Dialog Fallgewichte für Tabelle werden durch diese Sperrung deaktiviert. Aktivieren Sie das Kontrollkästchen Variableneinstellungen, um Änderungen der Variablenspezifikationen (z. B. Messwert-Typ, Missing-Data-Code, Anzeigeformat und Langer Name) zu unterbinden. Anwendern ist es weiterhin möglich, die einzelnen Dialoge der Variablenspezifikationen (mittels Doppelklick auf Variablenkopf) und den Variablenspezifikationen-Editor aufzurufen; die Optionen zum Ändern der Spezifikationen sind jedoch alle deaktiviert. Änderungen der Audit-Trail-Einstellungen können durch Aktivierung des Kontrollkästchens Audit-Trail unterbunden werden. Ohne vorherige Aufhebung dieser Sperrung ist es Anwendern nicht mehr möglich, diese Einstellungen zu verändern. Geben Sie ein Kennwort ein, das zum Sperren oder Entsperren der Tabelle verwendet werden soll, bestätigen Sie das Kennwort (es wird zwischen Groß- und Kleinschreibung unterschieden), und klicken Sie OK. Obwohl ein Kennwort nicht zwingend erforderlich ist, wird die Verwendung eines Kennwortes ausdrücklich empfohlen. Sofern kein Kennwort eingegeben und bestätigt wird, kann jeder STATISTICA-Handbuch – 107 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE beliebige Anwender die Tabellenelemente entsperren, indem einfach die aktivierten Kontrollkästchen deaktiviert werden. Sofern allerdings zuvor Sperrungen und Kennwort definiert wurden, ist die Eingabe des korrekten Kennworts erforderlich, um die Einstellungen des Dialogs zu ändern. Versuchen Sie nun, Änderungen in der Tabelle vorzunehmen. Eine Meldung wird aufgerufen, die darauf hinweist, dass die Operation wegen der Sperrung der Tabelle nicht ausgeführt werden kann. Um den Compliance-Anforderungen zu entsprechen, muss sichergestellt sein, dass die Berichtsergebnisse sicher verwaltet werden. STATISTICA bietet hierbei die notwendigen Optionen für das Erstellen von GxP-Berichten. Im GxP-Modus werden alle Ergebnisse an gesperrte Berichtsfenster gesendet, d. h., dass alle Optionen zum manuellen Entfernen (Ausschneiden, Extrahieren - Original, Löschen usw.) sowie Hinzufügen (Einfügen, Inhalte einfügen) von Ergebnissen deaktiviert sind. STATISTICA kann ebenfalls ein Erstellungsdatum des Berichts sowie Zeitangaben der einzelnen Ergebnisse ausweisen. Die Formate des Erstellungsdatums und der Zeitangaben sind hierbei frei konfigurierbar und können darüber hinaus auch Informationen zum Anwender und verwendeten Computer beinhalten. Im GxP-Modus lässt sich also eindeutig festhalten, welcher Anwender zu welchem Zeitpunkt die Ergebnisse erstellt hat. Darüber hinaus ist sichergestellt, dass keine Ergebnisse aus dem Bericht entfernt wurden. Ein zusätzliches Feature des GxP-Modus ist die Option der Rückverfolgbarkeit. Im GxP-Modus überprüft STATISTICA automatisch, ob Audit-Trails für die Tabellen aktiviert wurden. Falls dies der Fall ist, nimmt STATISTICA den Tabellennamen und die Versionsnummer in den Bericht auf. Wenn keine Versionsnummern verfügbar sein sollten (zum Beispiel bei deaktiviertem Audit-Trail oder Ergebnissen aus externen Datenbanken mittels In-place-Database-Processing), führt STATISTICA für die Nichtverfügbarkeit die entsprechende Erklärung auf. Wählen Sie im Menü Extras den Befehl Optionen, um den Dialog Optionen aufzurufen, und wählen Sie in diesem Dialog das Register Ausgabemanager. Wählen Sie unter Ausgabe Bericht entweder die Option Mehrere Berichte (einen für 108 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE jede Analyse/Grafik) oder Gemeinsamer Bericht (für alle Analysen/Grafiken). Bei Auswahl einer dieser beiden Optionen werden die Optionen im Rahmen Sperrung Bericht (GxP) verfügbar. Aktivieren Sie das Kontrollkästchen Gesperrt, um sicherzustellen, dass keine Dokumente aus dem Bericht entfernt werden können. Hierbei werden die Befehle Ausschneiden, Einfügen, Löschen, Umbenennen und das Betrachten der Eigenschaften in dem Kontextmenü des Berichts deaktiviert. Auch der Befehl Extrahieren - Original und alle Befehle zum Einfügen sind im Weiteren nicht mehr verfügbar. Um in der ersten Zeile der Datei Angaben zur Erstellung einzufügen, können Sie das Standardformat aus dem Feld Ersteller übernehmen oder ein benutzerdefiniertes Format eingeben. Die folgenden Codes können in diesem Feld verwendet werden: &[Date], &[Time], &[User] und &[Computer]. Jeglicher Text in diesem Feld wird in dem Bericht genauso dargestellt, wie er hier eingegeben wird. Um über jedes hinzugefügte Objekt im Bericht eine Zeitangabe hinzuzufügen, können Sie das Standardformat aus dem Feld Datum übernehmen oder ein eigenes STATISTICA-Handbuch – 109 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Format eingeben. Die folgenden Codes können in diesem Feld verwendet werden: &[Date], &[Time], &[User] und &[Computer]. Klicken Sie im Dialog Optionen auf OK und führen Sie anschließend eine Analyse durch; verwenden Sie beispielsweise das Modul Elementare Statistiken, um auf schnellem Wege eine Ergebnistabelle der Deskriptiven Statistiken zu erstellen. Beim Klicken der Schaltfläche Zusammenfassung werden die Ergebnisse an einen gesperrten Bericht übergeben, der für diese Analyse den Ersteller, Datum, Zeit und verwendeten Computer aufführt. Die Produktlinie STATISTICA Enterprise erweitert die Funktionen der STATISTICA-Anwendungen durch das Ermöglichen von Gruppenarbeit, einer zentralen Administration, einer Anpassung der Systemebenen und anderen erforderlichen Features, wenn STATISTICA-Anwendungen als Teil eines unternehmensweiten Computersystems verwendet werden. 110 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE STATISTICA Enterprise Manager ist eine Komponente von STATISTICA Enterprise, die den Benutzern ermöglicht, verschiedene Aspekte des EnterpriseSystems – einschließlich der Benutzer-Administration, Anpassung der Systemansicht, Daten-Konfigurationen, Analyse-Konfigurationen und Datenbankverwaltung – zu konfigurieren. Dieses Beispiel umfasst: 1. Erstellen eines neuen Benutzers 2. Erstellen einer neuen Gruppe a. Rechte einer Gruppe zuweisen b. Benutzer (siehe Nr. 1) der Gruppe hinzufügen 3. Erstellen eines Knotens in der Systemansicht 4. Erstellen einer neuen Datenbankverbindung 5. Erstellen einer Daten-Konfiguration 6. Erstellen einer Analyse-Konfiguration 7. Ausführen der Analyse-Konfiguration Bevor mit diesem Beispiel begonnen wird, sei auf folgenden Sachverhalt hingewiesen. Im STATISTICA Enterprise Manager bietet das Menü Ansicht die beiden Optionen Systemansicht oder Objektansicht. In der Systemansicht werden Objekte, z. B. Daten-Konfigurationen und Analyse-Konfigurationen als NachfolgerKnoten angezeigt. In der Objektansicht werden Objekte als Nachfolger-Knoten innerhalb der entsprechenden Kategorie angezeigt. In diesem Beispiel wird die Systemansicht gewählt. Rufen Sie den Enterprise Manager auf, und loggen Sie sich als Benutzer ein, der der voreingestellten Administrator-Gruppe angehört. Klicken Sie in der Baumansicht neben dem Knoten Benutzer-Administration auf das Pluszeichen , so dass dieser Knoten geöffnet wird, und wählen Sie dann den Ordner Benutzer. Klicken Sie im Fenster auf der rechten Seite die Schaltfläche Neuer Benutzer, um die Optionen zur Erstellung eines neuen Benutzers aufzurufen. Geben Sie Test STATISTICA-Handbuch – 111 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Benutzer 1 im Feld Name ein. Definieren Sie ein Kennwort, und bestätigen Sie es im darauffolgenden Eingabefeld. Klicken Sie anschließend in der Symbolleiste die Schaltfläche Änderungen festlegen , um die Eingaben durchzuführen. In den nächsten Schritten wird eine Gruppe erstellt, der Gruppe Rechte zugewiesen und der neue Benutzer wird der Gruppe hinzugefügt, so dass dem Benutzer ermöglicht wird, in den Enterprise Manager einzuloggen. Anstatt die Rechte einzelnen Benutzern zuzuweisen, können mit dieser Methode jegliche Änderungen der Rechte direkt auf die Gruppe angewendet werden, so dass die Benutzerverwaltung von STATISTICA Enterprise vereinfacht wird. Wählen Sie im Knoten Benutzer-Administration den Ordner Gruppen, und klicken Sie im Fenster auf der rechten Seite die Schaltfläche Neue Gruppe, um die Optionen aufzurufen, die dem Erstellen einer neuen Gruppe dienen. Geben Sie Test Gruppe 1 im Feld Name ein. Aktivieren Sie im Rahmen Mitglieder das Kontrollkästchen Test Benutzer1. Dies wird den eben erstellten Benutzer der Gruppe hinzufügen. 112 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Aktivieren Sie im Rahmen Gruppenrechte die Kontrollkästchen Analysis Admin und Web User. Klicken Sie in der Baumansicht auf das Pluszeichen , das sich neben dem Knoten Test Gruppe 1 befindet, so dass der Knoten geöffnet wird, und wählen Sie dort Analysemodule. Klicken Sie die Schaltfläche Alle wählen, um alle Module in der Liste Verfügbare Analysemodule auszuwählen. Dies gibt den Benutzern dieser Gruppe die Rechte, in die Web- und DesktopVersion von STATISTICA einzuloggen und alle verfügbaren Analysen und Berichte auszuführen. Klicken Sie in der Symbolleiste die Schaltfläche Änderungen festlegen Eingaben durchzuführen. , um die Wir haben nun die notwendigen Benutzer- und Gruppeneinstellungen durchgeführt, um Analysen und Berichte auszuführen. Wenn in den nächsten Schritten die Daten-, Analyse- und Berichts-Konfigurationen erstellt werden, wird diese Gruppe den Objekten zugewiesen, so dass nur die Benutzer dieser Gruppe die Rechte haben, die Objekte auszuführen. STATISTICA-Handbuch – 113 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Im Folgenden wird ein Knoten in der Systemansicht erstellt, der die Daten-, Analyse- und Berichts-Konfigurationen dieses Beispiels enthalten wird. Klicken Sie in der Baumansicht auf das Pluszeichen , das sich neben dem Knoten Systemansicht befindet, um diesen Knoten zu öffnen. Führen Sie auf dem Ordner STATISTICA Enterprise einen Rechtsklick aus, und wählen Sie in dem dadurch aufgerufenen Kontextmenü die Option Neuer Ordner. Geben Sie Test Beispiel 1 als Name des neuen Ordners im Feld Ordnername ein. Klicken Sie in Symbolleiste die Schaltfläche Änderungen festlegen , um die Eingaben zu bestätigen. Dieser Ordner wird im Folgenden für das Ablegen der Daten-, Analyse- und Berichts-Konfigurationen verwendet. 114 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Führen Sie in der Baumansicht auf dem Knoten Datenbankverbindungen einen Rechtsklick aus, und wählen Sie in dem dadurch aufgerufenen Kontextmenü die Option Neue Datenbankverbindung, um den Dialog Datenverknüpfungseigenschaften aufzurufen. Wählen Sie Microsoft Jet 4.0 OLE DB Provider, und klicken Sie die Schaltfläche Weiter. (Falls der Provider nicht verfügbar sein sollte, besuchen Sie bitte die Seite http://msdn.microsoft.com/en-us/data/aa937712.aspx#MDAC, um einen aktualisierten MDAC- oder Jet-Provider zu installieren. Wiederholen Sie anschließend diesen Schritt, bevor Sie fortfahren.) Klicken Sie im Register Verbindung auf die Schaltfläche, die sich neben dem Feld Geben Sie den Datenbanknamen ein, oder wählen Sie einen aus befindet, und rufen Sie dort den Installationsordner STATISTICA auf (per Voreinstellung C:\Programme\StatSoft\ STATISTICA). Doppelklicken Sie auf die Ordner Examples und anschließend Database. Wählen Sie die Datei ProcessData.mdb, und klicken Sie die Schaltfläche Öffnen. STATISTICA-Handbuch – 115 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Klicken Sie im Register Verbindung auf die Schaltfläche Verbindung testen. Die Benachrichtigung Das Testen der Verbindung war erfolgreich wird angezeigt (falls der Test nicht erfolgreich war, überprüfen Sie bitte Ihre Zugriffsrechte auf die Datei und Ihre MDAC-Installation). Klicken Sie OK, um die Nachricht zu schließen. Bestätigen Sie die in dem Dialog Datenverknüpfungseigenschaften vorgenommenen Eingaben mit OK. Geben Sie in der nachfolgenden Seite den Namen Test Beispiel Verbindung 1 in das Feld Name ein. 116 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Klicken Sie nun in der Symbolleiste die Schaltfläche Änderungen festlegen. Für die erstellte Datenbankverbindung zur Datenbank ProcessData wird im Folgenden eine Daten-Konfiguration erstellt, um die Daten aus der Datenbank zu extrahieren. Führen Sie in der Baumansicht auf dem Ordner Test Beispiel 1 einen Rechtsklick aus, und wählen Sie in dem hierdurch aufgerufenen Kontextmenü die Option Neue Daten-Konfiguration. Geben Sie in der folgenden Seite den Begriff Test Beispiel 1 in das Feld Name ein. Klicken Sie auf den Pfeil, der sich neben dem Feld Verknüpfung befindet, und wählen Sie dann aus der Auswahlliste Test Beispiel Verbindung 1. STATISTICA-Handbuch – 117 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Klicken Sie in der unteren rechten Ecke dieser Seite auf die Schaltfläche Weiter, so dass die Optionen für eine neue Abfrage aufgerufen werden. 118 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Klicken Sie die Schaltfläche SQL-Assistent, um den Dialog Neue Abfrage aufzurufen, der innerhalb von STATISTICA geöffnet wird. Ziehen Sie die Tabelle RAWMAT aus dem Fenster auf der linken Seite in das Grafik-Teilfenster (das Fenster auf der rechten oberen Seite), und wählen Sie in der folgenden Reihenfolge die Felder ID, OPERATOR, LOCATION und HEIGHT. STATISTICA-Handbuch – 119 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Wählen Sie im Register-Teilfenster (untere rechte Seite) das Register Vorschau Daten, und klicken Sie in der Symbolleiste die Schaltfläche Vorschau Daten aktualisieren (das rote Ausrufezeichen). Dies testet die Abfrage, um sicherzustellen, dass von der definierten Abfrage Werte abgerufen werden. Klicken Sie in der Symbolleiste die Schaltfläche Daten an STATISTICA zurückgeben (grüner Pfeil), um diese Abfrage an die Daten-Konfiguration zurückzusenden. Wenn eine Nachricht erscheint, ob der SQL-Ausdruck ausgewertet werden soll, klicken Sie auf die Schaltfläche Ja, so dass die OLE DB-Spalten erstellt werden. 120 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Markieren Sie die Zeile ID, und klicken Sie die Schaltfläche Bearbeiten, um die Optionen aufzurufen, mit denen die ID-Spalte bearbeitet werden kann. Klicken Sie auf den Pfeil, der sich neben dem Feld Auto-Update befindet, und wählen Sie aus der Auswahlliste Erste Update-Spalte. Damit wird ermöglicht, Veränderungen in der ID-Spalte zu erkennen. Darüber hinaus wird die Spalte sortiert. Nach dem Klicken der Schaltfläche Weiter kann die OPERATOR-Spalte bearbeitet werden. Klicken Sie auf die Schaltfläche Filter, um die Filter-Optionen aufzurufen, und aktivieren Sie das Kontrollkästchen Aktiviert, so dass das Filtern anhand der OPERATOR-Spalte ermöglicht wird. STATISTICA-Handbuch – 121 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Klicken Sie die Schaltfläche Weiter, um zu den Bearbeitungsoptionen der OPERATOR-Spalte zurückzukehren, und klicken Sie dort erneut die Schaltfläche Weiter, um die LOCATION-Spalte zu bearbeiten. Rufen Sie mittels der Schaltfläche Filter die Filter-Optionen auf. Aktivieren Sie dort das Kontrollkästchen Aktiviert, um das Filtern der LOCATION-Spalte zu ermöglichen. Kehren Sie mittels der Schaltfläche Weiter zu den Optionen der LOCATION-Spalte zurück. Klicken Sie dort erneut die Schaltfläche Weiter, um die HEIGHT-Spalte zu bearbeiten. Wählen Sie in der Auswahlliste des Feldes Zieltyp die Option Merkmal Messung. Somit wird diese Spalte für die Durchführung von gebündelten SPC-Analysen verfügbar (dies ist die Spalte, die die zu analysierenden Daten enthält). 122 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Als Nächstes klicken Sie die Schaltfläche Weiter, um die Optionen der Zugriffsrechte für dieses Objekt aufzurufen. Wählen Sie in der Liste Vorhandene Benutzer und Gruppen die Test Gruppe1, und klicken Sie dann die obere Schaltfläche , um die Test Gruppe 1 in die Liste Zugriffsrechte zu verschieben. Hierdurch kann diese Daten-Konfiguration von den Benutzern der Test Gruppe 1 ausgeführt (aber nicht bearbeitet) werden. Klicken Sie in der Symbolleiste die Schaltfläche Änderungen festlegen, um diese neue Daten-Konfiguration dem STATISTICA Enterprise Manager dauerhaft hinzuzufügen. Nachdem eine Daten-Konfiguration definiert wurde, die dazu dient, Daten aus der Datenbank ProcessData.mdb zu extrahieren, ist eine Analyse-Konfiguration notwendig, um diese Daten zu analysieren. STATISTICA-Handbuch – 123 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Klicken Sie in der Baumansicht mit der rechten Maustaste auf den Ordner Test Beispiel 1, und wählen Sie in dem Kontextmenü die Option Neue AnalyseKonfiguration, um den Dialog Daten-Konfiguration auswählen aufzurufen. Wählen Sie das Objekt Test Beispiel 1, und klicken Sie die Schaltfläche OK. Wenn ein Dialog aufgerufen wird, der den Hinweis „Bei Auswahl dieser Option werden die Rechte von ‚Analyse’ mit denen aus ‚Daten’ ersetzt“ enthält, bestätigen Sie mit OK. Klicken Sie die Schaltfläche Weiter, um mit dem Erstellen einer AnalyseKonfiguration fortzufahren (das Übernehmen des voreingestellten Namens, der mit dem Namen der Daten-Konfiguration identisch ist, erfolgt hier nur aufgrund der Zweckdienlichkeit). Klicken Sie ein weiteres Mal die Schaltfläche Weiter, um mit der Bearbeitung der Analyse-Konfiguration fortzufahren. 124 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Ändern Sie dann in der aufgerufenen Seite unter SPC Merkmale - HEIGHT den Kartentyp auf Einzelwerte & MR (wie in obiger Abbildung). Da keine weiteren SPC-Optionen konfiguriert werden müssen, wählen Sie in der Baumansicht den Knoten Ablauf-Optionen, und aktivieren in der aufgerufenen Seite das Kontrollkästchen Dialog SQL-Kriterien anzeigen. STATISTICA-Handbuch – 125 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Diese Option legt fest, dass STATISTICA beim Filtern der Spalten, die in der DatenKonfiguration über Filter-Optionen verfügen, einen Hinweis aufruft. (Wenn beim Definieren der Filter-Optionen das Kontrollkästchen Filter erzwungen aktiviert wird, ist dieser Schritt nicht erforderlich, da der Filter-Hinweis dann zwangsläufig beim Ablauf aufgerufen wird – in diesem Beispiel wurde das Kontrollkästchen allerdings nicht aktiviert.) Klicken Sie in der Symbolleiste die Schaltfläche Änderungen festlegen, um diese Analyse-Konfiguration dauerhaft STATISTICA Enterprise hinzuzufügen. 126 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Schließen Sie den Enterprise Manager, und loggen Sie sich in STATISTICA als Test Benutzer 1 ein, der in Schritt 1 erstellt wurde. Wählen Sie im Menü Enterprise die Option Analyse/Bericht ausführen, um den Dialog Analyse oder Bericht starten aufzurufen (je nach Konfiguration kann dieser Dialog auch automatisch aufgerufen werden). Wählen Sie die Analyse Test Beispiel 1, und klicken Sie die Schaltfläche OK, so dass der Dialog SQL-Kriterien aufgerufen wird. Klicken Sie auf den Pfeil, der sich neben dem Feld Spalte befindet, und wählen Sie in der Auswahlliste die Spalte LOCATION. Klicken Sie anschließend die SuchSchaltfläche , um den Dialog Wert von LOCATION aufzurufen, der eine Liste der verfügbaren LOCATION-Werte enthält. Wählen Sie Boston, und bestätigen Sie die Auswahl mit der Schaltfläche OK. STATISTICA-Handbuch – 127 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE Klicken Sie die Schaltfläche Fertigstellen, um das Filtern abzuschließen, die Daten zu extrahieren und um eine gebündelte Analyse der Spalte HEIGHT durchzuführen. Dieses Beispiel illustriert, wie eine Analyse-Konfiguration unter Verwendung der standardmäßigen STATISTICA-Benutzeroberfläche und Ausgabekomponenten erstellt und ausgeführt wird. Eine der wesentlichen Stärken von STATISTICA Enterprise besteht jedoch in dem Bedienkomfort, angepasste Benutzeroberflächen erstellen zu können (z. B. für unterschiedliche Gruppen von Anwendern, die nach ihrer Funktion innerhalb des Unternehmens, ihres Fachwissens oder ihren Datenzugriffsrechten unterteilt werden). Es können auf einfachem Wege angepasste Benutzeroberflächen beliebiger Komplexität erstellt werden; beispielsweise von stark vereinfachten Oberflächen, die lediglich drei Optionen beinhalten ... 128 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE ... bis zu detaillierten Benutzeroberflächen von nahezu unbegrenzter Flexibilität: Für weitere Details und Beispiele siehe die Hilfe zu STATISTICA Enterprise. STATISTICA-Handbuch – 129 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE 130 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE STATISTICA-Handbuch – 131 Copyright © StatSoft, 2009 KAPITEL 3: WEITERFÜHRENDE BEISPIELE 132 – STATISTICA-Handbuch Copyright © StatSoft, 2009 Das STATISTICA-System lässt sich auf verschiedene Weise steuern. Die folgenden Abschnitte fassen die Eigenschaften der wichtigsten Benutzeroberflächen von STATISTICA zusammen: 1. Interaktive Benutzeroberfläche (siehe Seite 136) 2. STATISTICA Visual Basic (siehe Seite 149) 3. Webbrowser-basierte Oberfläche (siehe Seite 150) 4. Microsoft Office-Integration (siehe Seite 152) Man sollte dabei Folgendes beachten: Viele Aspekte dieser Benutzeroberflächen schließen sich nicht gegenseitig aus: Vielmehr kann man sie abhängig von der speziellen Anwendung und den Präferenzen miteinander kombinieren. Mit den gestaltbaren Menüs und Symbolleisten können alternative Benutzeroberflächen integriert werden, um zum Beispiel schnellen Zugang zu Makroprogrammen (Visual Basic) oder häufig benutzten Dateien zu bieten. Nahezu alle Eigenschaften dieser alternativen Benutzeroberflächen können angepasst werden (und damit das Aussehen und Verhalten von STATISTICA verändern); üblicherweise empfiehlt es sich, dass Sie Ihr System entsprechend Ihrer Präferenzen und der Anforderungen der von Ihnen durchzuführenden STATISTICA-Handbuch – 133 Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE Aufgaben anpassen. Damit stellen Sie sicher, dass Sie das Potential von STATISTICA voll ausschöpfen (siehe Anpassen der interaktiven Benutzeroberfläche auf Seite 232). Auch ohne jegliche Anpassungen bieten die Voreinstellungen von STATISTICA alternative Mittel und Lösungen, dieselben Resultate zu erzielen. Dieses Prinzip des „alternativen Zugriffs“ ist in der Benutzeroberfläche allgegenwärtig und erlaubt es, auf unterschiedliche Weise mit STATISTICA zu arbeiten. So kann man auf die üblicherweise am meisten verwendeten Werkzeuge auf alternativen Wegen zugreifen: Über traditionelle Menüs Über Tastaturkombinationen Über Symbolleisten und anzuklickende Felder in der Statusleiste Über angepasste Symbolleisten (benutzerdefinierte Symbolleisten mit Schaltflächen und speziellen Steuerelementen, die Makros und Befehle enthalten können) Über Kontextmenüs, die an bestimmte Objekte gekoppelt sind (Zellen, Teile von Grafiken, Arbeitsmappensymbole) und nach dem Anklicken des Elementes mit der rechten Maustaste erscheinen. Es empfiehlt sich, die alternativen Möglichkeiten der Benutzeroberfläche von STATISTICA auszuprobieren, bevor man sich auf einen Arbeitsstil festlegt. Wie erwähnt kann STATISTICA zu einem Zeitpunkt mehrfach geöffnet sein. Dabei kann jedes Mal derselbe oder ein unterschiedlicher Analysetyp ablaufen (traditionell „Module“ genannt) wie z. B. Elementare Statistik, Multiple Regression 134 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE oder ANOVA. Darüber hinaus können in einer STATISTICA-Anwendung mehrere Analysen gleichzeitig geöffnet sein. Sie können gleicher oder unterschiedlicher Natur sein (z. B. fünf Multiple Regressionen und zwei ANOVAs), und jede von ihnen kann auf derselben oder verschiedenen Datendatei/en aufbauen (mehrere Eingabedateien können gleichzeitig geöffnet sein). Um diese „Multitasking“-Funktionalität optimal auszunutzen, wird die Arbeit in STATISTICA in funktionalen Einheiten, so genannten „Analysen“ organisiert. Diese werden durch Schaltflächen auf der Analyseleiste am unteren Rand des Anwendungsfensters repräsentiert (oberhalb der Statusleiste, wie im Beispiel unten dargestellt: Dort laufen Elementare Statistik, Clusteranalyse und Kanonische Analyse gleichzeitig). Beim Start neuer Analysen werden weitere Schaltflächen hinzugefügt. Zur Steuerung und Konfigurierung dieser Eigenschaft von STATISTICA werden viele Optionen angeboten. Wenn Sie aus einem Ergebnisdialog eine Tabelle oder Grafik auswählen, erscheint standardmäßig die Ausgabe und der Dialog wird automatisch auf die entsprechende Analyseschaltfläche am unteren Rand des Bildschirmes minimiert. Ein Klick auf STATISTICA-Handbuch – 135 Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE diese Schaltfläche (oder die Tastaturkombination STRG+R) nimmt die Analyse wieder auf und zeigt den Dialog an. Eine Reihe von Optionen zum Analysenmanagement ist über das Kontextmenü verfügbar (Zugriff über rechten Mausklick auf die Analyseschaltfläche in der Analyseleiste). Sie beziehen sich auf die entsprechende Analyseschaltfläche (wie oben gezeigt). Benutzer mit großen Bildschirmen können die standardmäßige Minimierung der Analysedialoge abschalten und so die Tatsache ausnutzen, dass die meisten dieser Dialoge klein sind: Sie werden damit permanent auf dem Bildschirm gehalten, ohne dass sie das Betrachten der Analyseergebnisse behindern. Man kann diese Option entweder für eine bestimmte Analyse anpassen (Befehl Automatisches Minimieren im Kontextmenü der Analyseschaltfläche abschalten, siehe oben) oder global für das gesamte Programm (über das Register Analysen/Grafiken im Dialog Optionen, erreichbar über das Menü Extras - Optionen). Laufen mehrere Analysen gleichzeitig, so dass das STATISTICA-Fenster mit Dialogen und Ausgaben überladen wird, kann man alle auf bestimmte Analysen bezogene Fenster verbergen (oder mit dem Befehl Alle Analysen schließen über das Kontextmenü für Analyseschaltflächen schließen); ein weiterer einfacher Weg zur Organisation und Verwaltung der Arbeit besteht darin, die Anwendung STATISTICA ein weiteres Mal zu starten. Obwohl die interaktive Benutzeroberfläche nicht die einzige in STATISTICA verfügbare ist (siehe Kapitel 8 – STATISTICA anpassen, Seite 231 und Kapitel 9 – STATISTICA Visual Basic, Seite 239), ist sie meistens die einfachste Alternative und wird wahrscheinlich am häufigsten benutzt werden. Viele Komponenten dieser Benutzeroberfläche kann man direkt am STATISTICABildschirm erkennen. 136 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE Ähnlich wie bei den meisten Softwareprodukten werden oben im Bildschirm Menüs und verschiedene Symbolleisten angezeigt. Sie lassen sich anpassen und in der für Ihre Aufgaben angemessenen Form anzeigen. Unten im Fenster werden die Analyseleiste (mit den minimierten Dialogen der Analysen und Grafiken) und die Statusleiste angezeigt. Des Weiteren sind Kontextmenüs verfügbar, wenn man an entsprechender Stelle auf die rechte Maustaste drückt. Datendateien können in Tabellen, Arbeitsmappen, Berichten oder individuellen Fenstern angezeigt werden, Ergebnistabellen oder Grafiken in Arbeitsmappen, Berichten oder individuellen Fenstern. Andere Dokumente (z. B. aus Word oder Bitmapdateien) lassen sich ebenfalls in Tabellen, Arbeitsmappen oder Berichten anzeigen. STATISTICA Visual Basic-Code schließlich wird in Makrofenstern angezeigt. Normalerweise wird man nicht gleichzeitig alle diese Möglichkeiten und Werkzeuge nutzen. Die Benutzeroberfläche von STATISTICA lässt sich stets so einfach oder so komplex gestalten, wie Ihre speziellen Bedürfnisse oder Präferenzen es erfordern (siehe Seite 231). Die verschiedenen Werkzeuge und Möglichkeiten werden detailliert im Elektronischen Handbuch beschrieben. Die verschiedenen statistischen und grafischen Prozeduren von STATISTICA können in derselben STATISTICA-Anwendung durchgeführt werden. So ist es zum Beispiel möglich, Residualstatistiken mit Hilfe von Optionen im Modul Multiple Regression zu berechnen und danach den Output sofort in einer Faktorenanalyse oder einem anderen explorativen Modul zu verwenden, ohne eine weitere STATISTICA-Anwendung zu starten. Weitere Informationen zur Verwendung von Ergebnissen als Eingabedaten finden Sie unter Kann man die Ergebnisse einer Analyse dazu verwenden, eine andere Analyse durchzuführen? im Elektronischen Handbuch. Nach der Auswahl einer bestimmten statistischen Prozedur aus den Menüs Statistik, Data Mining oder Grafik wird ein entsprechendes Start-Menü angezeigt (siehe folgende Abbildung; im Statistik-Menü wurde Elementare Statistik gewählt, so dass das Start-Menü Elementare Statistik und Tabellen angezeigt wird). STATISTICA-Handbuch – 137 Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE Jedes Start-Menü enthält eine Liste von Analysetypen, die in dem speziellen Modul verfügbar sind. Klickt man irgendwo in den Bereich außerhalb des Start-Menüs, minimiert es sich automatisch zu einer Schaltfläche in der Analyseleiste. Benutzer mit hochauflösenden Bildschirmen können diese Voreinstellung ändern und die jeweils aufeinanderfolgenden Dialoge auf dem Bildschirm behalten. Falls Sie lieber über Symbolleisten als über Menüs statistische Analysen auswählen möchten, können Sie die Symbolleiste Statistik, die Symbole für alle Module enthält, aktivieren. Dies geschieht mit einem rechten Mausklick auf irgendeine Symbolleiste und anschließender Auswahl von Statistik aus dem Kontextmenü mit der Liste der Symbolleisten. Alternativ kann man Statistik aus dem Menü Ansicht - Symbolleisten wählen. Es lassen sich auch eigene Symbolleisten mit Analyseschaltflächen, die häufig benutzt werden, erzeugen (veranschaulicht auf Seite 147). Weiteres zu Symbolleisten finden Sie unter Symbolleisten – Überblick im Elektronischen Handbuch. Nachdem die gewünschte Analyse aus dem Start-Menü ausgewählt worden ist, wird der Dialog zur Spezifikation der Analyse angezeigt. Dort wählen Sie die zu analysierenden Variablen sowie weitere Optionen und Einstellungen für die durchzuführende Aufgabe. Oft enthalten diese Dialoge zur Verbesserung der Übersichtlichkeit mehrere Register, die die Optionen, Analysen oder Ergebnisse in logische Kategorien unterteilen. 138 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE In einigen einfachen Analysen (wie Deskriptive Statistiken in obiger Abbildung) dient der Dialog zur Analysespezifikation gleichzeitig auch als Dialog zur Auswahl der Ausgabe (z. B. bestimmter Tabellen und Grafiken). Die meisten Analysen haben jedoch separate Dialoge für die Analysespezifikation und Ergebnisse. STATISTICA ermöglicht es, in den Tabellen erweiterte Information bezüglich des Messwert-Typs einer Variablen und des Fallstatus hinzuzufügen. Diese „Metadaten“ können dazu verwendet werden, eine umfassendere Beschreibung des Datensatzes zu erstellen. Hiermit wird bei explorativen Analysen das Durchführen eines Was-wäre-wenn-Szenarios erleichtert und die Darstellung von Fällen in einer Grafik kann bequem vom Benutzer angepasst werden. Einem Fall kann ein sogenannter Fallstatus zugewiesen werden, so dass in Grafiken die Erscheinung von einzelnen Punkten angepasst werden kann, womit das Erkennen von einflussreichen und interessanten Punkten stark vereinfacht wird. Für diese Anpassung ausgewählter Punkte steht eine weite Auswahl von Symbolen und Farben zur Verfügung. Es ist hierbei nicht zwingend notwendig, dass der Fallstatus vor dem Erstellen der Grafik zugewiesen wird, da dies auch in der Grafik mit dem interaktiven Brushing (sofern eine Grafik geöffnet ist, kann diese Option über Befehl Brushing im Menü Ansicht aufgerufen werden) realisiert werden kann. Ein in einer Grafik zugewiesener Fallstatus wird auch in der zugehörigen Tabelle übernommen. Diese Möglichkeit, einen Fallstatus in einer Tabelle oder einer Grafik zuzuweisen, ist eine weitere Vereinfachung der visuellen explorativen Datenanalyse. STATISTICA-Handbuch – 139 Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE Der Messwert-Typ (Skalenniveau) einer Variablen kann explizit festgelegt werden, um anzuzeigen, welche Analysen und Grafiken für diese Variable angemessen sind. Diese Messwert-Typen werden direkt an nachfolgende Analysen und Grafiken weitergereicht, so dass die geeigneten Variablen in diesen Fällen erkannt werden (z. B. werden Variablen des Typs Kategorial in einer Mehrfaktoriellen ANOVA in der Variablenliste der kategorialen Prädiktoren aufgeführt). In allen Dialogen zur Variablenauswahl (wie in der obigen Abbildung) steht die Option Nur geeignete Variablen anzeigen zur Verfügung, die ermöglicht, dass anhand des Messwert-Typs (die in den Dialogen Variablenspezifikationen festgelegt werden, wobei diese Dialoge durch Doppelklick in der Variablenüberschrift aufgerufen werden) eine Vorauswahl getroffen wird. Wenn der Messwert-Typ auf Auto gesetzt wird, entscheidet die gewählte Option unter Automatische Klassifikation der Variablen (die im Register Analyse/Grafik des Dialogs Optionen festgelegt wird - erreichbar über Optionen im Menü Extras), wie STATISTICA den Messwert-Typ automatisch festlegen wird. Das Filtern (erreichbar über Untermenü Daten - Auto-Filter) ist ein schneller und einfacher Weg, einen bestimmten Teil der Daten in der Tabelle darzustellen, ohne die Daten zu sortieren oder einen Teilbereich erzeugen zu müssen. Wenn eine Variable gefiltert wird, werden nur die Werte in der Tabelle angezeigt, die das festgelegte Kriterium erfüllen. Fälle, die das Kriterium nicht erfüllen, werden nicht mehr angezeigt, allerdings nicht aus der Tabelle entfernt (in der folgenden Tabelle werden beispielsweise nur die Fälle aufgeführt, für die Geschlecht = männlich gilt). 140 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE Obwohl diese Fälle ausgeblendet sind, stehen sie weiterhin für die statistischen und grafischen Analysen zur Verfügung. Wie ausführlicher in Kapitel 5 – Fünf Kanäle für die Ausgabe der Analyse (ab Seite 157) und in Beispiel 1: Korrelationen (Seite 11) und Beispiel 2: ANOVA (Seite 34) veranschaulicht, werden die aufeinanderfolgenden Ausgabetabellen und Grafiken per Voreinstellung in Arbeitsmappen ausgegeben. Zusätzlich kann die gesamte Ausgabe in einen Analysebericht geleitet werden (siehe Seite 160), der in einer (als Baumstruktur) wohl organisierten, formatierten und einfach auszudruckenden Form eine spezifische Analyse zusammenfasst. Es ist dabei auch möglich, die Ergebnisse verschiedener Analysen in einen einzigen Bericht zu leiten. Alternativ kann die Ausgabe in einzelne Fenster gelenkt werden. Um die Ausgabeoptionen für eine einzelne Analyse oder Sitzung festzulegen, klicken Sie im Dialog zur Spezifikation der Analyse die Schaltfläche , und wählen Sie im aufgerufenen Menü die Option Ausgabe, so dass der Dialog Analyse/Grafik Ausgabemanager angezeigt wird. Globale Ausgabeoptionen sind verfügbar, wenn man Optionen aus dem Menü Extras wählt und dort auf das Register Ausgabemanager klickt, oder aus dem Menü Datei die Option Ausgabemanager auswählt. Weitere Informationen erhalten Sie aus dem Elektronischen Handbuch. STATISTICA-Handbuch – 141 Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE STATISTICA bietet direkten Zugang zu allen statistischen Analysedialogen über die Menüs Statistik ... ... und Data Mining: 142 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE Der direkte Zugang zu allen Dialogen der grafischen Analyse erfolgt über das Menü Grafik: (Alternativ über die entsprechenden Symbolleisten Statistik, Data Mining und Grafik.) Diese Menüs sind immer aktiv, wenn ein Dokument mit Eingabedaten geöffnet ist. Die Menüs Statistik und Data Mining bieten Zugang zu allen in STATISTICA verfügbaren Analysetypen. Über das Menü Grafik hat man direkten Zugriff auf eine Vielzahl häufig benutzter Grafiktypen (z. B. Scatterplots, Histogramme, Mittelwerte und Fehlerplots) sowie hierarchischen Zugriff auf alle Grafiktypen in STATISTICA einschließlich 2D-Grafiken, 3D-sequentielle und XYZGrafiken, Matrixplots, Iconplots, Grafiken in Kategorien, Benutzerdefinierte Grafiken, Grafiken für Blockdaten und Grafiken für Eingabedaten. Das Menü bietet auch Zugang zu Layouts für mehrere Grafiken. Eine ausführliche Darstellung der verschiedenen Typen von Statistiken und Grafiken bietet STATISTICA im Glossar des Elektronischen Handbuchs. Siehe auch Anhang B: STATISTICA Produktfamilie (Seite 295) für weitere Informationen zu der umfangreichen Auswahl von Anwendungen der Datenanalyse innerhalb der STATISTICA Produktfamilie. Abhängig von den eigenen Präferenzen kann man auswählen, dass alle Analysedialoge minimiert werden, wenn man ein anderes Fenster von STATISTICA oder eine andere Anwendung wählt. Per Voreinstellung ist der Befehl Automatisches Minimieren aktiviert; ist Ihr Bildschirm jedoch groß genug, um mehrere Fenster darzustellen, ist es sinnvoll, diese Option auszuschalten. Damit bleibt der Analysedialog auf dem Bildschirm, während die aus diesem Dialog STATISTICA-Handbuch – 143 Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE erzeugte Ausgabe erstellt wird, und kann sowie eine „Symbolleiste“ genutzt werden, aus der weitere Ausgaben ausgewählt werden können. Seite 136 enthält weitere Informationen zur Anpassung dieser Option. Man kann sehr einfach laufende Analysen und Grafiken fortsetzen (d. h. den aktuellen Dialog der laufenden Analyse wieder in den Vordergrund stellen). Wählen Sie Weiter aus dem Menü Extras Analyse, drücken Sie STRG+R oder klicken auf die entsprechende Schaltfläche in der Analyseleiste. Laufen mehrere Analysen, wählt man die gewünschte Analyse aus dem Menü Extras - Analyse - Analyse/Grafik auswählen aus (siehe folgende Abbildung). Zur Organisation der Fenster verschiedener Analysen können Sie alle Fenster, die zu einer bestimmten Analyse gehören, verbergen, solange diese Analyse nicht aktiv ist. Hierzu wählen Sie Verbergen bei Abwahl aus dem Menü Extras - Analyse - Optionen. Per Voreinstellung ist dieser Befehl nicht aktiviert. Beachten Sie, dass dieser Befehl nur zur Wirkung kommt, wenn Ergebnisse als Einzelfenster ausgegeben werden; Details zur Verwaltung der Ausgabe von Analysen finden Sie in der Darstellung des Ausgabemanagers (Seite 157). Des Weiteren gibt es einen Befehl zum Schließen aller Dokumentfenster, Fenster - Alle schließen (oder STRG+L), und einen Befehl zum Schließen aller Analysen, Extras - Analyse - Alle Analysen beenden. 144 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE Aktivieren Sie Nach oben bei im Menü Extras - Analyse - Optionen, um alle zu einer bestimmten Analyse gehörenden Fenster in den Vordergrund von STATISTICA zu bringen, sobald diese Analyse ausgewählt wird. Über diesen Befehl lassen sich auch einzelne Fenster verschiedener Analysen organisieren. Per Voreinstellung ist der Befehl aktiviert. Beachten Sie, dass dieser Befehl nur zur Wirkung kommt, wenn Ergebnisse als Einzelfenster ausgegeben werden; Details zur Verwaltung der Ausgabe von Analysen finden Sie in der Darstellung des Ausgabemanagers (Seite 157). Auswahl Per Voreinstellung wird im oberen Bereich bestimmter Ergebnisdialoge (wie z. B. bei Multiple Regression - Ergebnisse) ein Feld mit zusammenfassenden Informationen über die Analyse angezeigt. Diese Info-Box lässt sich im Einzelfall durch einen Klick auf das Symbol in der unteren rechten Ecke der Box verbergen. Über den Befehl Info-Box verbergen im Menü Extras Analyse - Optionen kann man die Anzeige aller Info-Boxen global unterdrücken. STATISTICA verwendet sieben unterschiedliche Dokumenttypen: Arbeitsmappen (siehe die Seiten 158 und 185) Tabellen (multimediafähig; siehe Seite 189) Berichte (siehe die Seiten 160 und 194) Grafiken (siehe die Seiten 196 und 207) Makros (STATISTICA Visual Basic; siehe die Seiten 197 und 239) STATISTICA-Projektdateien (siehe Seite 198) Data Miner-Projektdateien (siehe Seite 201) Mit diesen sieben Dokumenttypen lassen sich verschiedene Arten von Daten verwalten, Dateneingaben und -auswertungen durchführen, qualitativ hochwertige Grafiken erzeugen, eigene Anwendungen beliebiger Komplexität entwickeln und formatierte Berichte erstellen. STATISTICA-Handbuch – 145 Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE Auf die zuletzt verwendeten Dokumente kann schnell zugegriffen werden: Klicken Sie auf die STATISTICA Start-Schaltfläche (unten links im Bildschirm) und wählen Dokumente. Im Register Allgemein des Dialoges Optionen (zu erreichen über das Menü Extras Optionen) können Sie festlegen, wie viele zuletzt verwendete Dokumente aufgelistet werden (per Voreinstellung 16). Detaillierte Informationen zu jedem der Dokumenttypen finden Sie in den Überblicken zu Arbeitsmappen, Tabellen, Berichten, Grafiken und Makros ab Seite 185 und im Elektronischen Handbuch. Jeder der oben genannten fünf Typen von STATISTICA-Dokumenten behandelt Daten unterschiedlich. Deshalb bieten sie auch unterschiedliche Optionen zur Anpassung und Verwaltung an. Diese Unterschiedlichkeit spiegelt sich in den Symbolleisten wider, die jeden Dokumenttyp begleiten. Menübefehle und Symbolleisten für jeden der Dokumenttypen werden detailliert im Elektronischen Handbuch erläutert. 146 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE Arbeitsmappen haben keine spezielle Symbolleiste (obwohl die Symbolleiste Standard stets verfügbar ist), weil die jeweils angebotene Symbolleiste vom gerade angezeigten Dokument in der Arbeitsmappe abhängt. Editieren Sie also eine Tabelle, eine Grafik, einen Bericht, ein Makro oder ein Fremddokument (z. B. eine Microsoft Excel-Tabelle) in einer Arbeitsmappe, dann werden die für diesen Dokumenttyp geeigneten Menüs und Symbolleisten zur Verfügung gestellt. Wenn Sie in der Baumstruktur der Arbeitsmappe einen „leeren Knoten“ wählen, wird standardmäßig die Symbolleiste Statistik angezeigt (anstelle einer für einen Dokumenttyp spezifischen Symbolleiste), um die Größe und Proportionen des Arbeitsbereichs der Anwendung zu erhalten. Zusätzlich zu den verschiedenen von STATISTICA angebotenen Symbolleisten können Sie benutzerdefinierte Symbolleisten erstellen. Diese können jeden in STATISTICA verfügbaren Befehl sowie spezielle Steuerelemente (d. h. Schriftart, Schriftgrad, Grafiktyp, etc.) enthalten. Die Symbolleisten können einen beliebigen Namen erhalten und abhängig von einem aktiven Dokumenttyp geöffnet werden. Weiterhin können allen Symbolleisten (einschließlich existierender Symbolleisten) Befehle und bestimmte Steuerelemente hinzugefügt werden. Um eine Symbolleiste zu erstellen oder eine existierende zu verändern, wählen Sie das Register Symbolleisten aus dem Dialog Anpassen, den Sie über das Menü Extras - Anpassen erreichen. Man verändert eine Symbolleiste, indem man einfach einen Befehl aus dem Feld Befehle des Registers Befehle/Makros in die Symbolleiste zieht (siehe folgende Abbildung). STATISTICA-Handbuch – 147 Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE Die Form und Platzierung der Symbolleisten ist leicht zu verändern. Alle Symbolleisten lassen sich an den Bildschirmrändern verankern oder frei positionieren. All diese Optionen ermöglichen es, eigene Symbolleisten zu erzeugen, so dass Sie über eine hoch spezialisierte Benutzeroberfläche verfügen können. Das Elektronische Handbuch enthält einfach nachzuvollziehende Schrittfür-Schritt-Beispiele, die mit diesen Anpassungen vertraut machen. Weitere Einzelheiten finden Sie insbesondere unter Neue Symbolleisten erstellen im Elektronischen Handbuch. Die Anpassung von Menüs ist genauso einfach und wird über das Register Menü des oben gezeigten Dialoges Anpassen durchgeführt (Details finden Sie im Elektronischen Handbuch). 148 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE Die dem Industriestandard folgende Programmiersprache STATISTICA Visual Basic ist in STATISTICA integriert und stellt eine weitere alternative Benutzeroberfläche dar, die die gesamte Funktionalität von STATISTICA umfasst. Sie ist weit mehr als nur eine Programmiersprache zur Erstellung erweiterter Anwendungen. STATISTICA Visual Basic nutzt die Objektmodell-Architektur von STATISTICA voll aus, und man kann über sie jeden Aspekt und nahezu jedes Detail der Funktionalität von STATISTICA per Programmierung steuern. Selbst die kompliziertesten Analysen und Grafiken lassen sich als Visual Basic Makro aufzeichnen. Diese Makros kann man später wiederholt ablaufen lassen, sie editieren oder aus Teilen von ihnen andere Anwendungen zusammensetzen. STATISTICA Visual Basic fügt der umfassenden Standardsyntax von Microsoft Visual Basic einen Vorrat von über 13.000 neuen Funktionen hinzu und stellt damit eine der größten verfügbaren Entwicklungsumgebungen dar. Weitere Informationen zu STATISTICA Visual Basic finden Sie in Kapitel 9 (Seite 239). Eine der Eigenschaften, die die STATISTICA Visual Basic-Umgebung so mächtig machen, ist die Fähigkeit, verschiedene Anwendungen und deren Umgebungen in einem einzigen Makro zu integrieren und zu manipulieren. Beispielsweise könnte man ein STATISTICA Visual Basic-Programm schreiben oder aufzeichnen, das mit dem Modul STATISTICA Zeitreihenanalyse Vorhersagen berechnet und das Programm aus einer Excel-Tabelle oder einem Microsoft Word-Dokument heraus starten. Der Austausch von Informationen zwischen verschiedenen Anwendungen wird erreicht, indem man Visual Basic-Programmen diese Anwendungen als Objekte zur Verfügung stellt. Damit kann man zum Beispiel statistische Analysen mit dem Modul STATISTICA Elementare Statistik aus einem Visual Basic-Programm in Excel heraus ablaufen lassen, indem man innerhalb des Programms ein Objekt vom Typ Statistica.Application deklariert. Nachdem ein Objekt erzeugt wurde, kann das Visual Basic-Programm auf die in diesem Objekt enthaltenen Eigenschaften und Methoden zugreifen. Eigenschaften kann man sich meist als Funktionen vorstellen, Methoden hingegen als STATISTICA-Handbuch – 149 Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE Unterprogramme, die innerhalb des Anwendungsobjektes bestimmte Operationen oder Berechnungen durchführen. STATISTICA-Prozeduren können direkt aus vielen anderen Anwendungen und Programmiersprachen (z. B. C++ und Java) heraus aufgerufen werden. Zusätzlich zu den beiden grundsätzlichen Typen der Benutzeroberfläche, die in den vorherigen Abschnitten beschrieben wurden, bietet die gesamte STATISTICAProduktfamilie die Option an, eine Webbrowser-basierte Benutzeroberfläche zu verwenden. Hierbei können alle Interaktionen mit der Anwendung – einschließlich Datenbankabfragen, Datenmanagement, Datenanalyse oder Data Mining wie auch das Erstellen von Berichten und Teamarbeit – durchgeführt werden, ohne dass irgendeine STATISTICA-Anwendung auf dem lokalen Rechner installiert ist. Sofern eine Internetverbindung besteht, hat man auf diese Weise von nahezu jedem Computer auf dieser Welt Zugriff auf diese Funktionen. Diese alternative Benutzeroberfläche erfordert, dass eine Client-Server-Version der entsprechenden STATISTICA-Anwendung installiert wird. STATISTICA wird mittels WebSTATISTICA Server die komplette Webfähigkeit hinzugefügt, einschließlich der Möglichkeit, STATISTICA interaktiv von einem Webbrowser aus auszuführen. Sofern eine Internetverbindung besteht, wird von nahezu jedem Computer auf dieser Welt der einfache und schnelle Zugriff auf Daten und mächtige analytische Werkzeuge ermöglicht. Dieses Produkt wird mit einer Auswahl von Webbrowser-basierten Benutzeroberflächen (in der Form von Dialogen, die extrem einfach zu navigieren und zu verwenden sind) angeboten, die es ermöglichen, mit einem standardmäßigen Webbrowser Analysen zu spezifizieren und sich Ergebnisansichten erstellen zu lassen. Es werden ebenfalls Tools angeboten, um diese Dialoge anzupassen, um neue, 150 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE benutzerangepasste Oberflächen zu erstellen oder um neue Funktionen hinzuzufügen. Die Oberfläche in dem Webbrowser kann beispielsweise aus einem einfachen Dialog bestehen, der lediglich drei Schaltflächen enthält, wobei das Klicken einer dieser Schaltflächen, eine Serie von Analysen ausführt und detaillierte Berichte erstellt. WebSTATISTICA Server fügt der gesamten Produktlinie von STATISTICA, der Datenanalyse, Data Mining und Qualitätsregelkarten/Six Sigma-Methoden, eine neue Dimension und eine große Anzahl von neuen Anwendungsmöglichkeiten hinzu. WebSTATISTICA Server ist ein hoch skalierbares Anwendungssystem auf Unternehmensebene, das eine webbasierte Datenanalyse und ein Datenbank-Gateway umfasst. Dieses System basiert auf der Technologie der verteilten Verarbeitung und unterstützt vollständig Konfigurationen von mehrstufigen Client-Server-Architekturen. WebSTATISTICA Server bietet die Analyse-, Abfrage-, Berichts- und Grafikfunktionen von STATISTICA über eine einfach zu verwendende, interaktive, standardmäßige Weboberfläche an. Sie wird als eine komplette, zur Installation bereitstehende Anwendung angeboten, die eine interaktive, Webbrowser-basierte („Point-and-Click“) Benutzeroberfläche umfasst, die es Anwendern in entfernten Orten ermöglicht, interaktiv Datensätze zu erstellen, Analysen auszuführen und Analyseergebnisse zu betrachten. Aufgrund seiner offenen Architektur umfasst WebSTATISTICA Server jedoch ebenfalls Development Kit Tools (wobei die gesamten Syntaxkonventionen auf Industriestandards wie VB Script, C++, HTML, XML basieren), die es einer ITAbteilung ermöglichen, alle Hauptkomponenten des Systems anzupassen oder zu erweitern, indem neue Komponenten und/oder unternehmensspezifische Analyseoder Datenbankfunktionen hinzugefügt werden. Das System ist mit allen gebräuchlichen Webserver-Plattformen (z. B. UNIX Apache, Microsoft IIS) kompatibel, funktioniert in Microsoft .NET- als auch Sun/Java-Umgebungen und erfordert keine Anpassungen von vorhandenen Firewall- und Internet/IntranetSicherheitssystemen. Für weitere Informationen siehe Anhang C – WebSTATISTICA, Seite 283. STATISTICA-Handbuch – 151 Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE Wenn Microsoft Office auf dem gleichen Rechner wie STATISTICA installiert ist, können Excel-Tabellen direkt in STATISTICA geöffnet werden und als Datenquellen für Analysen verwendet werden, und Berichte können direkt als Word-Dokumente ausgegeben werden (siehe Beispiel auf Seite 57; siehe auch Seite 165). STATISTICA kann Excel-Dokumente innerhalb der STATISTICA-Arbeitsfläche direkt über den Standarddialog zur Dateiauswahl öffnen. Wenn eine Excel-Arbeitsmappe gewählt wird, erscheint ein Dialog, der die Optionen zur Verfügung stellt, die Daten in eine standardmäßige STATISTICATabelle zu importieren oder das Dokument in Form einer Excel-Datei beizubehalten, so dass ein Excel-Fenster innerhalb von STATISTICA aufgerufen wird. Wenn das Excel-Dokument geöffnet worden ist, hat man den vollen Zugang zu allen Menüs und Symbolleisten, die von Excel unterstützt werden. Die Arbeitsvorgänge wie Bearbeitung/Aktualisierung von Formeln, Änderung von Formaten, Kopieren/Einfügen, Drag&Drop – also alles, was man üblicherweise innerhalb einer Excel-Anwendung durchführt – können nun direkt in STATISTICA ausgeführt werden. Der wichtigste Vorteil der Excel-Integration besteht darin, dass Excel-Dokumente direkt als Datenquelle für Analysen verwendet werden können. Hierzu muss lediglich das Excel-Dokumentfenster im Vordergrund stehen, wenn die Analyse gestartet wird, so dass die Analyse sich automatisch auf die Daten des ExcelDokuments bezieht. Beim Start der Analyse ruft STATISTICA einen Dialog auf, in dem festgelegt werden kann, welcher Bereich des Excel-Dokuments als Datenquelle dienen soll und ob eine bestimmte Zeile oder Spalte für die Variablen- oder Fallnamen verwendet werden soll. Diese Einstellungen werden dem ExcelDokument zugewiesen, so dass sie nur ein einziges Mal festgelegt werden müssen. STATISTICA kann eine Excel-Datei nicht nur als Datenquelle verwenden, sondern auch die Funktion automatische Aktualisierung für diese Dateien verwenden. Wenn aus dem Grafik-Menü eine Grafik mit der Eigenschaft automatischer Aktualisierung erzeugt wird, führen Datenänderungen in der Excel-Datei, entweder durch Eingabe neuer Daten oder veränderter Formeln, auch zu einer aktualisierten Grafik. 152 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE Es können ebenfalls Word-Dokumente innerhalb von STATISTICA geöffnet und bearbeitet werden. Word-Dokumente können mittels des Standarddialogs zur Dateiauswahl geöffnet werden. Wenn eine statistische Analyse durchgeführt wird oder eine Grafik erzeugt wird, kann die Ausgabe in ein Word-Dokument gelenkt werden. Jede beliebige Ausgabe, die in einen STATISTICA-Bericht gesendet werden kann, kann auch in einem WordDokument ausgegeben werden. Analog zu dem Excel-Fenster enthält auch das Word-Fenster alle Symbolleisten und Menüs, die innerhalb der Word-Anwendung aufgerufen werden. Es können demnach innerhalb von STATISTICA alle Formatierungen und Bearbeitungen des Word-Dokuments durchgeführt werden, die von Word unterstützt werden. Wenn eine Tabelle mit Analyseergebnissen an Word gesendet wird, kann STATISTICA die Vorteile der Microsoft Word-Tools zur Tabellenbearbeitung nutzen, wobei die Ergebnistabelle in das entsprechende Format konvertiert wird. Bei mehrseitigen Tabellen kann der Zeilen- bzw. Spaltenumbruch kontrolliert werden. Spalten, welche die Seitenbreite überschreiten, werden umgebrochen. Für jedes (zusammenhängende) Spaltenset werden zunächst alle Zeilen vollständig abgebildet, bevor das (einem Umbruch) folgende Spaltenset dargestellt wird. Diese Lösung ermöglicht die Präsentation dieser Tabellen in Word (inklusive der Möglichkeit, die Tabelle dort zu bearbeiten) und zeigt den gesamten Inhalt der Tabelle korrekt an. Zusätzlich wird eine einwandfreie Druckausgabe sowie Seitennummerierung gewährleistet. STATISTICA-Handbuch – 153 Copyright © StatSoft, 2009 KAPITEL 4: BENUTZEROBERFLÄCHE 154 – STATISTICA-Handbuch Copyright © StatSoft, 2009 Im Verlaufe von Analysen erzeugt STATISTICA Ausgaben in Form von multimediafähigen Tabellen und Grafiken. Es existieren grundsätzlich fünf Kanäle, in die alle Ausgaben gelenkt werden können: 1. STATISTICA-Arbeitsmappen (Seite 158) 2. Einzelfenster (Seite 160) 3. Berichte (Seite 162) 4. Microsoft Word (Seite 165) 5. Das Web (Seite 167) Die vier erstgenannten Ausgabekanäle werden hierbei über den Optionen des Ausgabemanagers (erreichbar über Ausgabemanager im Menü Datei, siehe Seite 23 für weitere Details zum globalen Ausgabemanager im Dialog Optionen und dem Dialog Analyse/Grafik Ausgabemanager). Zusätzlich gibt es eine Vielzahl von Möglichkeiten, die Ausgabe ins Web zu publizieren, abhängig von der verwendeten STATISTICA-Version. Die Ausgabekanäle lassen sich in vielen Kombinationen verwenden (z. B. eine Arbeitsmappe und ein Bericht gleichzeitig) und können auf verschiedene Weisen angepasst werden. Alle in die einzelnen Kanäle ausgegebenen Objekte (Tabellen und Grafiken) können wiederum andere eingebettete und verknüpfte Objekte enthalten, so dass die Ausgabe in STATISTICA hierarchisch organisiert werden kann. Jeder dieser Ausgabekanäle von STATISTICA hat seine besonderen Vorteile, die in den folgenden Abschnitten beschrieben werden. Ein noch umfangreicherer STATISTICA-Handbuch – 157 Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Überblick zu den einzelnen Dokumenttypen, die mit den entsprechenden Ausgabekanälen verbunden sind, folgt in dem nächsten Kapitel (Seite 183). Alle STATISTICA-Dokumente (d. h. Eingabetabellen, Arbeitsmappen, Berichte und Makros), die über einen längeren Zeitraum Ergebnisse Ihrer Analyse ansammeln (z. B. Dateneingabe, -bearbeitung oder Ausgaben), unterstützen die Programmeigenschaft Automatisch speichern, die über das Register Allgemein des Dialogs Optionen konfiguriert werden kann (erreichbar über Optionen im Menü Extras). Diese Einrichtung speichert den Inhalt Ihrer Analyse automatisch (z. B. alle 10 Minuten) und gibt Ihnen damit die Option, Daten wiederzugewinnen, die andernfalls bei einem Stromausfall oder Systemfehler verloren gehen könnten. Arbeitsmappen stellen die Standardform der Ausgabe dar (weitere Information siehe Seite 185). Jedes Ausgabedokument (z. B. eine STATISTICA-Tabelle oder Grafik, aber auch ein Dokument aus Microsoft Word oder Excel) wird als ein Eintrag in der Arbeitsmappe gespeichert. Dokumente können in Hierarchien von Ordnern oder Dokumentknoten (per Voreinstellung wird einer für jede neue Analyse erzeugt) organisiert werden. Über eine Baumansicht lassen sich einzelne Dokumente, Ordner oder ganze Zweige des Baumes flexibel verwalten. 158 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Beispielsweise können Gruppen von Dokumenten (mit Ziehen-und-Ablegen) in das Berichtsfenster oder den Arbeitsbereich der Anwendung kopiert oder verschoben werden. Letzteres bedeutet, dass sie auf dem STATISTICA-„Hintergrund“ in Einzelfenstern angezeigt werden. Ganze Zweige lassen sich in andere Arbeitsmappen einfügen, um spezifische Ordnerstrukturen zu generieren. Technisch gesehen sind Arbeitsmappen Container für ActiveX-Dokumente (siehe Seite 257 oder das Elektronische Handbuch für Information über die ActiveXTechnologie). Arbeitsmappen sind mit vielen fremden Dateiformaten kompatibel (z. B. Microsoft Office-Dokumenten), die in Arbeitsmappen eingefügt und von dort aus editiert werden können. Arbeitsmappen bieten mächtige Optionen zur effizienten Verwaltung selbst extrem großer Ausgabemengen und stellen für Anfänger wie auch für erfahrene Anwender die beste Methode zur Verwaltung der Ausgabe dar. Auf den ersten Blick mag es nachteilig erscheinen, dass Benutzerkommentare (z. B. Hinweise) und zusätzliche Informationen nicht transparent in den „Strom“ der Arbeitsmappenausgabe eingefügt werden können, wie es in Berichten im Textverarbeitungsstil (z. B. einem STATISTICA-Bericht; siehe übernächsten Abschnitt) möglich ist. Allerdings sollte man dabei Folgendes berücksichtigen: Alle STATISTICA-Dokumente können leicht mit Anmerkungen versehen werden, sowohl a) direkt durch Eingabe von Text in Grafiken, Tabellen und Berichten, als auch b) indirekt durch Eingabe von Bemerkungen in das Feld Kommentar im Dialog Dokumenteigenschaften (aufzurufen über das Menü Datei - Eigenschaften) Formatierte Dokumente mit Bemerkungen und Hinweisen (z. B. in Form von Textdateien, STATISTICA-Berichtsdokumenten, WordPad- oder Textverarbeitungsdokumenten) lassen sich an beliebige Positionen der hierarchisch organisierten Ausgabe in der Arbeitsmappe platzieren. Zur Erweiterung der Organisation können Dokumente mit Kommentaren oder zusammenfassenden Bemerkungen auch als Knoten für Gruppen von untergeordneten Objekten dienen, auf die sich die Bemerkungen beziehen. Arbeitsmappen können als HTML-Dateien gespeichert werden, indem im Menü Datei die Option Speichern unter gewählt wird und im folgenden Dialog Speichern unter mittels der Option Webseiten (*.htm; *.html) gespeichert wird. Das Speichern als Webseite erzeugt im STATISTICA-Handbuch – 159 Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN festgelegten Ordner eine HTML-Datei, die mit standardmäßigen Internet-Browsern (wie z. B. Microsoft Internet Explorer) geöffnet werden kann. Wenn eine Arbeitsmappe als Webseite gespeichert wird, erzeugt STATISTICA einen Unterordner, der alle Bilddateien enthält, die in der Webseite verlinkt sind. Die Ausgabe als Webseite enthält eine HTML-basierte Baumansicht, die ermöglicht, zwischen den verschiedenen Arbeitsmappen-Bildern zu navigieren. STATISTICA-Ausgabedokumente können auch direkt in eine Schlange von Einzelfenstern ausgegeben werden. Die Länge der Fenster-Schlange lässt sich im Register Ausgabemanager des Dialoges Optionen (im Datei-Menü über Ausgabemanager erreichbar) einstellen. 160 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Deutlicher Nachteil dieser Ausgabeart ist das Fehlen jeglicher Struktur sowie die Tendenz, das Anwendungsfenster unübersichtlich zu gestalten (man berücksichtige, dass einige Prozeduren mit einem einzigen Mausklick Hunderte von Tabellen und Grafiken erzeugen können). Einer der Vorteile dieser Ausgabemethode ist, dass man auf bequeme Weise die Objekte im STATISTICA-Anwendungsfenster individuell anordnen kann (um z. B. mehrere leicht zu identifizierende „Referenzdokumente“ für den Vergleich mit neuen Ergebnissen zu erstellen). Um diese Wirkung zu erzielen, muss man jedoch diese Ausgabeoption nicht im Voraus konfigurieren und eine große Zahl (oft nicht gewünschter) Einzelfenster, die den Arbeitsplatz unübersichtlich gestalten können, generieren. Anstelle dessen können einzelne in die anderen beiden Kanäle (Arbeitsmappen oder Berichte) gelenkte und dort gespeicherte Ausgabeobjekte bei Bedarf einfach aus ihrer entsprechenden Baumansicht auf den Arbeitsplatz der Anwendung gezogen werden. STATISTICA-Handbuch – 161 Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Das ultimative Ziel beim Durchführen einer Analyse besteht darin, eine aussagekräftige Ergebnisausgabe zu erzeugen, die dazu dient, die Daten zu verstehen. Die Art und Weise, mit der die Ausgabe erzeugt wird, ist von gleicher Bedeutung. STATISTICA bietet eine Vielzahl von Methoden, Berichte zu erzeugen, die den diversen Wünschen der Anwender angepasst sind. Die Berichte in STATISTICA (kurz auf Seite 194 eingeführt) stellen die eher traditionelle Weise der Verwaltung von Output dar, in der jedes Objekt (z. B. eine STATISTICA-Tabelle bzw. -Grafik oder eine Microsoft Excel-Tabelle) sequentiell in einem Dokument in der Art eines Textverarbeitungsprogramms angezeigt wird. Allerdings bietet die Technologie hinter diesem einfachen Editor viel Funktionalität. Z. B. ist der STATISTICA-Bericht wie die im Abschnitt oben beschriebene Arbeitsmappe auch ein ActiveX-Container (Informationen zur ActiveX-Technologie finden Sie auf Seite 257 und im Elektronischen Handbuch), in dem jedes Objekt (nicht nur STATISTICA-Tabellen und Grafiken, sondern auch jedes andere ActiveX-kompatible Dokument wie beispielsweise Excel-Tabellen) aktiv bleibt und deshalb angepasst und von dort aus editiert werden kann. Die offensichtlichen Vorteile dieser Art der Ausgabebehandlung sind zum einen die Möglichkeit, Bemerkungen und Kommentare „zwischen“ den Objekten einzufügen. Zum anderen kann die Ausgabe auf traditionelle Weise schnell durchblättert und 162 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN betrachtet werden, so wie es viele Benutzer gewohnt sind (der Editor unterstützt unterschiedliche Geschwindigkeiten beim Durchblättern und andere Eigenschaften der IntelliMouse). Darüber hinaus beinhaltet nur der Ausgabebericht ein detailliertes Protokoll über alle spezifizierten Optionen wie z. B. ausgewählte Variablen, deren Textwerte und Lange Namen. Der Umfang dieses Protokolls lässt sich hierbei mittels des im Register Ausgabemanager des Dialoges Optionen (im Datei-Menü über Ausgabemanager erreichbar) gewählten Grad der Informationstiefe regeln (siehe Seite 24). Offensichtlicher Nachteil dieser traditionellen Berichte ist jedoch die durch den Formatstil einer Textverarbeitung auferlegte innewohnende flache Struktur, wenngleich dies von einigen Nutzern oder Anwendungen bevorzugt werden mag. Wenn eine STATISTICA-Arbeitsmappe geöffnet wurde, welche die Ergebnisse der Analyse enthält, besteht wohlmöglich der Wunsch, diese in einen Bericht zu transferieren. Die Vorteile für diese Vorgehensweise liegen darin, dass den Objekten Hinweise und Kommentare beigefügt werden können. Außerdem wird ein schnelles Scrollen durch die Ergebnisse ermöglicht, an das sich einige Anwender gewöhnt haben dürften. Darüber hinaus enthält nur der Bericht eine Aufzeichnung der zusätzlichen Informationen (siehe oben). Öffnen Sie eine STATISTICA-Arbeitsmappe. Wenn bislang keine Arbeitsmappe gespeichert wurde, kann eine neue erstellt werden: Überprüfen Sie zunächst, dass im Ausgabemanager (im Datei-Menü über Ausgabemanager erreichbar) die Option Arbeitsmappen gewählt ist. Erstellen Sie dann eine Arbeitsmappe anhand Beispiel 1: Korrelationen (Seite 11) oder Beispiel 2: ANOVA (Seite 34). Wählen Sie hierzu in einer geöffneten Arbeitsmappe alle Dateien aus, d. h., wählen Sie die erste Datei, drücken Sie die UMSCHALT-Taste auf Ihrer Tastatur, und wählen Sie dann die letzte Datei aus. Klicken Sie anschließend die Schaltfläche Zum Bericht, die sich in der Symbolleiste befindet. Alle Dateien der Arbeitsmappe werden somit in einem STATISTICA-Bericht dupliziert. STATISTICA-Handbuch – 163 Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN RTF (Rich Text Format) ist eine Standardmethode von Microsoft zur Kodierung von formatiertem Text/Grafik für einen vereinfachten Transfer zwischen verschiedenen Anwendungen. Wenn Berichte im Rich Text Format (*.rtf) gespeichert werden, werden alle Dateiformatierungen beibehalten, so dass sie von anderen RTF-kompatiblen Anwendungen (z. B. Word) gelesen und interpretiert werden können. Das Format STATISTICA-Berichtsdateien (*.str) folgt den RTF-Konventionen. Das Speichern in dem voreingestellten STATISTICA-Berichtsformat stellt jedoch sicher, dass Berichte mittels STATISTICA geöffnet werden, so dass man den vollen Zugriff auf den Berichtsbaum erhält. Um einen STATISTICA-Bericht in einer anderen RTF-kompatiblen Anwendung zu öffnen, öffnen Sie den Bericht, und wählen Sie Speichern unter aus dem Menü Datei, um den Dialog Speichern unter aufzurufen. Wählen Sie unter Option Dateityp das Format Rich Text Files (*.rtf), geben Sie in dem Feld Dateiname den gewünschten Namen ein, und klicken Sie die Schaltfläche Speichern. Diese Datei kann in jeder beliebigen RTF-kompatiblen Anwendung geöffnet werden. PDF ist die Abkürzung für das Portable Document Format. Dieses Format ist der Industriestandard zum Speichern von Text- und Grafikdaten. PDF bietet eine reichhaltige grafische Aufmachung und Struktur, die dieses Format besonders für den Zweck einer Präsentation ideal erscheinen lässt. Darüber hinaus können PDFDokumente im Bild- und Textmodus angeschaut werden, d. h., dass man wählen kann, ob Daten als formatiertes Bild oder als regulärer Text erscheinen sollen. PDF ist unabhängig von der Plattform und die meisten Betriebssysteme bieten frei verfügbare Anwendungen zur Ansicht von PDF-Dateien (z. B. Adobe Acrobat Reader für Windows und Ghostscript für Linux). PDF wird als akzeptables Speicherformat im Zusammenhang mit Regulierungen wie der Richtlinie FDA 21 CFR Part 11 angesehen. Um einen STATISTICA-Bericht als PDF-Datei zu speichern, öffnen Sie den Bericht und wählen anschließend im Menü Datei den Befehl Speichern als PDF. Der Dialog Ausgabeoptionen wird aufgerufen, in dem festgelegt werden kann, ob Tabellen als 164 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Objekte (wobei die Objektgröße der im Berichtsfenster entspricht) oder Ganzseitige Tabellen (auf separaten Seiten) ausgegeben werden sollen. Wenn die Tabellen stets in gleicher Weise ausgegeben werden sollen, aktivieren Sie das Kontrollkästchen Aktuelle Einstellungen verwenden und diesen Dialog nicht wieder anzeigen . Klicken Sie die Schaltfläche OK, um den Dialog Ausgabeoptionen zu schließen, so dass der Dialog Speicher Bericht als PDF erscheint. Verwenden Sie das Feld Speichern in, um den passenden Zielordner für das zu speichernde Dokument zu wählen. Geben Sie in dem Feld Dateiname einen Namen ein, und klicken Sie die Schaltfläche Speichern. STATISTICA-Berichte, Tabellen und Grafiken können alle als PDFDatei gespeichert werden. Es ist zu beachten, dass dies keine vereinfachten PDF-Dateien (mit komprimierten Bitmaps der entsprechenden Dokumentseiten-Bilder) sind, sondern PDF-Dateien, die alle Funktionalitäten unterstützen, wie z. B. das selektive Kopieren von Text. STATISTICA ermöglicht ebenfalls die direkte Ausgabe als Word-Dokument, die mittels der Office-Integration realisiert wird. Wenn Word innerhalb STATISTICA geöffnet wird, werden Word-Symbolleisten und -Menüs aufgerufen, was mittels der standardmäßigen Schnittstellentechnologie für ActiveX-Dokumente realisiert wird. In STATISTICA können somit alle Formatierungen und Bearbeitungen der Datei durchgeführt werden, die von Word unterstützt werden. Wenn eine Tabelle mit Analyseergebnissen an Word gesendet wird, kann STATISTICA die Vorteile der Microsoft Word-Tools zur Tabellenbearbeitung nutzen, wobei die Ergebnistabelle in das entsprechende Format konvertiert wird. Bei mehrseitigen Tabellen kann der Zeilen- bzw. Spaltenumbruch kontrolliert werden. Spalten, welche die Seitenbreite überschreiten, werden umgebrochen. Für jedes (zusammenhängende) Spaltenset werden zunächst alle Zeilen vollständig abgebildet, bevor das (einem Umbruch) folgende Spaltenset dargestellt wird. Diese Lösung ermöglicht die Präsentation dieser Tabellen in Word (inklusive der Möglichkeit, die Tabelle dort zu bearbeiten) und zeigt den gesamten Inhalt der Tabelle korrekt an. Zusätzlich wird eine einwandfreie Druckausgabe sowie Seitennummerierung gewährleistet. STATISTICA-Handbuch – 165 Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Wie bei standardmäßigen STATISTICA-Berichten (siehe Seite 162) können WordDokumente die zusätzliche Information (z. B. Variablenauswahl, lange Variablennamen usw.) speichern. Um die Ausgabe an ein Word-Dokument zu senden, verwenden Sie die Optionen im Ausgabemanager (aufrufbar über Ausgabemanager im Menü Datei oder über Optionen im Menü Extras, indem dann das Register Ausgabemanager des Dialogs Optionen gewählt wird). In dem Feld Microsoft Word Ausgabe stehen folgende Optionen zur Verfügung: Mehrere Word-Dokumente (für jede Analyse/Grafik), Gemeinsames Word-Dokument (für alle Analysen/Grafiken) oder [Datei auswählen], um ein bereits bestehendes Word-Dokument auszuwählen. Obwohl Word-Dokumente nicht die Baumansicht einer STATISTICA-Arbeitsmappe oder eines STATISTICA-Berichts zur Verfügung stellen, bietet die Ausgabe in Word-Dokumente viele Vorteile. Durch das Senden der Ergebnisse in ein WordDokument erhält man Zugriff auf alle Funktionalitäten von Word, das Dokument weiterzubearbeiten. Zum Beispiel können Vorlagen verwendet werden, um benutzerangepasste Dokumente zu erstellen; eine Inhaltsangabe oder ein Inhaltsverzeichnis können hinzugefügt werden, die Option „Änderungen verfolgen“ kann verwendet werden usw. Wenn eine große Tabelle in ein Word-Dokument eingefügt werden soll, erkennt STATISTICA automatisch, wie viele Variablen auf die einzelnen Seiten passen, so dass die Tabelle in mehrere Word-Tabellen unterteilt wird. Wenn die Tabelle Fallnamen verwendet, werden diese Namen jeweils in der ersten Spalte der jeweiligen Tabelle aufgeführt. Das Senden der Ergebnisse in ein Word-Dokument bietet zusätzliche Vorteile wie z. B. die zusätzliche Druckoptionen (Ausgabe in Datei und Manuell duplex) und die Möglichkeit, die Ergebnisse als Webseiten abzuspeichern. Es mag nützlich erscheinen, einen STATISTICA-Bericht oder eine Arbeitsmappe im Internet zu publizieren, so dass die Ergebnisse begutachtet werden können. Mit STATISTICA ist es nun möglich, Berichte und Arbeitsmappen im HTML-Format abzuspeichern. HTML ist die Abkürzung für Hypertext Markup Language. HTML verwendet Tags zur Kennzeichnung der verschiedenen Elemente eines Dokuments, wie z. B. Text oder Grafiken. 166 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Wählen Sie nach dem Öffnen eines Berichts oder einer Arbeitsmappe aus dem Menü Datei den Befehl Speichern unter, um den Dialog Speichern unter aufzurufen. Wählen Sie in der Liste Dateityp den Eintrag HTML-Dateien (*.html; *.htm), um die Datei im HTM-Format abzuspeichern. Alle Grafiken des Berichts oder der Arbeitsmappe werden in dem Ordner der HTMDatei als *.png-Dateien abgespeichert, wobei folgende Bezeichnungen verwendet werden: reportname_pict0001.png, reportname_pict0002.png usw. Alternativ können die Grafiken als JPG-Dateien abgespeichert werden. Um dies zu bewerkstelligen, muss im Menü Extras der Eintrag Optionen gewählt werden, so dass der Dialog Optionen aufgerufen wird. Wählen Sie das Register Berichte bzw. Arbeitsmappen, abhängig davon welches Dokument Sie als .htm-Dokument speichern möchten. Wählen Sie dort im Rahmen Grafiken in HTML als die Option JPEG-Format und anschließend die Schaltfläche OK. WebSTATISTICA bietet mit dem Knowledge Portal eine weitere Möglichkeit, Berichte zu publizieren. Das Knowledge Portal ermöglicht die Publikation von STATISTICA-Dokumenten (Tabellen, Grafiken, Berichte oder Arbeitsmappen) über das Internet. Anwender mit beschränkten Knowledge-Portal-Rechten können dann diese Dokumente betrachten. Mit den Standardwerkzeugen des WebSTATISTICA Repository lassen sich dann die Rechte für Dokumente und Verzeichnisse setzen, so dass kontrolliert werden kann, wer Zugriff auf die Dokumente erhält. Um Inhalte im Knowledge Portal zu veröffentlichen, muss zunächst im WebSTATISTICA Repository ein Verzeichnis im Ordner Portal angelegt werden. Melden Sie sich in WebSTATISTICA als Benutzer mit Administratorrechten an, und wählen Sie im Menü Datei den Befehl My Directory Operations, um den Dialog WebSTATISTICA My Directory aufzurufen. Die Verzeichnisstruktur dieses Dialoges wird der der folgenden Abbildung ähneln. STATISTICA-Handbuch – 167 Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Um einen Ordner im Verzeichnis Portal zu erstellen, der die Berichte beinhalten soll, wählen Sie den Ordner Portal, und klicken dann die Schaltfläche Create, um den Dialog Explorer User Prompt aufzurufen. Geben Sie in dem Eingabefeld den Verzeichnisnamen Sample Portal Folder ein, und bestätigen Sie mit OK. Ein Dialog wird aufgerufen, der bestätigt, dass das Verzeichnis /Portal/Sample Portal Folder erstellt wurde. Klicken Sie die Schaltfläche Show My Directory, so dass Sie zum Dialog My Directory zurückkehren. Aktivieren Sie das Kontrollkästchen Show Empty Directories, und klicken Sie anschließend die Schaltfläche Refresh. Öffnen Sie das Verzeichnis Portal, indem Sie auf das angrenzende Pluszeichen klicken, so dass der neue Ordner Sample Portal Folder in der Übersicht angezeigt wird. 168 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Die Lese- und Schreibrechte des Ordners lassen sich verwalten, indem in der Übersicht der Ordner Sample Portal Folder markiert wird und dann die Schaltfläche Security gewählt wird. Ihnen stehen dann die WebSTATISTICAOptionen zur Verfügung, die angemessenen Benutzer- und Gruppenrechte zu definieren. Nachdem der Ordner nun erstellt wurde, können Sie dort Analyseergebnisse einfügen, so dass diese für Portal-Anwender mittels WebSTATISTICA oder STATISTICA einsehbar sind. Starten Sie in WebSTATISTICA eine gewöhnliche Analyse. Wählen Sie im WebSTATISTICA-Menü File den Befehl Open Data Spreadsheet. Wählen Sie dann im Dialog Select Data Source in dem Fenster auf der linken Seite den Ordner Datasets und im Fenster auf der rechten Seite die Datei Adstudy.sta, und bestätigen Sie mit OK. Schließen Sie das dadurch aufgerufene Fenster des WebSTATISTICA Spreadsheet Editor (da es in diesem Beispiel nicht benötigt wird), so dass lediglich das Browserfenster geöffnet bleibt, das die Information zur Active Data source der Datei Adstudy.sta darstellt. STATISTICA-Handbuch – 169 Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Wählen Sie aus dem WebSTATISTICA-Untermenü Statistics - Basic Statistics and Tables den Befehl Descriptive Statistics, um den Dialog Descriptive Statistics und den Dialog zur Variablenauswahl aufzurufen. Wählen Sie im Dialog zur Variablenauswahl unter Continuous variables die Variablen MEASURE01 und MEASURE02. Wählen Sie im Dialog Descriptive Statistics unter Detail of computed results reported die Option All results. 170 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Klicken Sie OK, um die Ergebnisse dieser Analyse aufzurufen, die aus mehreren Tabellen und Grafiken bestehen. Bevor Sie diese Seite über das Knowledge Portal publizieren, möchten Sie eventuell die Objekte neu anordnen oder mit Kommentaren versehen. Klicken Sie hierzu die Schaltfläche Edit Page, die sich am oberen Rand dieser Seite befindet. Dies öffnet den Knowledge Portal Interactive Results Editor. STATISTICA-Handbuch – 171 Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN In dem Fenster auf der linken Seite des Editors sind die Objekte aufgelistet, die in der Ergebnisseite aufgeführt werden. In diesem Fall sind es drei Tabellen und vier Grafiken. In dem Fenster auf der rechten Seite wird der Inhalt der Ergebnisseite dargestellt. Das Anfangsobjekt in diesem Fenster ist die Fläche Remaining Items Place Holder. Dies bedeutet, dass alle Elemente, denen kein eindeutiger Platz zugewiesen wurde, hier aufgelistet werden. Da dies momentan das einzige Objekt in diesem Fenster ist, bedeutet dies, dass die drei Tabellen und vier Grafiken in der Ausgabe exakt wie in der ursprünglichen Ergebnisseite dargestellt werden. In diesem Beispiel sollen lediglich Graph2 und Spreadsheet 3, genau in dieser Reihenfolge, in den Ergebnissen aufgeführt werden. Wählen Sie in dem Fenster auf der rechten Seite zunächst das Objekt Remaining Items Place Holder, und entfernen Sie es, so dass diese Seite kein einziges Objekt mehr enthält. Wählen Sie in der Liste auf der linken Seite das Objekt Graph2, und klicken Sie die Schaltfläche Insert Item, um die Grafik auf der Seite einzufügen. Um als Nächstes die Tabelle zu platzieren, müssen Sie unterhalb der Grafik klicken, so dass das nächste Element an diesem Markierungspunkt eingefügt wird. Wählen Sie nun in der Liste das Objekt Spreadsheet3, und klicken Sie auf die Schaltfläche Insert Item. Hierdurch wird die Tabelle unterhalb der Grafik platziert. Beachten Sie hierbei, dass die Elemente, die in der Ergebnisseite aufgenommen werden, in der Objektliste entsprechend markiert werden. 172 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Fügen Sie als Nächstes ein Kommentar zwischen den beiden Objekten ein. Platzieren Sie hierzu den Cursor in der Seitenansicht zwischen den beiden Objekten, und tippen Sie folgenden Text ein: This is Frequency Table results of MEASURE02 from. Um Schriftart und Schriftgrad zu ändern, markieren Sie den Text, den Sie gerade eingegeben haben, und klicken in der Symbolleiste die Schaltfläche A. Wählen Sie Schriftschnitt Bold und einen Schriftgrad von 24, und bestätigen Sie mit OK. STATISTICA-Handbuch – 173 Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Zusätzlich kann man vordefinierte Tags für diese Analyse einfügen. Dies umfasst alle Parameter des Parameterdialogs sowie Tags für das aktuelle Datum, die aktuelle Uhrzeit, den aktuellen Benutzer und den Namen der Datenquelle. Klicken Sie in der Symbolleiste des Knowledge Portal Interactive Results Editor auf die Schaltfläche Variables, um auf die Tags zuzugreifen. In der darunterliegenden Liste werden dann die Tags aufgelistet, die eingefügt werden können. Platzieren Sie den Cursor am Ende des Textes, den Sie gerade eingegeben haben. Wählen Sie das Tag SWS_DataSource, und klicken Sie die Schaltfläche Insert Variable. Somit wird an der momentanen Cursorposition der Name der Datenquelle eingefügt. 174 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Das Tag ist eine spezielle Markierung, die nicht den tatsächlichen Namen der Datenquelle im Editor wiedergibt, der Name der Datenquelle wird allerdings außerhalb des Editor angezeigt. Um eine Vorschau der Seite zu erhalten, können Sie die Schaltfläche Preview wählen. Klicken Sie die Schaltfläche Save, um die modifizierte Seite abzuspeichern. Die Mitteilung Save Succeeded wird angezeigt. Schließen Sie diese Nachricht mit OK und anschließend den Knowledge Portal Interactive Results Editor. Die ursprüngliche Seite wurde aktualisiert, so dass sie die gerade durchgeführten Änderungen beinhaltet. STATISTICA-Handbuch – 175 Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Um die Seite nun zu veröffentlichen, so dass andere Anwender sie über das Knowledge Portal betrachten können, muss die Schaltfläche Publish gewählt werden, die sich in der oberen rechten Ecke des Fensters befindet. Nach dem Klicken der Schaltfläche erscheint der Dialog Publish Destination. Wählen Sie hier den Ordner Sample Portal Folder, der zuvor erstellt wurde. Darüber hinaus können Sie auch die Zugriffsrechte auf diese Seite separat festlegen, indem Sie das Kontrollkästchen I want to define who can access this output page aktivieren. Lassen Sie für dieses Beispiel das Kontrollkästchen deaktiviert, so dass die 176 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Zugriffsrechte des Ordners Sample Portal Folder für dieses Dokument übernommen werden. Klicken Sie die Schaltfläche Next, so dass diese Seite in dem gewählten Zielordner abgespeichert wird. Wenn sich nun Anwender in das Knowledge Portal einloggen, wird der neue Ordner Sample Portal Folder in deren Browser dargestellt, über den Sie die neu hinzugefügte Seite Descriptive Statistics aufrufen können. STATISTICA-Handbuch – 177 Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Mit der Integration von WebSTATISTICA innerhalb der STATISTICADesktopversion können STATISTICA-Dokumente (Tabellen, Grafiken, Berichte und Arbeitsmappen) auch direkt aus STATISTICA in das Knowledge Portal publiziert werden. Der erste Schritt besteht hierin in der Aktivierung der WebSTATISTICA-Integration. Wählen Sie im STATISTICA-Menü Extras den Befehl Optionen, um den Dialog Optionen aufzurufen. Wählen Sie das Register Server / Web, in dem die URL des WebSTATISTICA-Servers festgelegt wird (optional auch benutzerdefinierte Konfigurationseinstellungen, die während der WebSTATISTICA-Installation vom Systemadministrator festgelegt wurden). In der folgenden Abbildung wurde WebSTATISTICA auf serverx23 installiert. Abhängig davon, wo WebSTATISTICA in Ihrem Netzwerk installiert wurde, wird die Information in Ihrem Dialog von der Abbildung abweichen. 178 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Nachdem der Dialog Optionen mittels der Schaltfläche OK geschlossen wurde, erscheint in der STATISTICA-Menüleiste das Menü Server. Wählen Sie im Menü Server den anfangs einzig verfügbaren Befehl Log In. Falls Sie die integrierte Anmeldung aktiviert haben (und Ihr Windows-Benutzerkonto für WebSTATISTICA aktiviert wurde), werden Sie automatisch eingeloggt. Andernfalls erscheint ein Dialog, in dem der WebSTATISTICA-Benutzername und das Passwort abgefragt werden. Nachdem Sie eingeloggt sind, werden die anderen Befehle im Server-Menü verfügbar. Im Folgenden wird eine Analyse durchgeführt, und die Ergebnisse werden anschließend in das Knowledge Portal hochgeladen. Öffnen Sie die Datei Adstudy.sta, indem Sie im Menü Datei den Befehl Beispieldateien öffnen wählen. Führen Sie hierzu im Dialog STATISTICA-Daten öffnen auf dem Ordner Datasets und auf der Datei Adstudy.sta jeweils einen Doppelklick aus. Wählen Sie im Menü Statistik den Befehl Elementare Statistik, um das Startmenü Elementare Statistik und Tabellen aufzurufen, und wählen Sie dort Deskriptive Statistik. Klicken Sie OK, um den Dialog Deskriptive Statistik aufzurufen. STATISTICA-Handbuch – 179 Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Um sicherzustellen, dass alle Ergebnisse dieser Analyse in einer Arbeitsmappe ausgegeben werden, klicken Sie auf der rechten Seite des Dialoges die Schaltfläche Optionen und in der dadurch aufgerufenen Liste den Befehl Ausgabe. Stellen Sie sicher, dass im Analyse/Grafik Ausgabemanager innerhalb des Rahmens Alle Ergebnisse (Tabellen, Grafiken) in: die Option Arbeitsmappen gewählt ist. Klicken Sie dann OK, um zum Dialog Deskriptive Statistik zurückzukehren. Klicken Sie die Schaltfläche Variablen, um den Standarddialog zur Variablenauswahl aufzurufen, und wählen Sie dort die Variablen MEASURE01 und MEASURE02. Klicken Sie anschließend OK, um zum Dialog Deskriptive Statistik zurückzukehren, und wählen Sie im Register Standard die Schaltfläche Zusf.: Statistiken, so dass die Ergebnisse in einer Arbeitsmappe ausgegeben werden. Der Dialog Deskriptive Statistik wird minimiert, so dass die Ergebnisse im Vordergrund stehen. Rufen Sie den Dialog erneut auf, indem Sie in der Analyseleiste auf die Schaltfläche Deskriptive Statistik klicken. Wählen Sie nun die Schaltfläche Histogramme, um für jede einzelne der gewählten Variablen Histogramme zu erstellen. Der Analysedialog wird hierbei erneut minimiert, und die Arbeitsmappe sollte wie folgt aussehen. 180 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN Dies ist das Dokument, dass im Knowledge Portal veröffentlicht werden soll. Wählen Sie im Menü Server den Befehl Save As. Der Dialog WebSTATISTICA Repository wird aufgerufen, der eine Liste von Ordnern enthält, auf die Sie von WebSTATISTICA aus verweisen können. Öffnen Sie den Ordner Portal und den Unterordner Sample Portal Directory, und klicken Sie die Schaltfläche OK. Dies lädt die Arbeitsmappe in das Verzeichnis des Knowledge Portal hoch. Sie können das Dokument von STATISTICA aus betrachten, indem Sie innerhalb des STATISTICA-Fensters den Browser öffnen. Wählen Sie im Menü Server den Befehl Open In Browser, so dass ein neues Browserfenster geöffnet wird. Loggen Sie in WebSTATISTICA ein, und wählen Sie im WebSTATISTICA-Menü Datei den Befehl My Directory Operations. Unter My Directory können Sie zum Sample Portal Directory navigieren, und die Datei Workbook1.stw betrachten, die soeben hochgeladen wurde. Wählen Sie diese Datei, und klicken Sie die Schaltfläche View, so dass die Arbeitsmappe innerhalb des Browsers geöffnet wird. STATISTICA-Handbuch – 181 Copyright © StatSoft, 2009 KAPITEL 5: AUSGABE VON ERGEBNISSEN 182 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE 184 – STATISTICA-Handbuch Copyright © StatSoft, 2009 Arbeitsmappen (ab Seite 158 kurz erläutert) sind der voreingestellte Weg zur Handhabung der Ausgabe. Sie legen für jedes Ausgabedokument (z. B. ein STATISTICA-Datenblatt und eine Grafik oder ein Dokument von Microsoft Word oder Excel) ein Register an. Technisch gesehen sind STATISTICA-Arbeitsmappen optimierte ActiveX-Container (siehe Seite 257), die in effizienter Weise eine große Anzahl von Dokumenten handhaben können. Die Dokumente lassen sich in hierarchischen Ordnern oder Dokumentenknoten (per Voreinstellung wird für jede neue Analyse ein Knoten erstellt) als Baum organisieren, in dem individuelle Dokumente, Ordner oder ganze Zweige flexibel gehandhabt werden können. STATISTICA-Handbuch – 185 Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE Eine Auswahl von Dokumenten lässt sich beispielsweise in das Berichtsfenster (z. B. durch Ziehen-und-Ablegen oder Verschieben) oder in den Anwendungsbereich (d. h. in den Anwendungshintergrund von STATISTICA, wo sie dann als Einzelfenster erscheinen) extrahieren. Ganze Baumabschnitte lassen sich auf verschiedene Weisen in andere Arbeitsmappen verschieben, um eine spezielle Ordnergliederung zu erstellen. Jede Arbeitsmappe enthält zwei Felder: einen Navigationsbaum im Explorer-Stil auf der linken Seite und einen Dokumentbetrachter auf der rechten Seite. Der Navigationsbaum (Arbeitsmappenbaum) lässt sich in viele Knoten untergliedern, die Dateien in logische Gruppen organisieren (z. B. alle Analyseausgaben oder alle für ein Projekt generierten Makros). Mit Registern am Rand des Dokumentbetrachters (Arbeitsmappenbetrachters) können die Dokumente unter einem ausgewählten Knoten leicht durchsucht werden. Durch Anklicken eines Registers und Wahl eines anderen Ortes im Kontextmenü lassen sich die Register der Arbeitsmappe einfach nach oben, rechts oder links versetzen. Ein Vorteil der Seitenplatzierung der Register liegt im Bereitstellen von mehreren Reihen anstelle einer langen (wie nachstehend gezeigt). Dadurch wird die Auswahl des gesuchten Registers erleichtert. Die Anzeige von Registern kann auch zur Platzersparnis unterdrückt werden. Anders als bei vielen Navigations- und Organisationsanwendungen im Explorer-Stil erlaubt die STATISTICA-Arbeitsmappe Töchter für jedes Baumelement. Sie können beispielsweise ein Datenblatt in der Arbeitsmappe anfügen und danach alle auf diese Daten bezogenen Grafiken dem Datenblatt als Töchter zuordnen. Eine Vielzahl von Funktionen für Ziehen-und-Ablegen und die Zwischenablage unterstützen Sie bei der Gestaltung des Arbeitsmappenbaums. 186 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE Die Arbeitsmappe kann alle mit STATISTICA generierten Dokumente enthalten, einschließlich Tabellen, Grafiken, Berichte und Makros. Sie kann auch andere Typen von ActiveX-Dokumenten handhaben, einschließlich Excel-Datenblätter und Word-Dokumente. Diese Dokumente können über den Arbeitsmappenbetrachter bearbeitet werden. Um ein Word-Dokument zu bearbeiten, müssen Sie das Objekt im Baum der Arbeitsmappe anklicken. Das Word-Dokument öffnet sich dann im Anzeigefenster, und die Menüleiste der Arbeitsmappe verbindet sich mit der Menüleiste von Microsoft Word, um Ihnen alle erforderlichen Bearbeitungsfunktionen zugänglich zu machen. Arbeitsmappen lassen sich auch zum Ablegen aller Ausgaben einer bestimmten Analyse nutzen. Der Arbeitsmappenbaum stellt die Gliederung der Dateien und Ordner in der Arbeitsmappe dar. Die Dateien und Ordner werden in einem Format nach ExplorerStil gezeigt. Ein Plus-Zeichen neben Elementen weist auf Ordner oder Dateien mit zugehörigen Töchtern hin. Zum Aufklappen des Baums für einen bestimmten Ordner oder eine Datei muss das Plus-Zeichen angeklickt werden. Die Arbeitsmappe unterstützt eine unbegrenzte Anzahl von Ebenen, und sowohl individuelle Elemente der Baumansicht als auch ganze Zweige lassen sich flexibel (interaktiv) handhaben (z. B. Ziehen mit der rechten Maustaste zum Kopieren oder Verschieben zwischen Arbeitsmappen oder Berichten, wie in der nachstehenden Abbildung rechts gezeigt). Um ein Element der Arbeitsmappe zur Anzeige oder Bearbeitung auszuwählen, führen Sie im Arbeitsmappenbaum einen Doppelklick auf das zugehörige Symbol STATISTICA-Handbuch – 187 Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE aus. Das Dokument wird sich dann im Feld des Arbeitsmappenbetrachters öffnen. Mit den Steuerungsregistern am Rand des Arbeitsmappenbetrachters können Sie auch durch die Elemente des ausgewählten Knotens navigieren. Wie bereits erwähnt, lassen sich diese Steuerungsregister durch Anklicken eines Registers und Wahl eines anderen Ortes im Kontextmenü einfach nach oben, rechts oder links versetzen. Register am Kopf oder Fuß des Anzeigers rollen seitlich, während mehrere Registerreihen beim Platzieren am linken oder rechten Rand erscheinen. Baumelemente werden durch das angrenzende Symbol identifiziert. Das Symbol repräsentiert einen Ordner, der mehrere Dokumente und Unterordner enthalten kann. Das Ordnersymbol mit einem roten Pfeil zeigt an, dass das Skript, das die Ergebnisse erzeugt hat, dem Ordner hinzugefügt wurde. Dies ermöglicht STATISTICA, die Analyse zu wiederholen oder fortzusetzen (für weitere Details siehe Kapitel 9 – STATISTICA Visual Basic). Die Symbole für Tabelle, Bericht, Makro und Grafik repräsentieren jeweils STATISTICA Tabellen-, Berichts-, Makro- und Grafik-Dokumente. Das Symbol Data Miner repräsentiert ein Data Miner-Projekt. Alle Nicht-STATISTICA-Dokumente werden durch ihre jeweiligen Dokumentensymbole repräsentiert. Word-Dokumente beispielsweise werden durch das Word-Symbol repräsentiert, und Excel-Tabellen durch das ExcelTabellen-Symbol. Der Arbeitsmappenbaum lässt sich mit Ziehen-und-Ablegen oder über die Menüleiste organisieren und modifizieren (siehe Arbeitsmappe Ziehen-und-Ablegen und Arbeitsmappe Menüfunktionen im Elektronischen Handbuch). Befehle zum Einfügen, Extrahieren, Umbenennen und Verschieben von Elementen des Arbeitsmappenbaums werden im Kontextmenü angeboten (über die rechte Maustaste überall im Baum aufrufbar). Diese Befehle werden auch im Menü Arbeitsmappe angeboten. 188 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE STATISTICA-Tabellen (auch Datenblätter genannt) basieren auf der StatSofteigenen Technologie für Multimedia-Tabellen und werden zur Handhabung von Eingabedaten sowie der numerischen Ausgabe oder Textausgabe (und optional anderer Ausgabetypen) eingesetzt. Die Grundform des Datenblatts ist eine einfache zweidimensionale Tabelle, die eine nahezu unbegrenzte Anzahl von Fällen (Zeilen) und Variablen (Spalten) verwalten kann, wobei jede Zelle eine nahezu unbegrenzte Anzahl von Zeichen enthalten kann. Klänge, Videos, Grafiken, Animationen, Berichte mit eingebetteten Objekten oder ActiveX-kompatible Dokumente lassen sich ebenfalls einfügen. Da STATISTICA-Tabellen auch Makros und benutzerdefinierte Schnittstellen enthalten können, lassen sich diese Multimedia-Tabellen als Rahmen für angepasste Anwendungen nutzen (z. B. mit einem Listenfeld von Optionen oder einer Serie von Schaltflächen in der oberen linken Ecke), selbstablaufenden Präsentationen, Animationen, Simulationen, usw. STATISTICA-Handbuch – 189 Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE STATISTICA-Dateien sind in Fällen und Variablen angeordnet. Wenn Sie mit dieser Bezeichnung nicht vertraut sind, können Sie Fälle als das Äquivalent von Sätzen in einem Datenbankmanagementprogramm (oder Zeilen eines Datenblatts) auffassen, und Variablen als Äquivalent von Feldern (oder Spalten eines Datenblatts). Jeder Fall besteht aus einer Anzahl von Variablenwerten, und die erste Spalte der Datei enthält (optional) die Fallnamen. Das Tabellenfenster besteht aus verschiedenen Komponenten: Die Kopfleiste zeigt den Namen der Tabelle gefolgt von der Extension (.sta) an. Wenn es sich um eine Eingabetabelle handelt, dann gibt die 190 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE Kopfzeile auch die Anzahl von Variablen und Fällen an (z. B. 25V * 51F). In obiger Abbildung enthält die Kopfleiste den Text Daten: adstudy.sta (25V * 51F). Wählen Sie die gesamte Tabelle durch Anklicken des Info-Felds in der oberen linken Ecke (Mauszeiger ist der übliche Pfeil) des Tabellenfensters aus. Um das Info-Feld selbst (zur Formatierung) anzuwählen, muss einmal in die obere linke Ecke des Info-Felds geklickt werden (Mauszeiger ist ein verbreitertes Pluszeichen ). Per Doppelklick in das Info-Feld lässt sich dort Text bearbeiten oder eingeben (z. B. zusätzliche Einzelheiten zur Tabelle). In obiger Abbildung enthält das InfoFeld den Text Antworten. Unmittelbar über den Variablenköpfen oben im Fenster lässt sich über Doppelklick im Kopfbereich Text bearbeiten oder eingeben. Um nur den Titel anzuwählen (zum Formatieren), klicken Sie einmal in die obere linke Ecke (Mauszeiger ist ein verbreitertes Pluszeichen ). Drücken Sie STRG+EINGABE oder ALT+EINGABE, um eine neue Zeile einzugeben (die Höhe des Feldes muss hierbei erweitert werden, damit die hinzugefügten Zeilen sichtbar werden). In obiger Abbildung enthält der Titel den Text Studie zur Effektivität von Werbung. Diese Zellen auf der linken Seite des Fensters enthalten Informationen für jeden Fall. Per Doppelklick auf einen beliebigen Fallnamen lässt sich dort Text bearbeiten oder eingeben. Um Fallnamen nur zur Formatierung anzuwählen, muss einmal in die linke Seite des Fallnamen geklickt werden (Mauszeiger ist ein verbreitertes Pluszeichen ). Um die gesamte Zeile eines Falls zur Bearbeitung anzuwählen, muss einmal auf die mittlere oder rechte Seite des Fallnamens geklickt werden (Mauszeiger ist ein verbreitertes Pluszeichen mit einem Pfeil ). Um einen Block von Fallnamen (ohne die jeweiligen Zeilen) auszuwählen, klicken Sie auf der linken Seite eines Fallnamens und ziehen anschließend den Mauszeiger, so dass alle gewünschten Fallnamen markiert sind. Zur Veränderung der Feldbreite der Fallnamen führen Sie einen Doppelklick auf die äußere rechte Seite irgendeines Fallnamen aus (Mauszeiger ist ein Kreuz mit einem Doppelpfeil ). In obiger Abbildung enthalten die Zellen als Fallnamen abgekürzte Vornamen sowie die Nachnamen der befragten Personen in der Studie. Fallnamen sind optional und man kann Sie ausblenden (deaktivieren Sie Fallnamen anzeigen im Menü Ansicht). Wenn Sie nicht angezeigt werden, erscheinen die Fallnummern. Diese Zellen am Spaltenkopf enthalten Informationen für jede Variable. Zur Anzeige von Details zu einer einzelnen Variablen führen Sie einen Doppelklick auf die Zelle der Variablennamen aus. Um die Variablennamen STATISTICA-Handbuch – 191 Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE selbst (zur Formatierung) anzuwählen, muss einmal im oberen Bereich der Variablennamen geklickt werden (Mauszeiger ist ein verbreitertes Pluszeichen ). Um die gesamte Variablenspalte (zur Bearbeitung) anzuwählen, muss einmal in den unteren Bereich des Variablennamen geklickt werden (Mauszeiger ist ein verbreitertes Pluszeichen mit einem Pfeil ). Zur Veränderung der Feldbreite der Variablennamen doppelklicken Sie auf die äußere rechte Seite des Variablennamens (Mauszeiger ist ein Kreuz mit einem Doppelpfeil ). In obiger Abbildung enthalten die ersten beiden Zellen der Variablennamen den Text Geschlecht und Produkt. Sie haben die Möglichkeit, die Form der Informationsanzeige der Variablennamen zu verändern, so dass diese die zugehörige Spaltennummer zusammen mit dem langen Variablennamen und/oder einer Abkürzung des Typs der Variablen in der Tabelle anzeigt. Jede dieser Optionen ist im Menü Ansicht Variablenüberschrift abrufbar. Der übrige Bereich der Tabelle enthält Daten, die zu Fällen und Variablen und optional angefügten oder verknüpften Objekten (Multimediaobjekte, Makros, angepasste Benutzeroberfläche) gehören. Texte in Zellen können von nahezu unbegrenzter Länge sein (in den meisten STATISTICA-Konfigurationen sind sie auf 1.000 Zeichen beschränkt, um ein unbeabsichtigtes Kopieren von unerwünscht großen Datenmengen in eine Zelle zu vermeiden). Texte in Zellen lassen sich in vielfacher Weise formatieren, einschließlich der Schriftarten und Schriftattribute. STATISTICA erlaubt das Öffnen und den Gebrauch von mehreren Tabellen zur gleichen Zeit, so dass mit mehreren Eingabetabellen simultan gearbeitet werden kann. Zusätzlich zum Ablegen von Daten benutzt STATISTICA Tabellen zur Darstellung der numerischen Ausgabe für die Analysen. Da STATISTICA nicht zwischen den Funktionen der Eingabetabelle (aus der STATISTICA die Daten entnimmt) und einer Ausgabetabelle (in der die Analyseergebnisse angezeigt werden) unterscheidet, lassen sich die Resultate einer Analyse leicht als Eingabedaten für weitere Analysen verwenden. Jede neu geöffnete Tabelle wird automatisch als Eingabetabelle behandelt, und eine beliebige Anzahl von Eingabetabellen kann gleichzeitig geöffnet sein. Eine Ausgabetabelle (mit den Analyseergebnissen) wird dagegen nicht automatisch Eingabetabelle. Sie muss vor dem Gebrauch für weitere Analysen zuerst als 192 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE Eingabetabelle gekennzeichnet werden. Außerdem zeigen Eingabetabellen in der Kopfleiste die Anzahl von Variablen und Fällen für das Datenblatt an. Die Datei Exp.sta (88V * 48F) ist beispielsweise eine Eingabetabelle, die Datei Exp.sta dagegen nicht. Um eine Ausgabetabelle als Eingabetabelle zu erklären, aktivieren Sie das Datenblatt und wählen Sie im Menü Daten die Option Eingabetabelle. Nun können Sie mit einer Analyse beginnen, und STATISTICA wird dafür die Daten aus der speziellen Eingabetabelle entnehmen. Zu beachten ist, dass beim Umschalten auf ein vorher bereits als Eingabetabelle bezeichnetes Datenblatt jenes ebenfalls weiter für Analysen benutzt werden kann. In einer Arbeitsmappe kann nur eine Tabelle zurzeit für Analysen eingesetzt werden, selbst wenn die Arbeitsmappe mehrere Eingabetabellen enthält. Diese Tabelle wird als aktive Eingabetabelle bezeichnet, und sein Symbol (im Arbeitsmappenbaum) ist rot umrahmt. Falls eine Ausgabetabelle als Eingabetabelle gekennzeichnet wurde, wählt STATISTICA sie automatisch als aktive Eingabetabelle. Um eine andere Eingabetabelle für die aktive Eingabe auszuwählen, wird diese mit Als aktive Eingabedatei verwenden im Menü Arbeitsmappe oder im Kontextmenü des Arbeitsmappenbaums ausgewählt. Es ist ebenfalls möglich, eine aus einer Arbeitsmappe extrahierte Tabelle geöffnet zu lassen, sie jedoch nicht zur Analyse freizugeben. Wählen Sie dafür das Datenblatt aus und deaktivieren Sie den Befehl Eingabetabelle im Menü Daten. Jetzt wird STATISTICA automatisch die zuletzt gewählte Eingabetabelle für die Analyse STATISTICA-Handbuch – 193 Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE wählen und dabei die nicht als Eingabetabelle gekennzeichneten Tabellen ignorieren. Die Berichte in STATISTICA (kurz auf Seite 160 eingeführt) stellen die eher traditionelle Weise der Verwaltung der Ausgabe dar, in der jedes Objekt (z. B. eine STATISTICA-Tabelle oder Grafik, oder eine Microsoft Excel-Tabelle) sequentiell in einem Dokument in der Art eines Textverarbeitungsprogramms angezeigt wird. Allerdings bietet die Technologie hinter diesem einfachen Editor viel Funktionalität. Z. B. ist der STATISTICA-Bericht wie die im Abschnitt oben beschriebene Arbeitsmappe auch ein ActiveX-Container (siehe Seite 257), in dem jedes Objekt (nicht nur STATISTICA-Tabellen und Grafiken, sondern auch jedes andere ActiveX-kompatible Dokument wie Microsoft Word-Dokumente und Bitmap-Abbildungen) aktiv bleibt und deshalb angepasst und von dort aus editiert werden kann. Berichte werden im Dateiformat STR abgelegt. Dies ist eine Erweiterung des Microsoft RTF (Rich Text Format, *.rtf) durch StatSoft. STRDateien beinhalten die RTF-Formatinformationen und zusätzlich die Information für die Baumansicht (die nicht in RTF-Standarddateien gespeichert werden kann). 194 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE Daher werden Berichtsdateien als Standard mit der Extension *.str gespeichert, lassen sich aber auch als RTF-Datei ablegen (wobei die Bauminformation nicht erhalten bleibt). Die offensichtlichen Vorteile dieser Art der Ausgabebehandlung sind zum einen die Möglichkeit, Bemerkungen und Kommentare „zwischen“ den Objekten einzufügen. Zum anderen kann die Ausgabe auf traditionelle Weise schnell durchblättert und betrachtet werden, so wie es viele Benutzer gewohnt sind. Auch beinhaltet nur der Ausgabebericht die zusätzlichen Informationen, die ein detailliertes Protokoll aller für die Analyse spezifizierten Optionen wie z. B. ausgewählte Variablen, ihre Textwerte und Langen Namen liefern [abhängig von dem im Register Ausgabemanager des Dialoges Optionen (erreichbar über das Menü Datei Ausgabemanager) gewählten Grad der Informationstiefe; siehe Seite 24]. Offensichtlicher Nachteil dieser traditionellen Berichte ist jedoch die durch den Formatstil einer Textverarbeitung auferlegte innewohnende flache Struktur, wenngleich dies von einigen Nutzern oder Anwendungen bevorzugt werden mag. Der Berichtsbaum zeigt die Organisation von Dateien im Bericht. Die Dateien werden in einem Format im Explorer-Stil dargestellt. Anders als Arbeitsmappen, die eine beliebige Anzahl von Ebenen unterstützen, umfasst der Bericht allerdings nur eine Dateiebene. Sie können jeden Dokumenttyp von STATISTICA in einen Bericht einbetten, einschließlich Tabellen, Grafiken und Analysen. Zusätzlich zu Dokumenttypen von STATISTICA lassen sich andere Typen von ActiveX-Dokumenten einbetten, z. B. Excel-Datenblätter, Word-Dokumente und Bitmapgrafiken. Diese eingebetteten Dokumente können Sie über Doppelklick bearbeiten. Die Datei öffnet sich dann im Betrachtungsfenster, und die Menüleiste des Berichts verbindet sich mit der Menüleiste der ursprünglichen Anwendung der eingebetteten Datei, um Ihnen alle erforderlichen Bearbeitungsfunktionen zugänglich zu machen. Baumelemente werden durch das angrenzende Symbol identifiziert. Die Symbole Tabelle, Makro und Grafik repräsentieren jeweils Tabellen-, Makro- und Grafikdokumente von STATISTICA. Das Symbol Data Miner repräsentiert ein Data Miner-Projekt. Alle Nicht-STATISTICA-Dokumente werden durch ihre STATISTICA-Handbuch – 195 Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE Dokumentsymbole repräsentiert. Word-Dokumente beispielsweise werden durch das Symbol Word und Excel-Tabellen durch das Symbol Excel repräsentiert. Der Berichtsbaum lässt sich mit Ziehen-und-Ablegen oder über die Menüleiste organisieren und modifizieren. Befehle zum Einfügen, Extrahieren, Umbenennen und Ausschneiden von Elementen des Berichtsbaums werden im Kontextmenü angeboten (über die rechte Maustaste überall im Baum aufrufbar, wie oben dargestellt). Grafikdokumente repräsentieren einen anderen Dokumenttyp von STATISTICA mit einer reichen Funktionalität in Bezug auf die Art der Grafikerstellung und die Auswahl von Anpassungswerkzeugen. STATISTICA-Grafiken sind ebenso wie andere Dokumente ActiveX-Container (siehe Seite 257) und können daher ein breites Spektrum von eingebetteten oder verknüpften Dokumenten beinhalten (z. B. Visio-Zeichnungen, AdobeIllustrationen, Excel-Tabellen). Da STATISTICA-Grafiken ActiveX-Objekte sind, lassen sie sich leicht mit anderen kompatiblen Dokumenten verknüpfen oder in diese einbetten (z. B. in Word-Dokumente). Dort können sie unmittelbar per Doppelklick editiert werden. Grafiken werden detailliert in Kapitel 7 – Grafiken beschrieben. 196 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE Die dem Industriestandard folgende Programmiersprache STATISTICA Visual Basic ist in STATISTICA integriert und stellt eine weitere alternative Benutzeroberfläche dar, die die gesamte Funktionalität von STATISTICA umfasst. STATISTICA-Makros lassen sich in mehreren Formaten speichern, je nach Anwendungsabsicht (siehe STATISTICA Visual Basic Primer und Elektronisches Handbuch für weitere Informationen). Man kann sie auch als Dokumente über die Zwischenablage in andere Programme kopieren. STATISTICA Visual Basic wird ausführlicher in Kapitel 9 (Seite 239) beschrieben. STATISTICA-Handbuch – 197 Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE Bei Durchführung statistischer Analysen und dem Bearbeiten von STATISTICADokumenten tritt häufig die Situation auf, dass viele verschiedene Fenster geöffnet sind und dass sich die verschiedenen Analysen in einem unterschiedlichen Stadium befinden. STATISTICA stellt ein Mittel zur Verfügung, die Arbeitsfläche – einschließlich laufender Analysen – zu speichern. STATISTICA kann während einer Analyse zu jedem beliebigen Zeitpunkt geschlossen werden, öffnet man die Projektdatei wieder, kann die laufende Analyse genau an der Stelle wieder aufgenommen werden, wo sie abgespeichert wurde. Um ein STATISTICA-Projekt zu speichern, wählen Sie im Menü Datei den Befehl Projekt speichern unter, so dass der Dialog STATISTICA-Projekt speichern aufgerufen wird. In diesem Dialog kann der Pfad- und Dateiname der STATISTICA-Projektdatei (mit der Dateiendung .spf) festlegt werden. Es kann ebenfalls festgelegt werden, welche Elemente in das Projekt aufgenommen werden sollen. Alle STATISTICADokumenttypen können ausgewählt werden (Tabellen, Grafiken, Arbeitsmappen, Makros, Berichte, Data Miner-Projekte, In-Place Database-Projekte, Analysen und 198 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE Analyseergebnisse). Für bereits auf Festplatte gespeicherte STATISTICA-Dokumente kann man entweder eine Verknüpfung zur Dokument-Datei erstellen oder eine Kopie des Dokuments innerhalb der STATISTICA-Projektdatei speichern (Dokument in Projekt einfügen). In Projektdateien werden zusätzlich zu den STATISTICA-Dokumenten auch alle laufenden Analysen abgespeichert. Die Projektdatei speichert das aufgezeichnete Skript, das automatisch beim Ausführen der einzelnen Analysen erstellt wird. Wenn das Projekt erneut geöffnet wird, werden die Skripts der Analysen erneut an den Originaldaten ausgeführt. Die Analysedialoge erscheinen am Bildschirm wieder exakt in der gleichen Position, als die Projektdatei gespeichert wurde. Projektdateien stellen einen bequemen Weg dar, laufende Analysen und Ergebnisse zwischen Anwendern zu transferieren, sofern für gespeicherte Dokumente die Option Dokument in Projekt einfügen gewählt wird. Ein Anwender kann die Analysen bis zu einem bestimmten Punkt ausführen, die Projektdatei dann speichern und einem anderen Anwender senden, der die Projektdatei dann öffnen kann und exakt an dem Punkt die Analysen fortsetzen kann, wo der erste Anwender die Analysen stoppte. Sofern die Standardeinstellungen nicht anderweitig konfiguriert werden, ruft STATISTICA beim Schließen des Programms automatisch einen Dialog auf, der die Frage enthält, ob eine Projektdatei gespeichert werden soll, die automatisch beim Start der nächsten STATISTICA-Sitzung aufgerufen wird. STATISTICA erleichtert es demnach, die Analyse am Ende eines Arbeitstages zu beenden, da man beim nächsten Programmaufruf exakt zu diesem Zeitpunkt der Analyse zurückkehrt. Es ist zu beachten, dass einem Projekt der Rang eines STATISTICA-Prozesses zugewiesen wird. Projekte unterscheiden sich demnach von anderen Dokumenten, da nicht mehr als ein Projekt in einem einzelnen STATISTICA-Prozess geöffnet werden kann. Ein weiteres (zweites) Projekt kann allerdings gleichzeitig in einem zweiten STATISTICA-Prozess geöffnet werden. Data Miner Recipe bietet eine Lösung, die die Schritte des Data-Mining-Prozesses in eine ergebnisorientierte Benutzeroberfläche umsetzt. Mittels Data Miner Recipe wird der Anwender von der Datenaufbereitung bis zur Modellvalidierung durch die Analyse geführt, so dass man auf schnellem Wege verwertbare Ergebnisse und STATISTICA-Handbuch – 199 Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE Antworten erhält. STATISTICA Data Miner Recipe wendet die umfassendste Sammlung von Data-Mining-Algorithmen simultan in einem einzelnen Paket an, ohne von dem Anwender zu verlangen, dass er die Details dieser Algorithmen kennt. STATISTICA Data Miner stellt hierbei die größte Bibliothek an Data-MiningMethoden und -Algorithmen zur Verfügung. Allgemein gesprochen fassen diese Algorithmen die Einsichten und Methodologien aus verschiedenen Bereichen wie der Statistik, den Ingenieurwissenschaften, dem Forschungsbereich Künstliche Intelligenz, der Kognitionswissenschaft usw. zusammen, um aus den Daten das Erkennen von Mustern zu „erlernen“, die für Vorhersagen verwendet werden können (über das Versicherungs- oder Kreditrisiko, Prozess- oder Produktqualität, Gerätefehler, medizinische Diagnosen und so weiter). Das Elektronische Handbuch sowie das online verfügbare Elektronische Statistik-Lehrbuch bieten detaillierte Einleitungen zu den verschiedenen Methoden und Techniken, die üblicherweise unter dem Begriff „Data Mining“ zusammengefasst werden. In der Praxis hat sich ergeben, dass unterschiedliche Anwendungsgebiete bzw. Datentypen am besten mittels speziell darauf ausgerichteter Methoden und Algorithmen analysiert werden. Beispielsweise unterscheiden sich die Data-MiningTechniken, die am besten für die Modellierung von Versicherungsschäden geeignet sind, von den Techniken, die für die Prognose von Kraftwerksemissionen vorzuziehen sind. Es gibt jedoch einen typischen Arbeitsablauf – von der Definition der Daten und des Analyseproblems bis zur Stichprobenziehung, Modellbildung und -bewertung – der auf alle Data-Mining-Prognosen anwendbar ist. Die Benutzeroberfläche des Data Miner Recipe ermöglicht selbst Anwendern ohne umfangreiche Erfahrung im Umgang mit Data-Mining-Tools, sehr schnell von der Definition eines Problems zu konkreten verwertbaren Ergebnissen voranzuschreiten. 200 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE In diesem Ansatz folgt man einfach der Benutzeroberfläche, die in ihrer Gestaltung einem „Kochrezept“ ähnelt, um die für die Lösungsfindung notwendigen Schritte zu vervollständigen. Tatsächlich sind hierbei die meisten dieser Schritte vollständig automatisiert, so dass lediglich die Daten und Variablen der Analyse festgelegt werden müssen, während das Programm automatisch die sonstigen Aufgaben erledigt – Festlegen der Lern- und Teststichproben, Durchführung von Feature Selection und verschiedenen Data-Mining-Algorithmen sowie die automatische Evaluierung der Ergebnisse für die Auswahl des besten Data-Mining-Modells. Diese Berechnungen und Analysen können entweder mit der Desktop-Lösung STATISTICA Data Miner oder – falls verfügbar – auf dem WebSTATISTICA Data Miner-Server durchgeführt werden. Es werden stets zwei separate Dateien erstellt, wenn ein Data Miner-Projekt (Data Miner Recipe) gespeichert wird: Eine Data Miner Recipe-Datei mit der Dateinamenserweiterung .dmrproj Eine STATISTICA Arbeitsmappen-Datei mit selbem Namen, allerdings mit der Dateinamenserweiterung .stw, die Ergebnisse und detaillierte Informationen zu den einzelnen Schritten des Projekts enthält STATISTICA-Handbuch – 201 Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE Es ist hierbei wichtig, dass beide Dateien in demselben Ordner abgelegt sind. Wenn also beispielsweise ein Data Miner Recipe-Projekt namens DataMinerProjekt in einen neuen Ordner kopiert, zu einem Kollegen gesendet oder in das STATISTICA Document Management System integriert werden soll, müssen beide Dateien – DataMinerProjekt.dmrproj und DataMinerProjekt.stw – an die neue Zieladresse übermittelt werden. Es folgen einige zusätzliche Details bezüglich dieser beiden Dateien. Diese Datei ist ein XML-Dokument (XML – Extensible Markup Language). Sie enthält alle Informationen zu den Einstellungen, die von dem Anwender (oder von dem Programm automatisch) ausgewählt wurden. Dies umfasst: Informationen zur Datendatei (oder Datenbankverknüpfung) Variablenauswahl und -Metadaten (sind beispielsweise stetige oder kategoriale Prädiktoren definiert worden) Einstellungen zu den einzelnen Schritten der Datenvorverarbeitung (z. B. die Handhabung von Missing Data, das Filtern von Dubletten, Datentransformationen usw.) Abschließende Variablenauswahl basierend auf Algorithmen zur Vorauswahl von Einflussfaktoren Ergebnisse der Modellbildung und die abschließende Bewertung und Auswahl von Modellen Alle notwendigen Informationen zur Anwendung der Modelle für die Vorhersage neuer Fälle (z. B. die Anwendung von Scoring-Verfahren auf Datenbanken und die Berechnung von Faktorwerten, Krankheitsrisiken oder Ausfallwahrscheinlichkeiten usw.) Werden demnach Data Miner Recipes in STATISTICA Enterprise angewendet, um automatisch Vorhersagewerte (z. B. das Automatisieren von Kreditscoring, multivariaten Regelkarten und der Fehleranalyse usw.), Klassifikationen oder Klassifikationswahrscheinlichkeiten (z. B. Ausfallwahrscheinlichkeiten) berechnen zu lassen, ist die gesamte dazu notwendige Information innerhalb dieser XMLDokumente gespeichert. 202 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE Diese Dateien enthalten ausführliche Informationen zu den Ergebnissen der einzelnen Schritte. Die Ergebnisse in dieser Arbeitsmappe stellen eine komplette Dokumentation der Berechnungen und Analysen dar, die während des Data Miner-Projektes durchgeführt wurden. Wenn Data-Mining-Analysen in validierten Umgebungen durchgeführt werden (z. B. gemäß FDA, ISO usw.) oder kritischer Bestandteil des Unternehmensauftrags sind, der unter der Einhaltung bestimmter Standard Operating Procedures (SOPs) erfolgen muss, ist es demnach empfehlenswert, dass diese Datei mitsamt der Data Miner Recipe-Projektdatei (.dmrproj) im STATISTICA Document Management System gespeichert wird. STATISTICA-Handbuch – 203 Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE 204 – STATISTICA-Handbuch Copyright © StatSoft, 2009 STATISTICA-Handbuch – 205 Copyright © StatSoft, 2009 KAPITEL 6: STATISTICA-DOKUMENTE 206 – STATISTICA-Handbuch Copyright © StatSoft, 2009 Die gebräuchlichste Anwendung von Grafiken besteht in der effizienten Darstellung und Übermittlung von Informationen (üblicherweise von numerischen Daten). Grafische Verfahren liefern allerdings auch mächtige analytische Werkzeuge zur Exploration von Daten und Verifikation von Hypothesen. STATISTICA bietet eine umfassende Auswahl von grafischen Methoden zur Datenanalyse und zur Präsentation von Ergebnissen. Alle Grafiken in STATISTICA beinhalten ein breites Spektrum von interaktiven analytischen Verfahren und Anpassungswerkzeugen, die Ihnen eine benutzergerechte Gestaltung aller Darstellungsaspekte ermöglichen. Darüber hinaus sind flexible Möglichkeiten zur Handhabung von Grafiken verfügbar, mit denen sich diverse grafische Darstellungen integrieren und dynamische Verknüpfungen zwischen Anwendungen herstellen lassen (z. B. über OLE - Object Linking and Embedding). Die grafischen Optionen von STATISTICA sind auch über Programmierung zugänglich (mittels der eingebauten STATISTICA Visual Basic oder anderer kompatibler Sprachen), was nahezu unbegrenzte Möglichkeiten zum Erstellen hoch angepasster grafischer Darstellungen eröffnet. Diese benutzerdefinierten Grafiken lassen sich später dauerhaft in die Benutzeroberfläche von STATISTICA einbinden (z. B. durch Hinzufügen einer Schaltfläche in die Symbolleiste oder Eintrag im Menü). STATISTICA-Handbuch – 207 Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN STATISTICA bietet ein Spektrum von Methoden an, mit denen Grafiken aufgerufen oder definiert werden können. Diese Methoden (Grafikkategorien für Rohdaten, Blockdaten und spezialisierte Formen) werden unter Allgemeine Kategorien von Grafiken auf Seite 214 erläutert; sie ergänzen sich gegenseitig, liefern ein hohes Integrationsniveau zwischen Zahlen (wie Rohdaten, Zwischen- oder Endergebnisse) und grafischer Darstellung. Spezialisierte Grafiken lassen sich beispielsweise als Teil der automatischen Ausgabe von statistischen Verfahren aufrufen, aber auch über integrierte Werkzeuge zur Visualisierung beliebiger Zahlenkombinationen (und/oder Labels), die von STATISTICA erstellt oder gezeigt werden. Die Anpassungsoptionen von STATISTICAGrafiken beinhalten Hunderte von Funktionen und Werkzeugen zum Modifizieren eines jeden Darstellungsdetails und der zugehörigen Datenaufbereitung. Diese Optionen sind hierarchisch angeordnet, so dass die meistverwendeten direkt per Doppelklick oder Klicken der rechte Maustaste auf das jeweilige Grafikelement zugänglich sind. Die Voreinstellungen für diese Funktionen lassen sich leicht anpassen, so dass das voreingestellte Erscheinungsbild und das Verhalten von STATISTICA-Grafiken Ihren speziellen Bedürfnissen entsprechen und nur wenige Eingriffe Ihrerseits erfordern. Es gibt mindestens vier verschiedene Wege, um Anpassungen vorzunehmen: Standardeinstellungen von Grafiken lassen sich unmittelbar über die Register Grafik 1 und Grafik 2 des Dialogs Optionen (über das Menü Extras - Optionen zugänglich) anpassen. Die am häufigsten verwendeten Einstellungen lassen sich hier leicht ändern und werden automatisch als voreingestellter Grafikstil (siehe Punkt 2 unten) in der Konfigurationsdatei von STATISTICA gespeichert (verschiedene Voreinstellungen lassen sich beispielsweise für unterschiedliche Projekte nutzen). Zu weiteren Einzelheiten siehe das Elektronische Handbuch zum Register Konfigurations-Manager im Dialog Optionen. 208 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN Alle Eigenschaften, die das Erscheinungsbild der Grafik beeinflussen (von elementaren Eigenschaften wie Schriftfarbe der Fußnote bis zu allgemeinen wie globale Funktionen des Grafikdokuments), können als individuelle „Stile“ gespeichert werden. Diese Stile lassen sich mit benutzerdefinierten Namen versehen und später über einfache Shortcuts (wie spezifische Tastenkombinationen oder Schaltflächen der angepassten Symbolleiste) anwenden. Ein intelligentes System verwaltet diese Tausende von Stilen und deren Kombinationen innerhalb von STATISTICA und minimiert den Anpassungsaufwand. Alle benutzerdefinierten oder modifizierten Stile werden automatisch in der Konfigurationsdatei von STATISTICA gespeichert. Neue Grafiktypen lassen sich auf verschiedene Weise definieren und den Menüs, Dialogen oder Symbolleisten hinzufügen. Wenn eine benutzerdefinierte Grafik für den häufigen Gebrauch nicht von Grund auf neu erstellt wurde (z. B. mit einfachen Grafikmitteln gezeichnet wurde), sondern auf einer Grafik aus dem Grafikmenü basiert und mit einer Kombination vorhandener Anpassungsoptionen erstellt wurde, dann lässt sie sich einfach durch Anklicken von Als Benutzergrafik dem Menü hinzufügen im Register Optionen 2 aller Dialoge für Grafikdefinitionen dem Menü Grafiken als neuer Grafiktyp hinzufügen. Alle benutzerdefinierten Grafikspezifikationen werden automatisch in der Konfigurationsdatei von STATISTICA gespeichert. Es gibt letztendlich keine Grenzen in der Anpassungstiefe von STATISTICA-Benutzergrafiken, da sich mit STATISTICA Visual Basic (mit seinen mächtigen Zeichenwerkzeugen und der STATISTICABibliothek von Grafikverfahren) nahezu alle Grafiken oder MultimediaAusgaben erzeugen lassen, die gegenwärtig von Computer-Hardware unterstützt werden. Solche selbst entwickelten Bilder oder Multimedia-Ausgaben lassen sich den Symbolleisten, Menüs oder Dialogen von STATISTICA hinzufügen und werden so ein dauerhafter Teil Ihrer STATISTICA-Anwendung. Siehe das Elektronische Handbuch zu weiteren Einzelheiten dieser Methoden der Grafikanpassung. Das Elektronische Handbuch enthält auch Themen, die sich den bestimmten Kategorien an Grafiken widmen; dies umschließt konzeptionelle Überblicke und Beispiele typischer Anwendungen. Hierbei werden auch die unterschiedlichen Eigenschaften der entsprechenden Grafiktypen diskutiert. STATISTICA-Handbuch – 209 Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN Die Standardeinstellungen für die meisten in STATISTICA bereitgestellten statistischen Grafiken folgen festen Konventionen, die entweder explizit in der Literatur zu statistischen und technischen Grafiken beschrieben werden oder die den von großen wissenschaftlichen Fachzeitschriften (z. B. SCIENCE) allgemein akzeptierten Standards entsprechen. Nahezu alle Standardeinstellungen von STATISTICA lassen sich anpassen, um den speziellen Anforderungen besonderer Anwendungen gerecht zu werden (siehe Seite 208). Die Grafikfunktionen von STATISTICA sind als flexible „Werkzeuge“ konzipiert, mit denen Effekte jenseits der wohlbekannten Muster und Vorlagen erzeugt werden können. Darüber hinaus lassen sich diese Werkzeuge anpassen, neue Werkzeuge erstellen und beides zur häufigen Verwendung der Symbolleiste oder den Menüs hinzufügen (siehe Seite 208). Zusätzlich zu der umfassenden Auswahl von statistischen und technischen Standardgrafiken enthält STATISTICA zahlreiche Sondertypen an Grafiken und grafischen Anpassungsfunktionen. Da die Statistiker von StatSoft die meisten davon entwickelt haben, sei hier darauf hingewiesen, dass unsere Anwender dabei eine wichtige Rolle gespielt haben. Das vorliegende Spektrum der Grafikoptionen in STATISTICA ist das Resultat von Bemerkungen und „Wunschlisten“, die Tausende von Anwendern an StatSoft weitergaben. Viele Sonderfunktionen von STATISTICA-Grafiken (z. B. Auswahl multipler Teilmengen, dialoggesteuerte Kategorisierung) wurden als Antwort auf Ideen und Fragen von Anwendern eingeführt. StatSoft ist für diesen Beitrag der Anwender sehr dankbar. Wie bereits ausgeführt (und detailliert auf Seite 214 erörtert), gibt es verschiedene Methoden zum Anfordern von STATISTICA-Grafiken. Diese Methoden stellen unterschiedliche Arten von „Schnittstellen“ zwischen Zahlen und Grafiken dar. Die in eine Tortengrafik umgesetzten Zahlen können beispielsweise einfach aufeinanderfolgende Werte aus einer Spalte im Datenblatt darstellen (z. B. die Variable Verkaufszahlen), die mit den Fallnamen Jahr 2002, Jahr 2003, Jahr 2004 usw. versehen sind. Die Zahlen in einer ähnlichen Tortengrafik können dagegen auch Rechenergebnisse repräsentieren. Die Tortensegmente könnten beispielsweise relative Häufigkeiten von Beobachtungsfällen einer bestimmten Kategorie abbilden, die von einem Verfahren der Häufigkeitsklassierung ermittelt wurde (z. B. Anzahl von Jahren mit Verkaufszahlen unter 10 Millionen €, zwischen 10 und 20 Millionen €, und über 20 Millionen €). Ungeachtet der beim Erstellen einer Grafik jeweils eingesetzten Methode (d. h. unabhängig davon, ob die Zahlen in der Grafik aus der Tabelle entnommen oder 210 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN erst berechnet wurden) lassen sich alle Funktionen zur Anpassung von STATISTICA-Grafiken und Handhabung multipler Grafiken bei der Modifikation von Grafiken oder bei deren Einbindung in Dokumente nutzen. Außerdem sind alle integrierten analytischen Funktionen (wie Anpassungsfunktion, Glättung, Rotation, Brushing, analytisches Zoomen) aus einer Grafik heraus in STATISTICA zugänglich und lassen sich unabhängig davon, welche Quelle oder Methode auch immer den jeweiligen Zahlen in der Grafik zugrunde liegt, auf die Grafik anwenden. STATISTICA-Handbuch – 211 Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN Die in STATISTICA angebotenen grafischen Editierfunktionen ermöglichen nicht nur das Erstellen von publikationsfähigen, hoch angepassten wissenschaftlichen und technischen Abbildungen ... ... und präzisen Zeichnungen, ... 212 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN ... sondern auch von präsentationsreifen Illustrationen, Postern, Geschäftsdiagrammen und anderen Abbildungen, ... ... die auf effiziente und ansprechende Weise der Informationsübermittlung dienen. Als Datei gespeicherte oder temporär aus STATISTICA entnommene Grafiken (z. B. in die Zwischenablage kopiert oder mit einem Dokument einer anderen Anwendung verknüpft) sind vollständige „Objekte“ (technisch ausgedrückt, ActiveX-Objekte, siehe Seite 257), die nicht nur alle Anpassungsfunktionen und andere eingebettete Objekte enthalten, sondern auch alle erforderlichen Daten zur weiteren Editierung von Darstellungsaspekten oder zur Analyse seines Inhalts (Anpassung, Glättung, usw.). Da STATISTICA-Grafiken ActiveX-Objekte sind, lassen sie sich leicht mit anderen kompatiblen Dokumenten verknüpfen oder in diese einbetten (z. B. in Excel- oder Word-Dokumente). Dort können sie unmittelbar per Doppelklick editiert werden. STATISTICA-Grafiken sind auch ActiveX-Container und können daher ein breites Spektrum von eingebetteten oder verknüpften Dokumenten beinhalten, wie VisioZeichnungen, Adobe-Illustrationen, Excel-Tabellen oder Word-Dokumente. Darüber hinaus unterstützt STATISTICA Hierarchien von eingebetteten Objekten STATISTICA-Handbuch – 213 Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN auf bis zu vier Ebenen, kann also Dokumente mit darin enthaltenen Dokumenten mit wiederum darin enthaltenen Dokumenten handhaben. Zusätzlich zu den spezialisierten statistischen Grafiken, die in den Ausgabedialogen aller statistischen Verfahren angeboten werden (siehe Seite 226), gibt es zwei allgemeine Kategorien oder Klassen an Grafiken. Diese lassen sich über Menü Grafik, Symbolleiste Grafik, Kontextmenüs und das STATISTICA-Startmenü aufrufen: Grafiken für Eingabedaten (siehe Seite 215 und Menü Grafik, siehe Seite 220) und Grafiken für Blockdaten (siehe Seite 218). Der wichtigste Unterschied zwischen diesen beiden Kategorien besteht in den der Grafik jeweils zugrundeliegenden Daten: Grafiken für Eingabedaten und deren erweiterte Version im Menü Grafik erstellen statistische Zusammenfassungen oder andere Repräsentationen der Rohdaten im aktuellen Eingabedatenblatt (üblicherweise für die gesamte Variable oder deren Untermenge bei aktivierter Fallauswahl). STATISTICA greift beim Erzeugen einer solchen Grafik über ein Kontextmenü aus einer Ergebnistabelle, in der die aktuellen Daten nicht enthalten sind, stets auf die zugehörigen Eingabedaten (Rohdaten) zurück. Wird beispielsweise das Kontextmenü aus einer Zeile einer Korrelationsmatrix heraus geöffnet, lässt sich ein Scatterplot zu den beiden an dieser Korrelation beteiligten Variablen erstellen. Grafiken für Blockdaten sind indessen völlig unabhängig vom Prinzip der „Eingabedaten“ oder der „Datendatei“. Sie liefern ein allgemeines Werkzeug zur Visualisierung von Zahlenwerten im aktuell ausgewählten Block einer Tabelle. Diese Zahlenblocks können benutzerdefinierte Untermengen der numerischen Ausgabe oder der Rohdaten enthalten. Beide Hauptkategorien an Grafiken bieten die gleichen Optionen und die gleiche Typenauswahl an Grafiken. Sie können beispielsweise die gleiche spezielle 214 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN kategorisierte ternäre Grafik aus Rohdaten oder aus einem benutzerdefinierten Block von Werten generieren, der das Resultat eines bestimmten Tests darstellt. Die beiden Hauptkategorien an Grafiken werden in den nachfolgenden zwei Abschnitten kurz erörtert. Danach folgt ein Abschnitt zum Menü Grafik, das eine breite Auswahl von Grafiken der ersten Kategorie enthält (Grafiken für Eingabedaten, auch als Grafiken des Grafik-Menüs bezeichnet), aber auch den Zugriff auf Grafiken für Blockdaten und andere Optionen anbietet. Der Befehl Grafiken für Eingabedaten wird in den Kontextmenüs aller Tabellen angeboten und bietet schnellen Zugang zu den für Eingabedaten häufig benutzten Grafiktypen. Alle diese Grafiken lassen sich auch über das Grafik-Menü, das STATISTICAStartmenü auf der Statusleiste oder über die Schaltfläche Grafikgalerie in einem beliebigen Dialog zur Grafikspezifikation aufrufen. Grafiken für Eingabedaten bieten nicht so viele Optionen wie die zugehörigen Grafiken des Grafik-Menüs. Grafiken für Eingabedaten sind allerdings schneller zugänglich, da sie im Gegensatz zu den Grafiken des Grafik-Menüs: unmittelbar aus dem Kontextmenü eines Datenblatts aufgerufen werden können, STATISTICA-Handbuch – 215 Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN keine Auswahl von Variablen erfordern (die Variablenauswahl wird durch die aktuelle Cursorposition im Datenblatt festgelegt) und keine Optionsauswahl in zwischengeschalteten Dialogen erfordern (die jeweiligen Grafiken werden im Standardformat erzeugt). verarbeiten unmittelbar die Daten aus der aktuellen Eingabedatendatei und beziehen sich stets auf die Variable der aktuellen Cursorposition (bei jeder Tabellenform). Grafiken für Eingabedaten Wenn Sie beispielsweise einen Korrelationskoeffizienten in einer Ergebnistabelle anklicken und eine Grafik Scatterplot mit… generieren, erzeugt STATISTICA einen 2D-Scatterplot aus den Rohdaten der beiden an der Korrelation beteiligten Variablen (siehe Einführungsbeispiel auf Seite 11 zu weiteren Einzelheiten dazu). Obwohl der bequemste Weg zur Auswahl von Grafiken für Eingabedaten über das Kontextmenü des Datenblatts verläuft, können Sie diese ebenfalls aus dem GrafikMenü oder dem Startmenü von STATISTICA aufrufen. Jede Methode wird ein Untermenü erzeugen, aus dem eine auf die aktuelle Variable anwendbare statistische Grafik ausgewählt werden kann (d. h. auf die Variable der aktuellen Cursorposition im Datenblatt). Wenn das Datenblatt ein Matrixformat besitzt oder ein Format, bei dem die Cursorposition auf zwei Variablen statt einer zeigt (wie in der Korrelationsmatrix der nachstehenden Illustration), dann ist die vordefinierte bivariate Grafik für das spezifizierte Variablenpaar direkt im Menü Grafiken für Eingabedaten abrufbar. 216 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN Falls dagegen die aktuelle Cursorposition nur auf eine Variable verweist (wie in der folgenden Abbildung), und Sie eine der bivariaten Grafiken im Menü anwählen, wird STATISTICA zur Auswahl der zweiten Variablen auffordern. Wenn Sie beispielsweise wie in der nachstehenden Illustration einen Scatterplot mit auswählen, wird STATISTICA die Variablenauswahl aufrufen, wo festgelegt werden kann, nach welcher Variablen Messung05 geplottet werden soll. STATISTICA-Handbuch – 217 Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN Wenn mehr als eine Variable im markierten Bereich liegt (d. h., falls ein Block ausgewählt wurde), dann bezieht sich das Menü Grafiken für Eingabedaten auf die erste der gewählten Variablen. Beim Erzeugen von Grafiken für Eingabedaten berücksichtigt STATISTICA die Fallauswahl und Gewichtungsbedingungen für die zu plottenden Variablen im aktuellen Datenblatt (diese lassen sich über die Menübefehle Extras Auswahlbedingungen - Bearbeiten und Extras - Gewichtung spezifizieren). Zu weiteren Informationen über spezifische Typen von Grafiken für Eingabedaten siehe das Elektronische Handbuch. Anders als bei den Grafiken für Eingabedaten greifen die Grafiken für Blockdaten bei der Spezifikation von Daten für die Grafik auf den ausgewählten (geschlossenen) Datenblock der aktiven Tabelle zu. Diese Grafiken sind völlig unabhängig vom Prinzip der „Eingabedaten“. Sie verarbeiten Zahlenwerte je nach Blockauswahl ungeachtet ihrer „Bedeutung“ (die Daten können beispielsweise Rohdaten oder Korrelationskoeffizienten sein). Diese Grafiken dienen in effektiver Weise der Visualisierung, Erkundung und 218 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN Zusammenfassung numerischer Ausgaben der in Ergebnistabellen dargestellten Analysen (z. B. Histogramme von Monte-Carlo-Ausgabewerten im Modul SEPATH, oder ein Boxplot von Randmittelwerten in einer Ergebnistabelle im Modul ANOVA). Obwohl der bequemste Weg zur Auswahl von Grafiken für Blockdaten über das mit dem markierten Block im Datenblatt verbundene Kontextmenü verläuft, lassen sich diese ebenfalls aus dem Grafik-Menü oder dem Startmenü von STATISTICA aufrufen. Wenn Sie Grafiken für Blockdaten erzeugen, können Sie aus Standardgrafiken auswählen (z. B. Histogramm: Blockspalten oder Linienplot: Blockzeile) oder Ihre Benutzergrafik für die ausgewählten oder alle Zellen (d. h. über die markierten Werte im Block hinausgehend) erstellen. Unter Verwendung der Standardgrafiken (die ersten sechs Befehle im Menü Grafiken für Blockdaten, siehe obige Illustration) können spezielle Grafiken durch einen einzelnen Mausklick erstellt werden. Weitere Informationen zu Standardgrafiken finden sich im Elektronischen Handbuch. Über einen der vier Befehle Nutzergrafik wird der Dialog aufgerufen, der viele Optionen zum Erzeugen von angepassten Grafiken anbietet. Grafik auswählen Weitere Informationen zu Nutzergrafiken finden sich im Elektronischen Handbuch. Wie bei den meisten Funktionen von STATISTICA sind Grafiken für Blockdaten voll anpassungsfähig. Wählen Sie Liste anpassen aus dem Menü Grafiken für Blockdaten, um den Dialog Liste der Nutzergrafiken aufzurufen, der Optionen zum Löschen, Umbenennen oder Bearbeiten der aktuellen Grafikliste ebenso wie das Hinzufügen neuer (benutzerdefinierter) Grafiken zum Menü Grafiken für Blockdaten anbietet. Wenn Sie beispielsweise eine Gaußkurve über das mit Histogramm: Block-Spalten erzeugte Histogramm legen wollen, wählen Sie Histogramm: Block-Spalten im STATISTICA-Handbuch – 219 Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN Dialog Liste der Nutzergrafiken, klicken Sie auf Bearbeiten und schalten bei GrafikUntertyp auf mit Normalverteilung um. Alle nachfolgend erzeugten Plots Histogramm: Block-Spalten werden eine Gaußkurve als Anpassung zeigen. Die im Menü Grafik bereitgestellten Optionen stellen eine vollständige Auswahl der in STATISTICA verfügbaren statistischen Grafiken und Anpassungsmöglichkeiten dar. Sie sind nicht nur über das Menü Grafiken zugänglich, sondern auch über das Startmenü STATISTICA und bieten Hunderte von Typen grafischer Darstellung und analytischer Zusammenfassung von Daten an. Anders als bei den Grafiken für Blockdaten (die auch in diesem Menü enthalten sind, damit ein vollständiger Satz grafischer Optionen über einen einzigen Befehl erreichbar ist), sind alle anderen Grafiktypen des Grafik-Menüs nicht auf die Werte in der aktuellen Ausgabetabelle beschränkt. Sie verarbeiten unmittelbar Daten aus dem aktuellen Eingabedatenblatt in gleicher Weise wie die (bereits oben behandelten) Grafiken für Eingabedaten. Sie repräsentieren entweder Standardmethoden zur grafischen Zusammenfassung von Rohdaten (z. B. diverse Scatterplots, Histogramme oder Plots der zentralen Tendenz wie den Median) oder standardisierte grafische Analyseverfahren (z. B. kategorisierte Wahrscheinlichkeitsnetze, trendbereinigte Normalverteilungsplots oder Plots mit Konfidenzintervallen für Regressionslinien). Beim Erzeugen dieser Grafiken berücksichtigt STATISTICA die aktuelle Fallauswahl und Gewichtungsbedingungen der für den Plot ausgewählten Variablen. 220 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN Grafiken des Grafik-Menüs beinhalten 2D-Grafiken, Sequentielle 3D-Grafiken, 3D XYZ-Grafiken, Matrixplots, Iconplots, Grafiken in Kategorien und Benutzerdefinierte Grafiken. Der Kopfbereich des Menüs führt die am häufigsten verwendeten Grafiktypen (Histogramme, Scatterplots, Mittelwerte und Fehlerplots, Flächenplots) auf, während der untere Bereich eine Liste aller Grafiktypen enthält. Wie alle Menüs in STATISTICA lässt es sich leicht anpassen (über das Register Menü im Dialog Bearbeiten, zugänglich im Menü Extras - Anpassen), um die am häufigsten verwendeten Optionen an die bevorzugte Stelle zu positionieren. Siehe hierzu auch Grafiktypen des Grafikmenüs im Elektronischen Handbuch. STATISTICA-Handbuch – 221 Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN Die Grafiken, die aus dem Grafik-Menü heraus erstellt wurden, sind zu einem hohen Grade mit der zugrundeliegenden Tabelle interaktiv. Man kann Punkte in der Grafik auswählen und kennzeichnen, hierbei festlegen, dass sie in der Tabelle, die als Datenquelle dient, hervorgehoben werden – und umgekehrt. Zusätzlich zur Auswahl von Punkten in Grafiken und Tabellen, können in einer Tabelle die Eigenschaften eines Falles festgelegt werden, die bei der Erstellung der Grafik aus den Daten verwendet werden. Diese Eigenschaften umfassen den Stil der Punktmarkierung, die Farbe und ob der Punkt von der Grafik und/oder der Anpassungsrechnung ausgeschlossen werden soll. Um innerhalb einer Grafik mit dem Brushing zu beginnen, klicken Sie in der Symbolleiste auf das Symbol . Alternativ kann man auf dem Hintergrund der Grafik einen Rechtsklick ausführen und im Kontextmenü den Befehl Brushing anzeigen wählen, so dass der Dialog Brushing (siehe Abbildung) aufgerufen wird. Mit der Standardeinstellung Einfach (unter Brushing-Cursor) kann in der Grafik ein Rechteck gezeichnet werden, um die Punkte innerhalb dieses Rechtecks auszuwählen. Die folgende Abbildung illustriert dies für den Beispieldatensatz Adstudy.sta, wobei ein 2D-Scatterplot der Variablen MESSUNG01 vs. MESSUNG02 erstellt wurde. Die drei Punkte in der linken oberen Ecke wurden mittels Brushing ausgewählt, so dass die Punkte in der Grafik sowie die zugrundeliegenden Fälle in der Tabelle, aus der diese Grafik erstellt wurde, hervorgehoben werden. 222 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN Anstatt über die Brushing-Funktion können Fälle alternativ in der Tabelle gewählt werden (durch Klicken auf der linken Seite eines Fallnamens) und die zugehörigen Punkte werden in der Grafik markiert. Siehe die folgende Abbildung, bei der die ersten fünf Fälle in der Tabelle Adstudy.sta ausgewählt wurden. STATISTICA-Handbuch – 223 Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN Der Tabellen-Fallstatus kann entweder von einer Tabelle oder von einer Grafik aus festgelegt werden. In einer STATISTICA-Tabelle kann mittels eines Rechtsklicks auf einen Fallnamen das Kontextmenü aufgerufen werden, das unter anderem die Befehle Aus, Label, Markierte Punkte und Fallstatus enthält. Entsprechende Befehle sind auch in dem Kontextmenü enthalten, das durch einen Rechtsklick auf Punkte in einer Grafik aufgerufen wird. Die Grafik wird diese Optionen verwenden, wenn sie Punkte enthält, die diese Fälle repräsentieren. Wird beispielsweise der Befehl Label gewählt, werden die entsprechenden Punkte mit einem Label versehen (siehe folgende Abbildung). Innerhalb der Tabelle werden die Fälle mit einem FallstatusSymbol versehen, womit angezeigt wird, dass diese Fälle in der Grafik mit Label aufgeführt sind: 224 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN Mittels Rechtsklick auf einem Fallnamen und anschließender Auswahl des Befehls Fallstatus bearbeiten (aus dem Fallstatus-Untermenü) können die Eigenschaften Punkt und/oder Farbe des Falles bearbeitet werden. Man beachte, dass eine Auswahl von Punkten auch für andere Grafiktypen als einen Scatterplot möglich ist. In Histogrammen führt das Brushing durch Anklicken eines Histogrammbalkens zur Auswahl der entsprechenden Fälle in der Tabelle. Entsprechendes gilt für die Boxen innerhalb eines Boxplots. Das Verwenden der Werkzeuge Fallstatus und Brushing bzw. die Auswahl von Punkten ist im Zusammenhang mit der Fallstatus-Option Aus besonders nützlich. Wählen Sie im Menü Daten - Fälle - Fallstatus den Befehl Aus, so wird dieser Fall ausgeschlossen, d. h., dass der Fall nicht mehr in den Berechnungen verwendet und auch nicht in den Grafiken angezeigt wird. Der Fallstatus Aus funktioniert auch in Verbindung mit Tabellen-Fallauswahlbedingungen. Jeder Fall mit Fallstatus Aus wird so interpretiert, als dass er durch Fallauswahlbedingungen ausgeschlossen STATISTICA-Handbuch – 225 Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN wurde. Das Verwenden der Werkzeuge Brushing und Fallstatus ist demnach eine bequeme Möglichkeit, auf interaktive Weise Ausreißer zu entfernen, um dann die Analyse mit den ausgeschlossenen Punkten zu wiederholen. Zusätzlich zur Standardauswahl der Grafiken für Eingabedaten, Grafiken für Blockdaten und Grafiken des Grafik-Menüs (siehe oben) sind andere spezialisierte statistische Grafiken, die sich auf bestimmte Analysetypen beziehen (z. B. Ergebnisse nichtlinearer Regression), unmittelbar aus den jeweiligen Ergebnisdialogen aufrufbar (d. h. Dialoge mit Ausgabeoptionen für die aktuelle Analyse). Die spezialisierten Grafiken werden im Zusammenhang mit den jeweiligen Analysen behandelt, aus denen heraus sie erzeugt werden können; daher finden sich weitere Informationen in den entsprechenden Abschnitten des Elektronischen Handbuchs. 226 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN Die Grafikoptionen von STATISTICA sind auch über das integrierte STATISTICA Visual Basic oder andere kompatible Programmiersprachen zugänglich. Eine in STATISTICA Visual Basic geschriebene Anwendung kann auf drei verschiedene Arten mit Grafiken operieren: Eine neue Grafik erzeugen und dann modifizieren, drucken oder speichern In ein vorhandenes Grafikfenster gehen und es dann modifizieren Eine Grafikdatei öffnen und dann modifizieren, drucken oder speichern Jede in STATISTICA verfügbare Grafik lässt sich über STATISTICA Visual Basic erzeugen und dann mit STATISTICA-Verfahren oder allgemeinen Optionen anpassen, die in dieser umfassenden Sprache angeboten werden. Funktionen zum Aufrufen der Grafikbibliothek von STATISTICA lassen sich - wie alle anderen Funktionen von STATISTICA Visual Basic - über einen hierarchisch gegliederten Funktions-Browser leicht in STATISTICA Visual Basic-Programme STATISTICA-Handbuch – 227 Copyright © StatSoft, 2009 KAPITEL 7: GRAFIKEN einbinden. Er enthält Kurzbeschreibungen aller Funktionen und Optionen für die direkte Einbindung in den Quellcode eigener Programme (d. h. in den STATISTICA Visual Basic-Editor, siehe Seite 243). Weitere Information zum Aufruf der Grafikbibliothek von STATISTICA über die Programmiersprache STATISTICA Visual Basic finden sich im Elektronischen Handbuch. 228 – STATISTICA-Handbuch Copyright © StatSoft, 2009 STATISTICA bietet eine flexible, voll anpassungsfähige Benutzeroberfläche und unterstützt die notwendige Ausrichtung der standardisierten Benutzeroberfläche auf Ihre speziellen Bedürfnisse. Tatsächlich „erahnt“ STATISTICA Ihre Bedürfnisse insofern, als es sich an diverse Ihrer Entscheidungen bei der Auswahl von Optionen „erinnert“ und damit im Verlauf Ihrer Arbeiten „lernt“. Wenn Sie beispielsweise eine Analyse aus dem Register Details im Dialog zur Spezifikation von Analysen aufrufen, dann wird auch beim nächsten Öffnen dieses Dialogs das Register Details für Sie gewählt (statt Register Standard). Nahezu alle Aspekte der Benutzeroberfläche lassen sich anpassen, angefangen von grundlegenden Steuerelementen wie Menüs, Symbolleisten und Tastatur. Der Anpassungsprozess für diese Bildschirmkomponenten ist schnell und direkt (siehe beispielsweise die Beschreibung für die Anpassung der Symbolleiste auf Seite 147). Sie können sowohl globale als auch lokale Anpassungen von Grafiken, Datenblättern, Arbeitsmappen, Berichten usw. vornehmen und unterschiedliche Konfigurationen von STATISTICA einrichten (für Einzelanwender wie für Netzwerke). Außerdem lassen sich völlig neue Benutzeroberflächen erzeugen (siehe Seiten 147 und 149). STATISTICA-Handbuch – 231 Copyright © StatSoft, 2009 KAPITEL 8: ANPASSEN VON STATISTICA Wie bereits ausgeführt, bietet STATISTICA Funktionen zum Erzeugen völlig neuer Benutzeroberflächen an (siehe Seite 147), einschließlich der auf dem InternetBrowser basierenden Benutzeroberflächen (siehe Seite 150). Darüber hinaus lassen sich jedoch auch nahezu alle Aspekte der voreingestellten Benutzeroberfläche auf verschiedene Arten anpassen. Sie können beispielsweise die Standardoptionen ergänzen, vereinfachen oder nach Bedarf fortlaufend verändern. Je nach Anforderungen oder persönlichem „Arbeitsstil“ (und ästhetischer Wahl) lassen sich Symbole, Symbolleisten, Statusbalken, Hauptmenüs, Arbeitsmappen, Ziehen-undAblegen (drag-and-drop), dynamische (automatische) Verknüpfungen zwischen Grafiken und Daten, sowie 3D-Effekte in Tabellen und Dialogboxen unterdrücken. Aufs Wesentliche reduzierte, sequentielle Ausgaben mit einfachen, papierweißen Tabellen und einfarbigen Grafiken können angefordert werden. Das System gibt bei Bedarf jeweils nicht mehr als einen einfachen Bericht zurzeit heraus (siehe linkes Fenster in nachstehender Abbildung). 232 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 8: ANPASSEN VON STATISTICA Alternativ lassen sich sorgfältig ausgearbeitete lokale und globale Symbolleisten definieren. Sie können Farbe, Schriftart und Markierungsbereich des Ausgabefensters gestalten, den Standardstil und die Ausgabeform von Grafiken anpassen und die Ergebnisse in separaten, hierarchisch gegliederten Arbeitsmappen ablegen. Damit schaffen Sie eine „vielschichtige“ Umgebung für Datenanalysen, die eine Erkundung komplexer Datendateien erleichtern und einen Vergleich unterschiedlicher Ausgabeaspekte ermöglichen (siehe rechtes Fenster in der Abbildung oben). Es gibt eine Reihe von spezialisierten Werkzeugen zur Anpassung des Layouts und der Handhabung von STATISTICA-Dokumenten (siehe Kapitel 6 – STATISTICADokumente, Seite 183). STATISTICA besitzt ein sehr umfassendes System zur Bearbeitung von Voreinstellungen für jeden Aspekt einer Grafik und zur Bündelung von Anpassungselementen in hierarchisch gegliederte „Stile“. In gleicher Weise lassen sich benutzerdefinierte Layouts und Formate für Datenblätter (MultimediaTabellen) und benutzerdefinierte Ereignisse (z. B. welche Reaktion beim Doppelklick auf eine Tabelle erfolgt) gestalten. Siehe das Elektronische Handbuch zu weiteren Einzelheiten. Viele Aspekte des Erscheinungsbilds von STATISTICA lassen sich sowohl im Menü Ansicht wie im Menü Extras anpassen. Beide Methoden funktionieren unterschiedlich: Die im Menü Ansicht vorgenommenen Veränderungen wirken sich auf das aktuelle Erscheinungsbild von STATISTICA (z. B. Verbergen der Symbolleiste) oder auf das aktuelle Dokumentenfenster (z. B. veränderter Schrifttyp im Datenblatt) aus. STATISTICA-Handbuch – 233 Copyright © StatSoft, 2009 KAPITEL 8: ANPASSEN VON STATISTICA Die über das Menü Extras - Optionen erreichbaren Optionen (im nachfolgenden Abschnitt ausführlich behandelt) werden zum Anpassen der permanenten Voreinstellungen des Programms eingesetzt. Die globalen Optionen für bestimmte Dokumentarten (z. B. eine Grafik oder eine Tabelle) bewirken keine Veränderung im aktuellen Dokument. Sie werden indessen als Standardeinstellungen des Programms gespeichert, die sich auf die Erzeugung des nächsten (d. h. neuen) Dokuments des jeweiligen Typs auswirken. Wenn Sie beispielsweise das Standard Layout für Datentabellen im Register Tabellen des Dialogs Optionen verändern (im Menü Extras - Optionen verfügbar), werden Sie das neue Datentabellen-Layout erst nach Erzeugung einer neuen Datentabelle sehen können. Diese Standards werden sich hingegen auf keine von der Festplatte geöffneten Dateien auswirken, da diese Tabellen in dem spezifischen Aussehen angezeigt werden, in dem sie vorher gespeichert wurden (benutzen Sie das Menü Ansicht zur Anpassung bestehender Objekte). Die allgemeinen Standardeinstellungen von STATISTICA lassen sich mittels der Optionen in den Registern des Dialogs Optionen (über das Menü Extras - Optionen zugänglich) anpassen. Die Standardeinstellungen steuern: das allgemeine Verhalten von STATISTICA (wie das Maximieren von STATISTICA beim Start, Eigenschaften von Arbeitsmappe und Bericht, Dateiablage oder Benutzerlisten, usw.), die Art der Ausgabenerstellung (z. B. Arbeitsmappen, Berichte usw.), das allgemeine Erscheinungsbild des Anwendungsfensters (Symbole, Symbolleisten, usw.) und das Aussehen von Dokumentenfenstern. Die folgende Abbildung zeigt das Register Allgemein des Dialogs Optionen. 234 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 8: ANPASSEN VON STATISTICA Diese und andere allgemeinen Einstellungen sind unabhängig vom Typ des aktiven Dokumentenfensters (z. B. Tabelle oder Grafik) zugänglich. Zu weiteren Informationen über einzelne Register des Optionen-Dialogs siehe das Elektronische Handbuch. Im Register Konfigurations-Manager des Dialogs Optionen werden Optionen zur Handhabung von „Bibliotheken“ von Einstellungen angeboten, zwischen denen für verschiedene Projekte (oder Benutzer) umgeschaltet werden kann. Zu weiteren Einzelheiten siehe das Register Konfigurations-Manager auf Seite 236 und das Elektronische Handbuch. Die Anpassungsoptionen von STATISTICAGrafiken beinhalten Hunderte von Funktionen und Werkzeugen zum Modifizieren eines jeden Darstellungsdetails und der zugehörigen Datenaufbereitung. Diese Optionen sind in einer hierarchischen Reihenfolge angeordnet, so dass die STATISTICA-Handbuch – 235 Copyright © StatSoft, 2009 KAPITEL 8: ANPASSEN VON STATISTICA meistverwendeten direkt über Shortcuts per Doppelklick oder rechte Maustaste auf das jeweilige Grafikelement zugänglich sind. Die Voreinstellungen für diese Grafik-Funktionen lassen sich leicht anpassen, so dass das Standard-Erscheinungsbild und das Verhalten von STATISTICA-Grafiken Ihren speziellen Bedürfnissen entsprechen und nur wenige Eingriffe erfordern. Viele Aspekte von STATISTICA-Grafiken lassen sich durch den Einsatz folgender Mittel anpassen: 1. den Dialog Optionen (über das Menü Extras - Optionen zugänglich), 2. das umfassende System von Grafikstilen, 3. benutzerdefinierte Grafiken und 4. STATISTICA Visual Basic. Sie werden kurz in Kapitel 7 – Grafiken (Seite 208). beschrieben. Zu weiteren Informationen siehe das Elektronische Handbuch. STATISTICA speichert alle Programmeinstellungen beim Verlassen von STATISTICA und ruft sie beim Neustart wieder auf. Sie können unterschiedliche Konfigurationen dieser Einstellungen mittels der Optionen im Register Konfigurations-Manager des Dialogs Optionen (über das Menü Extras - Optionen zugänglich) erstellen. Mit dem Konfigurations-Manager lässt sich der aktuelle Status des Programms als neue oder existierende Konfiguration speichern oder STATISTICA mit unterschiedlichen Konfigurationen neu starten. Andere Optionen beinhalten Import- und Exportfunktionen für Konfigurationen als separate Datei, so dass diese von verschiedenen STATISTICA-Installationen gemeinsam genutzt werden können. 236 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 8: ANPASSEN VON STATISTICA Das gleiche Prinzip wie im vorangegangenen Abschnitt ist auch auf Netzwerkinstallationen von STATISTICA anwendbar. Im Netzwerk wird STATISTICA üblicherweise nur auf dem Server installiert, aber jeder Anwender kann STATISTICA trotzdem unterschiedlich konfigurieren, weil die zugehörigen Einstellungen lokal gespeichert werden. Zu beachten ist, dass im STATISTICA Setup-Programm stets Netzwerk-Installation gewählt werden muss, damit es ordnungsgemäß auf einem nicht-lokalen Laufwerk (Netzwerk-Server) eingerichtet wird. Eine Netzwerkversion von STATISTICA ist erforderlich, um zuverlässiges Arbeiten bei gleichzeitigem Zugriff von mehr als einem Anwender oder auch nur einem Anwender zu gewährleisten, wenn STATISTICA nicht auf einem lokalen System installiert wird. STATISTICA-Handbuch – 237 Copyright © StatSoft, 2009 KAPITEL 8: ANPASSEN VON STATISTICA 238 – STATISTICA-Handbuch Copyright © StatSoft, 2009 Die dem Industriestandard folgende Programmiersprache STATISTICA Visual Basic (SVB) ist in STATISTICA integriert und stellt eine weitere alternative Benutzeroberfläche dar, die die gesamte Funktionalität von STATISTICA umfasst. Sie ist weit mehr als nur eine Programmiersprache zur Erstellung erweiterter Anwendungen. SVB nutzt die Objektmodell-Architektur von STATISTICA voll aus und kann jeden Aspekt und nahezu jedes Detail der Funktionalität von STATISTICA steuern. Selbst die kompliziertesten Analysen und Grafiken lassen sich als Visual Basic Makro aufzeichnen. Diese Makros kann man später wiederholt ablaufen lassen, editieren oder aus Teilen von ihnen andere Anwendungen zusammensetzen. SVB fügt der reichen Standardsyntax von Visual Basic einen Vorrat von über 13.000 neuen Funktionen hinzu und stellt damit eine der umfangreichsten verfügbaren Entwicklungsumgebungen dar. Das Spektrum der Anwendungen für STATISTICA Visual Basic-Programme reicht von Makroaufzeichnungen zur Automatisierung häufig auszuführender Arbeitsschritte bis zur Entwicklung komplexer Analysesysteme, die optimierte Prozeduren von STATISTICA mit eigenen Erweiterungen unter einer selbst erstellten Benutzeroberfläche verbinden. Mit entsprechender Lizenzierung können erstellte Analyseskripts in Systemumgebungen integriert werden, um aus unternehmenseigenen Softwareanwendungen heraus oder über Internet/IntranetPortale ausgeführt zu werden. STATISTICA-Handbuch – 241 Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC Darüber hinaus können SVB-Programme nahezu allen wichtigen „Ereignissen“ in einer STATISTICA-Analyse beigefügt werden, wie unter anderem dem Öffnen oder Schließen von Dateien, dem Klicken auf Zellen einer Tabelle usw. Auf diese Weise kann die Benutzeroberfläche von STATISTICA für bestimmte Anwendungen (z. B. Dateneingabe usw.) bis ins Detail angepasst werden. STATISTICA bietet eine umfassende Auswahl an Möglichkeiten für das Aufzeichnen von Makros bzw. SVB-Programmen, um sich periodisch wiederholende Arbeitsschritte zu automatisieren oder um automatisch Programme zu erstellen, die für folgende Aufgaben bearbeitet und modifiziert werden können. Die Makros, die auf diesem Wege aufgezeichnet werden, können exakt so ausgeführt werden, wie sie gespeichert wurden, oder als Bausteine für komplexere und hoch angepasste Visual Basic-Programme dienen. Analyse-Makros und Master-Makros folgen der identischen Syntax und können beide später modifiziert werden. Doch aufgrund der unterschiedlichen Aufzeichnungswege dieser Makros bieten sie für eine bestimmte Anwendung sich unterscheidende Vor- und Nachteile. Analyse-Makros zeichnen automatisch die Einstellungen und gewählten Optionen einer bestimmten Analyse auf. Der Begriff „Analyse“ bezeichnet hierbei einen Task, der aus den Menüs Statistik, Data Mining oder Grafik aufgerufen wurde. Dieser Task kann sehr klein und einfach sein (z. B. ein Scatterplot aus dem Menü Grafik), allerdings auch sehr komplex (z. B. ein Strukturgleichungsmodell aus dem Menü Statistik, das Hunderte von Ausgabedokumenten umfassen kann). Nach der Auswahl eines Befehls aus den Menüs Statistik, Data Mining oder Grafik werden alle Aktionen, wie z. B. Variablenauswahl, gewählten Optionen usw., im Hintergrund aufgezeichnet. Diese Aufzeichnung (d. h. der Visual Basic-Code für dieses Makro) kann hierbei zu jedem beliebigen Zeitpunkt in dem Visual Basic-Editor dargestellt werden. Der hierzu notwendige Befehl Erzeuge Makro ist in jedem Analysedialog nach Klicken der Schaltfläche Optionen verfügbar. Sofern ein Analysedialog minimiert wurde und in 242 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC der Analyseleiste aufgeführt wird, kann der Befehl auch in dem entsprechenden Kontextmenü aufgerufen werden (Zugriff über rechten Mausklick auf die Analyseschaltfläche in der Analyseleiste). Mit einem Master-Makro können Sie eine gesamte Sitzung aufzeichnen, die aus einer oder mehreren Analysen besteht. Diese Aufzeichnung verbindet die verschiedenen Analysen aus den Menüs Statistik, Data Mining oder Grafik mit ihren jeweils unterschiedlichen Analyseoptionen. Darüber hinaus kann die Aufzeichnung eines Master-Makros im Gegensatz zu der Aufzeichnung des Analyse-Makros auch an- und ausgeschaltet werden. Die Aufzeichnung des Master-Makros beginnt, indem im Untermenü Extras - Makro der Befehl Protokollaufzeichnung der Analyse starten (Master-Makro) gewählt wird, und endet, wenn im selben Untermenü der Befehl Aufzeichnung beenden gewählt wird. Zwischen diesen beiden Aktionen werden neben den Analysen und der gewählten Reihenfolge dieser Analysen auch Auswahlen von Dateien und Datenoperationen aufgezeichnet. Diese Form der Makroaufzeichnung speichert die eingegebene Tastaturabfolge. Durch Auswahl des Befehls Tastatur-Makro aufzeichnen aus dem Untermenü Extras - Makro wird STATISTICA den tatsächlichen Tastenanschlag, der über die Tastatur eingeben wurde, aufzeichnen. Nach dem Beenden dieser Aufzeichnung öffnet sich ein Fenster des SVB-Editors, das ein einfaches Programm enthält. Dieses Programm besteht lediglich aus einem einzelnen SendKeys-Befehl, das Symbole beinhaltet, die all die unterschiedlichen Tastenanschläge repräsentieren. Diese Form des Makros ist in dem Sinne recht einfach strukturiert, als dass jeglicher Kontext, in dem die Tasten gedrückt wurden, ignoriert wird (d. h. die Befehle, die hierdurch ausgeführt wurden). Allerdings sind solche Makros für die automatische Eingabe von Texten, wie Kommentare, Titel oder Auswahlbedingungen sinnvoll. In der professionellen STATISTICA Visual Basic-Entwicklungsumgebung können Programme auch völlig neu aufgebaut werden. Hierfür stehen ein komfortabler Programmeditor mit einem mächtigen Debugger (u. a. mit Haltepunkten) und viele andere Tools für den effizienten Aufbau von Code zur Verfügung. Diese Tools werden detailliert im STATISTICA Elektronischen Handbuch beschrieben. Wenn ein Makro bearbeitet wird, indem Visual Basic-Befehle oder SVBProgrammbefehle eingegeben werden, ist eine automatische Worterkennung zur automatischen Vervollständigung dieser Befehle aktiviert. Darüber hinaus wird eine Kurzinfo eingeblendet, die die korrekte Syntax des Befehls angibt. Eine Hilfe zu STATISTICA-Handbuch – 243 Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC den Mitgliedern und Funktionen jeder einzelnen Klasse kann ebenfalls aufgerufen werden. In dem Programm können Haltepunkte gesetzt werden, so dass beim Ausführen des Programms Zeile für Zeile beobachtet werden kann, wie sich die Variablenwerte während des Programmablaufs ändern. Darüber hinaus wird ein interaktiver Dialogeditor zur Verfügung gestellt, mit dem das Erstellen neuer Dialoge auf einfachem Wege zu realisieren ist. 244 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC Zusammenfassend lässt sich sagen, dass STATISTICA Visual Basic nicht nur eine mächtige Programmiersprache ist, sondern eine sehr leistungsstarke, professionelle Entwicklungsumgebung, die sich vorzüglich für das Erstellen einfacher Makros als auch komplexer benutzerangepasster Anwendungen eignet. SVB-Programme können auch Bestandteil von Visual Basic-Programmen sein, die innerhalb anderer Anwendungen (z. B. Excel) erstellt wurden, indem hierzu die entsprechenden STATISTICA-Funktionen und Prozeduren aufgerufen werden. STATISTICA-Handbuch – 245 Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC STATISTICA Visual Basic-Programme können zum einen innerhalb von STATISTICA ausgeführt werden. Da SVB aber zum Industriestandard kompatibel ist, können Programme auch aus jeder anderen kompatiblen Umgebung heraus ausgeführt werden (z. B. Excel, Word oder einer reinen Visual Basic-Sprache). In der Praxis bedeutet dies, dass Sie STATISTICA-Funktionen aus Visual Basic in einer anderen Applikation aufrufen können. Zu beachten ist dabei, dass (anders als bei Funktionen aus MS Visual Basic) für den Start eines SVB-Programms oder den Versuch, STATISTICA-Funktionen aus anderen Anwendungen heraus aufzurufen, die STATISTICA-Bibliotheken auf den ausführenden Computern vorhanden sein müssen, damit die Funktionen ausgeführt werden können. Das bedeutet, dass der Benutzer des Programms ein lizenzierter Anwender der STATISTICA-Bibliotheken für die Prozeduren sein muss. Weiterhin sei darauf hingewiesen, dass diese riesige STATISTICA-Funktionsbibliothek nicht nur dem Zugriff durch Visual Basic offen steht, sondern auch Aufrufen von jeder anderen kompatiblen Programmiersprache oder Umgebung wie z. B. C/C++, C# oder Delphi. Die offensichtlichen Vorteile von Visual Basic (im Vergleich zu anderen Sprachen) liegen in der einfachen Bedienbarkeit sowie der Bekanntheit bei einer großen Anzahl von PC-Anwendern. Möglicher Nachteil von Visual Basic-Programmen ist, dass die Verarbeitungsgeschwindigkeit geringer ist als bei Anwendungen, die in einer Lower-Level-Programmiersprache (wie C) entwickelt wurden. Dieses potentielle Problem besteht normalerweise aber nicht bei SVB-Anwendungen, vor allem wenn sie hauptsächlich aus Aufrufen von Analysen, Grafiken und Datenmanipulationen von STATISTICA bestehen. Diese Prozeduren setzen die Technologie von STATISTICA voll um, um ähnlich schnell ablaufen zu können, als wenn die entsprechenden Prozeduren direkt in STATISTICA durchgeführt würden. STATISTICA Visual Basic besteht aus zwei Komponenten: 1) Die allgemeine Visual BasicEntwicklungsumgebung mit Tools und Erweiterungen zur Entwicklung von Benutzeroberflächen (Dialogen) und 2) die STATISTICA-Bibliotheken mit Tausenden von Funktionen, die den Zugriff auf praktisch alle Funktionalitäten von STATISTICA ermöglichen. 246 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC Die Visual Basic-Entwicklungsumgebung folgt grundsätzlich den Syntaxkonventionen von Microsoft Visual Basic. Kleinere Unterschiede bestehen hauptsächlich in der Art, wie Dialoge erstellt werden (Details siehe unter Custom Dialogs und Custom User Interfaces im STATISTICA Elektronischen Handbuch), um Programmierern/Entwicklern bei der Erstellung von Benutzeroberflächen innerhalb komplexer Programme mehr Flexibilität zu bieten. In der SVBEntwicklungsumgebung können Dialoge komplett innerhalb separater Subroutinen verarbeitet werden, die flexibel zu größeren Programmen mit mehreren Dialogen kombiniert werden können, wohingegen unter MS Visual Basic die Dialoge und alle Ereignisse innerhalb dieser Dialoge in separaten Programmeinheiten verarbeitet werden. Nach dem Speichern eines SVB-Programmes kann es einer benutzerdefinierten Symbolleiste oder einem Menü hinzugefügt werden. Dies ermöglicht den Anwendern auf bequemem Wege, die Bedienung und Oberfläche von STATISTICA mit den eigenen Makros anzupassen und zu erweitern. Speichern Sie hierzu zunächst das Makro mit dem Befehl Als globales Makro speichern aus dem Menü Datei. Wählen Sie anschließend im Menü Extras den Befehl Anpassen, um den Dialog Anpassen aufzurufen. Rufen Sie in diesem Dialog das Register Befehle/Makros auf, und wählen Sie in der Liste Kategorien den Eintrag Makros. Daraufhin werden alle globalen Makros in der Liste Befehle dieses Registers aufgeführt. In der folgenden Abbildung wurde zuvor Makro Test1 als globales Makro abgespeichert. STATISTICA-Handbuch – 247 Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC Wählen Sie in dieser Liste Befehle dann das gewünschte Element aus, so dass Sie es mittels Drag and Drop in jedes beliebige Menü bzw. jede Symbolleiste ziehen können. Wenn Sie hierbei mit dem Mauszeiger über ein Menü fahren, wird das entsprechende Menü aufgerufen, so dass Sie die Möglichkeit haben, das Element auch in jedes beliebige Untermenü zu platzieren. Nachdem Sie das Makro platziert haben, können Sie, sofern der Dialog Anpassen geöffnet ist, über das Kontextmenü der neuen Schaltfläche den Dialog Schaltfläche bearbeiten aufrufen. In diesem Dialog können Sie den Text der Schaltfläche ändern sowie ein Symbol hinzufügen. Sie können SVB-Programme mit STATISTICA auch über die Befehlszeile ausführen, indem der Befehlszeilenparameter /RunMacro= verwendet wird. Die Syntax lautet: statist.exe /RunMacro=makroname wobei Makroname der Dateiname des Makros ist. Wenn nicht der komplette Pfad spezifiziert wird, wird versucht, das Makro aus dem von STATISTICA zuletzt gewählten Verzeichnis zu starten (Windows-Standard). Falls das Makro keine Anwendung oder Dokument auf den Bildschirm aufruft (mittels Application.Visible = True oder ähnlicher Zeile), wird STATISTICA nach dem Ausführen des Makros automatisch geschlossen. Falls die Anwendung auf dem Bildschirm sichtbar ist, bleibt die Anwendung nach der Ausführung des Makros sichtbar, so dass das Programm manuell geschlossen werden muss. Dieses Beispiel illustriert, wie eine Analyse in einem Skript aufgezeichnet wird, das dazu verwendet werden kann, die Analyse zu wiederholen. Das Skript wird anschließend bearbeitet und mit einem anderen Skript kombiniert, um ein benutzerangepasstes Skript zu erstellen, das nach Ausführung direkt alle gewünschten Analysen ausgibt. Zusätzlich wird in diesem Beispiel gezeigt, wie man die in den Arbeitsmappen beigefügten Skripts verwenden kann, um Analysen zu wiederholen bzw. automatisch zu aktualisieren. Öffnen Sie zunächst den Beispieldatensatz Adstudy. Wählen Sie hierzu im Menü Datei den Befehl Beispieldatei öffnen, um den Dialog STATISTICA-Daten öffnen aufzurufen. Doppelklicken Sie auf den Ordner Datasets, und öffnen Sie dort den STATISTICA-Datensatz Adstudy.sta. 248 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC Wählen Sie im Menü Statistik den Befehl Elementare Statistik und anschließend im Dialog Elementare Statistik und Tabellen die Option Deskriptive Statistik. Klicken Sie OK, so dass der Dialog Deskriptive Statistik aufgerufen wird. Klicken Sie die Schaltfläche Variablen, um den Standarddialog zur Variablenauswahl aufzurufen. Wählen Sie die Variablen Messung01 bis Messung23, indem STATISTICA-Handbuch – 249 Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC Sie auf Messung01 klicken und den Mauszeiger auf Messung23 ziehen, und bestätigen Sie die Auswahl mit OK. Wählen Sie im Dialog Deskriptive Statistik das Register Details, in dem zahlreiche Optionen zur Verfügung stehen. Übernehmen Sie in diesem Beispiel alle Standardeinstellungen. Klicken Sie die Schaltfläche Zusammenfassung, um sich für die ausgewählten Variablen die deskriptiven Statistiken anzeigen zu lassen. In dem Moment, in dem die Ergebnisse in der Arbeitsmappe ausgegeben werden, wird der Dialog Deskriptive Statistik automatisch minimiert, so dass sich die Ergebnisse im Vordergrund befinden. Klicken Sie daher in der Analysenleiste auf die Schaltfläche Deskriptive Statistik, um den Dialog erneut aufzurufen. Während der Durchführung einer Analyse zeichnet STATISTICA automatisch alle Analyseschritte im Hintergrund auf. Diese Aufzeichnung in Form eines SVBMakros kann dazu verwendet werden, die Analyse zu reproduzieren. Klicken Sie hierzu im Dialog Deskriptive Statistik auf die Schaltfläche , und wählen Sie die Option Erzeuge Makro. Der Dialog Neues Makro wird aufgerufen, der Ihnen 250 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC unter anderem die Möglichkeit bietet, einen Namen und eine Beschreibung des Makros einzugeben. Übernehmen Sie alle voreingestellten Eingaben, und bestätigen Sie mit OK. Hierdurch wird die Aufzeichnung der Analyse Deskriptive Statistik im Editorfenster als SVB-Makro ausgegeben. Wählen Sie im Menü Ausführen den Befehl Makro ausführen, oder drücken Sie die Taste F5, um dieses Makro auszuführen. Hierdurch werden exakt dieselben Ergebnisse der ursprünglichen Analyse reproduziert. Im Folgenden werden einige Befehle des SVB-Makros genauer erläutert. Eine der ersten Zeilen lautet: Set newanalysis = Analysis (scBasicStatistics, ActiveDataSet) Diese Zeile sagt aus, dass das Makro die Analyse Elementare Statistik ausführen wird und dass dabei der „aktive“ Datensatz verwendet wird. Dies ist gerade die zuletzt gewählte Tabelle, bevor das Makro ausgeführt wird. Einige Zeilen weiter unten beginnt ein Abschnitt mit ... Set oAD2 = newanalysis.Dialog ..., und unter dieser Zeile sind Eigenschaften wie z. B.: oAD2.Mean = True STATISTICA-Handbuch – 251 Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC Diese Eigenschaften stellen alle verfügbaren Optionen dar, die in den verschiedenen Registern des Dialogs Deskriptive Statistik enthalten sind. Hierbei wird jede einzelne Option des Dialoges durch eine eigene Zeile repräsentiert, und alle aktuellen Einstellungen wurden aufgezeichnet. Falls Sie entscheiden, den Median und die Summe der einzelnen Variablen hinzuzufügen, ist dies mithilfe des SVBMakros bequem zu realisieren. Ändern Sie die beiden Zeilen ... oAD2.Median = False ... und ... oAD2.Sum = False ... einfach in ... oAD2.Median = True ... bzw. ... oAD2.Sum = True ... um. Führen Sie das Makro erneut aus, indem Sie die Funktionstaste F5 drücken. Der Arbeitsmappe wird eine neue Ergebnistabelle hinzugefügt, die dieses Mal die beiden Spalten Median und Summe beinhaltet: Lassen Sie das Makro-Fenster geöffnet, und starten Sie unter Verwendung desselben Datensatzes eine neue Analyse. Klicken Sie also auf die Tabelle Adstudy, so dass sie wieder im Vordergrund steht, und wählen Sie dann im Menü Grafik - 2DGrafiken den Befehl Normalverteilungsplots, um den Dialog Normalverteilungsplots aufzurufen. 252 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC Klicken Sie die Schaltfläche Variablen, und wählen Sie im Dialog Variablenauswahl für Probability-Plot die Variablen Messung01 bis Messung03. Bestätigen Sie in diesem Dialog und im Dialog Normalverteilungsplots jeweils mit OK. Hierdurch wird der Arbeitsmappe für jede der drei gewählten Variablen jeweils ein Normalverteilungsplot hinzugefügt. Die einzelnen Schritte zum Erstellen der Grafiken wurden hierbei genauso aufgezeichnet wie bei der Analyse der Deskriptiven Statistiken. Rufen Sie mittels entsprechender Schaltfläche in der Analysenleiste wiederum den Dialog Normalverteilungsplots auf, um ein neues Makro mit diesen Schritten zu erstellen. Wählen Sie in diesem Dialog via Schaltfläche den Befehl Erzeuge STATISTICA-Handbuch – 253 Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC Makro. Klicken Sie im Dialog Neues Makro auf OK, so dass ein neues SVBMakrofenster geöffnet wird, das das aufgezeichnete Normalverteilungsplot-Skript beinhaltet. Analog zu den Deskriptiven Statistiken werden in diesem Makro alle gewählten Optionen des Dialoges Normalverteilungsplots als Eigenschaften dargestellt. Um beispielsweise den Normalverteilungsplot in einen Einseitigen Normalverteilungsplot zu ändern, müssen Sie die Zeile ... oGD1.GraphType = scProbNormal ... in folgenden Ausdruck umändern: ogD1.GraphType = scProbHalfNormal Möchten Sie darüber hinaus auch die Variable Messung04 in einem Normalverteilungsplot darstellen, kann dies in folgender Zeile realisiert werden: ogD1.Variables = "3-5" Diese Zeile zeigt die für die Plots ausgewählten Variablen an. Diese Zeile ergibt sich, da die Variablen Messung01 bis Messung03 gewählt wurden und diesen Variablen die Variablennummern 3 bis 5 zugewiesen wurden. Ändern Sie die Zeile wie folgt, um Variable Messung04 (Variablennummer 6) hinzuzufügen: 254 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC ogD1.Variables = 3-6 Führen Sie das Makro erneut mittels F5 aus. Vier neue Einseitige Normalverteilungsplots werden für die Variablen Messung01 bis Messung04 erstellt. Dieses Beispiel zeigt, wie man ein Makro anhand einer durchgeführten Analyse erstellt, dieses anschließend modifiziert und dann erneut ausführt. Darüber hinaus können diese Makros kombiniert werden, um komplexere Makros zu erstellen. Sie stellen also die Bausteine dar, um mittels der SVB-Sprache eigene leistungsstarke, benutzerangepasste Analysen zu erstellen. Im vorigen Beispiel wurde gezeigt, dass STATISTICA bei allen Analysen die einzelnen Schritte aufzeichnet. Diese Aufzeichnung kann anschließend in einem Makro geladen werden, das sich modifizieren und erneut ausführen lässt. Wenn die Analyseergebnisse in einer Arbeitsmappe ausgegeben werden, assoziiert STATISTICA automatisch das aufgezeichnete Skript mit dem Arbeitsmappenordner, der die zugehörigen Ergebnisse enthält. Somit wird ermöglicht, eine Analyse zu wiederholen oder fortzusetzen. In dem Beispiel des vorigen Abschnitts wurden die Analysen Deskriptive Statistik und Normalverteilungsplots mehrfach ausgeführt. Die Arbeitsmappe ähnelt daher folgender Abbildung. Man beachte, dass jedem dieser Arbeitsmappenordner ein roter Pfeil hinzugefügt wurde. Dies zeigt an, dass dem Ordner das Skript der zugehörigen Resultate hinzugefügt wurde. In diesem Fall wird es STATISTICA ermöglicht, diese Analysen zu wiederholen oder fortzusetzen. STATISTICA-Handbuch – 255 Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC Um eine Analyse zu wiederholen, führen Sie auf einem der Ordner namens Deskriptive Statistiken einen Rechtsklick aus, und wählen Sie aus dem Kontextmenü Analyse wiederholen. Der Dialog Analyse wiederholen wird aufgerufen. Im Rahmen Eingabe-Daten haben Sie hier die Wahl zwischen den Optionen Ursprüngliche Datenquelle verwenden und Neue Datenquelle verwenden. Die letztere Option gibt Ihnen die Möglichkeit, die vorige Analyse als „Schablone“ zu verwenden, die auf neue Datenquellen angewendet werden kann. Darüber hinaus kann bezüglich der Ausgabe zwischen den Optionen Aktuellen Ordnerinhalt ersetzen und Ausgabe in neuen Ordner gewählt werden. Übernehmen Sie in diesem Beispiel die Standardeinstellungen und bestätigen Sie mit OK. Hierdurch wird der bisherige Inhalt des Ordners entfernt und kurze Zeit später durch die Ergebnisse der wiederholten Analyse ersetzt. Dieses Feature dient unter anderem dem Zweck, die Ergebnisse komplexer Analysen nach der Eingabe neuer Daten zu wiederholen bzw. zu aktualisieren. Wenn beispielsweise die Analyse wiederholt wird, nachdem die Daten der geöffneten Datendatei Adstudy.sta geändert wurden, werden die neuen Ergebnisse anhand der neuen Daten ermittelt. Die Funktion Analyse fortsetzen ermöglicht hingegen, zu dem Punkt der Analyse zurückzukehren, bevor die Ergebnisse erstellt wurden. Man hat demnach auch die Möglichkeit, die Analyse unter der Auswahl anderer Optionen fortzusetzen. Klicken Sie erneut mit der rechten Maustaste auf den Ordner Deskriptive Statistiken, und wählen Sie aus dem Kontextmenü Analyse fortsetzen, so dass der Dialog Analyse fortsetzen aufgerufen wird. Dieser Dialog enthält wiederum Optionen zum Festlegen der Datenquelle (ursprüngliche oder neue Daten). Bezüglich der Ausgabe der neuen Ergebnisse stehen die beiden Optionen Ausgabe in aktuellen Ordner (im Sinne einer Erweiterung der vorigen Analyse) oder Ausgabe in neuen Ordner (im Sinne einer neuen Analyse) zur Verfügung. 256 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC Übernehmen Sie die Standardeinstellungen und bestätigen Sie mit OK. Der Dialog Deskriptive Statistik wird mit genau den Einstellungen aufgerufen, die beim Erstellen des bisherigen Ordnerinhalts verwendet wurden. Da die Standardeinstellung auf Ausgabe in aktuellen Ordner gesetzt ist, führt das Klicken der Schaltfläche Zusammenfassung dazu, dass die neue Ausgabe in demselben Ordner platziert wird. Der Begriff ActiveX wird in verschiedenen Zusammenhängen verwendet und seine Definitionen betonen unterschiedliche Aspekte des Konzepts. Innerhalb von STATISTICA lässt sich seine Verwendung in zwei allgemeine Kategorien gruppieren: ActiveX-Objekte und ActiveX-Dokumente. . Ein ActiveX-Objekt ist das, was früher einmal als OLEObjekt (OLE – Object Linking and Embedding) bezeichnet wurde. Herzstück ist die Microsoft COM-Technologie (COM – Component Object Model), die es ermöglicht, auf Objekte in vereinheitlichter Form zuzugreifen. Dank der Verwendung von Standardprotokollen können Objekte, die in einer Anwendung erstellt wurden, in einer anderen Anwendung gespeichert und editiert werden. Um diese Funktionalität zu unterstützen, muss die Anwendung, die das Objekt enthält, ein ActiveX-Objektclient sein, und die Anwendung, die das Objekt ursprünglich generiert hat, ein ActiveX-Objektserver. STATISTICA ist beides. Als ActiveXClient erlaubt es STATISTICA, Objekte aus anderen Anwendungen in ein Tabellen-, Grafik- oder Berichtsfenster einzubetten und zu verknüpfen. Als ActiveX-Server ermöglicht es STATISTICA, seine Tabellen und Grafiken in andere Anwendungen einzubetten und zu verknüpfen. STATISTICA-Handbuch – 257 Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC ActiveX-Dokumente gehen mit der ActiveX-Steuerung einen Schritt weiter, indem sie es erlauben, ganze Dokumente in andere Anwendungen einzubetten. Ein ActiveX-Dokumentcontainer erlaubt es anderen Anwendungen, dessen Dokumente in ihm zu benutzen, und ein ActiveX Dokumentserver erlaubt es seinen Dokumenten, in einem beliebigen ActiveXDokumentcontainer benutzt zu werden. STATISTICA kann wieder beides. STATISTICA-Arbeitsmappen sind ActiveX-Dokumentcontainer und ermöglichen die Anzeige von Dokumenten anderer ActiveX-Server innerhalb von Arbeitsmappen. Beispiele hierfür sind Microsoft Word und Excel; deren Dokumente direkt in STATISTICA-Arbeitsmappen verwendet werden können. Ähnlich sind Tabellen, Grafiken und Berichte von STATISTICA ActiveXDokumentserver, die in einen beliebigen ActiveX-Dokumentcontainer wie z. B. dem Microsoft Internet Explorer platziert werden können. Die Technologie der ActiveX-Dokumente stellt besondere Anwendungsmöglichkeiten für Word- und Excel-Dokumente bereit. STATISTICA kann diese Dokumente in ihren eigenen gewohnten Fenstern innerhalb des STATISTICA-Arbeitsplatzes öffnen. Diese „Office-Integration“ ermöglicht, Excel-Dokumente als Datenquellen zu nutzen und Berichte von Analysen direkt als Word-Dokumente auszugeben. Wenn diese Dokumente innerhalb des STATISTICA-Fensters geöffnet werden, stehen auch die entsprechenden Menüs und Symbolleisten für Excel bzw. Word zur Verfügung. STATISTICA unterstützt die Object Linking und Embedding-Konventionen (OLE; Verknüpfen und Einbetten) für die Verbindung von Werten, Texten, Grafiken oder anderen Objekten in STATISTICA-Dokumenten (z. B. Tabellen oder Berichte) mit Dokumenten in anderen (Windows-) Anwendungen. Technisch gesprochen können OLE-Verbindungen zwischen einer Quelldatei (oder Server-Datei; z. B. einem Microsoft Word-Dokument) und einem STATISTICA-Dokument (die Client-Datei) aufgebaut werden, so dass sich bei Veränderungen der Daten in der Quelldatei die Daten im entsprechenden Teil des STATISTICA-Dokuments (Client-Datei) automatisch aktualisieren. Darüber hinaus kann STATISTICA als Quelldatei (oder Server-Datei) für andere OLE-kompatible Dokumente fungieren. Auf diese Weise lassen sich Werte einer STATISTICA-Tabelle mit einer Tabelle in einem Microsoft 258 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC Word-Dokument verbinden, so dass sich das Word-Dokument aktualisiert, sobald Daten in der STATISTICA-Tabelle verändert werden. STATISTICA unterstützt ebenfalls die Dynamic Data Exchange (Dynamischer Datenaustausch; DDE)-Konventionen. Man kann DDE-Verknüpfungen zwischen einer Quelldatei (oder Server-Datei; z. B. eine Microsoft Excel-Tabelle) und einer STATISTICA-Datendatei (der Client-Datei) aufbauen, so dass Veränderungen der Daten der Quell-Datei zu einer automatischen Aktualisierung des entsprechenden Teils der STATISTICA-Tabelle (Client-Datei) führen. So lassen sich Bereiche von Daten in der Tabelle dynamisch mit einer Teilmenge von Daten anderer WindowsAnwendungen verbinden. Eine typische Anwendung für die dynamische Verbindung zweier Dateien wäre eine industrielle Umgebung, in der die STATISTICA-Datendatei dynamisch mit einem Messgerät verbunden ist, das an eine serielle Schnittstelle angeschlossen ist (um z. B. automatisch bestimmte Messungen stündlich zu aktualisieren). Wie beim OLE ist der Aufbau dieser Prozeduren einfacher als es erscheinen mag und erfordert keine technischen Kenntnisse über die Mechanismen des DDE. STATISTICA-Handbuch – 259 Copyright © StatSoft, 2009 KAPITEL 9: STATISTICA VISUAL BASIC 260 – STATISTICA-Handbuch Copyright © StatSoft, 2009 STATISTICA Quick Reference – 261 Copyright © StatSoft, 2007 Die technischen Begriffe in dieser Einführung (z. B. ODBC, SQL) werden im Glossar des Elektronischen Handbuchs erklärt, das im Hilfe-Menü über STATISTICA Hilfe aufgerufen werden kann. STATISTICA Query wird eingesetzt, um bequemen Zugriff auf Daten in verschiedenen Datenbanken (einschließlich vieler großer Systemdatenbanken wie Oracle, MS SQL Server, Sybase) über Microsofts OLE-DB-Konventionen zu verschaffen. OLE DB ist eine mächtige Datenbanktechnologie, die ungeachtet des Datentyps eine universelle Datenintegration in einem unternehmensweiten Netzwerk vom Großrechner bis zum Desktop erlaubt. OLE DB bietet eine allgemeinere und effizientere Strategie des Datenzugriffs als das ältere ODBC, weil es mehr Datentypen unterstützt und auf dem Component Object Model (COM) basiert. STATISTICA Query unterstützt multiple Datenbanktabellen. Datensätze (Tabellenreihen) lassen sich über SQL-Code auswählen, welchen STATISTICA Query automatisch für Sie generiert, wenn Sie die Komponenten der Abfrage über eine einfache grafische Oberfläche oder intuitive Menüoptionen und Dialoge auswählen. Daher sind keine tiefer gehenden Kenntnisse von SQL erforderlich, um auf schnelle Art komplexe und mächtige Datenabfragen zu generieren. Mehrere Abfragen auf viele verschiedene Datenbanken zur Weitergabe an ein einzelnes STATISTICA Handbuch – 263 Copyright © StatSoft, 2009 KAPITEL 10: STATISTICA QUERY Datenblatt lassen sich ebenfalls erstellen und die simultane Verknüpfung zu mehreren externen Datenbanken aufrechterhalten. Dies sind die erforderlichen Schritte zur Abfrage externer Daten über STATISTICA Query: 1. Wählen Sie Neue Abfrage erstellen im Menü Daten - Externe Daten (oder im Menü Datei - Externe Daten), um den Dialog Datenbankverknüpfung aufzurufen. In diesem Dialog wählen Sie eine vordefinierte Datenbankverbindung (den Provider, Datenquellenpfad und weitere Einstellungen des Servers oder des Verzeichnisses für den Ort der Daten). Wenn noch keine Datenbankverbindung eingerichtet wurde, lässt sich das über die Schaltfläche Neu im Dialog Datenbankverknüpfung nachholen. Der Dialog Datenverknüpfungseigenschaften wird dann angezeigt, der Sie mit einem Assistenten Schritt-für-Schritt beim Erstellen der Datenbankverknüpfung begleitet. Eine spezielle Dokumentation zum Gebrauch des Dialogs Datenverknüpfungseigenschaften rufen Sie mit F1 ab, um Hilfe zu Microsoft Data Link Help® anzeigen zu lassen. 2. Nach Auswahl der Datenbankverknüpfung und Bestätigung mit OK im Dialog Datenverknüpfungseigenschaften haben Sie Zugang zu STATISTICA Query, wo Sie Ihren SQL-Ausdruck durch Spezifikation der gewünschten Tabellen, Felder, Verknüpfungen, Kriterien usw. (über die Menüs Tabelle, Verknüpfung und Kriterien) zur Aufnahme in die Abfrage erstellen können. 264 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 10: STATISTICA QUERY 3. Nachdem Sie die Abfrage spezifiziert haben, wählen Sie Daten an STATISTICA zurückgeben im Menü Datei. Danach wird der Dialog Externe Daten an eine Tabelle übergeben angezeigt, in dem Sie den Namen der Abfrage, Zielort für die von STATISTICA Query übergebenen Daten und weitere Einstellungen vornehmen können. Siehe das Elektronische Handbuch zu weiteren Einzelheiten. Die in den vorangegangenen Abschnitten beschriebenen Abfragefunktionen sind als Teil der Unternehmensversionen von STATISTICA (siehe STATISTICAProduktfamilie, Seite 298) zusätzlich erweitert durch Optionen zur Verarbeitung der Daten von externen Servern „vor Ort“, d. h., ohne die Daten zu importieren und eine lokal Datendatei anzulegen. Diese In-Place Database Processing-Technologie STATISTICA-Handbuch – 265 Copyright © StatSoft, 2009 KAPITEL 10: STATISTICA QUERY (IDP) eignet sich besonders zur Bearbeitung sehr großer Datendateien, bei der sie signifikante Leistungsgewinne zeigt. Dadurch wird die Bearbeitung von Datendateien ermöglicht, deren Größe die Speicherkapazität des lokalen Laufwerks oder STATISTICA-Servers übersteigt. . Die IDP-Technologie basiert auf einer Architektur verteilter Verarbeitung, wobei die Abfragen auf der Serverseite durchgeführt werden (hierbei werden die CPU-Ressourcen des Servers verwendet) und die entsprechenden Aufzeichnungen an den STATISTICA-Computer gesendet werden, wo sie in dem Moment, in dem sie zur Verfügung stehen, simultan (asynchron) verarbeitet werden. 266 – STATISTICA-Handbuch Copyright © StatSoft, 2009 Nahezu jeder Aspekt von STATISTICA liegt auch in der Form von COM-Interfaces vor, die auf einem Rechner während der STATISTICA-Installation registriert werden. Da .NET-Sprachen nicht direkt mit COM kommunizieren können, wird eine Wrapper-Klasse namens COM Interop verwendet, um die STATISTICABibliotheken in das .NET-Projekt zu integrieren. Sofern man Visual Studio .NET als integrierte Entwicklungsumgebung verwendet, wird beim Import eines COMInterfaces das COM Interop automatisch erstellt. COM Interop ist hierbei für alle Details bezüglich der Interaktion der COM-Bibliotheken innerhalb .NET zuständig. Nach Anbindung von COM Interop lassen sich die STATISTICA COM-Interfaces wie jedes andere .NET-Objekt handhaben. Beim Hinzufügen der gewünschten STATISTICA COM-Interfaces in das .NETProjekt wird COM Interop automatisch erstellt. STATISTICA Object Library ist hierbei die grundlegende STATISTICA COM-Bibliothek. Um die STATISTICA Object Library in ein .NET-Projekt einzubinden, wählen Sie im ProjektmappenExplorer zunächst das gewünschte .NET-Projekt. Wählen Sie anschließend im STATISTICA-Handbuch – 269 Copyright © StatSoft, 2009 KAPITEL 11: PROGRAMMIERUNG IN .NET Kontextmenü (aufrufbar mit Rechtsklick auf dem .NET-Projekt) den Befehl Verweis hinzufügen, so dass der Dialog Verweis hinzufügen aufgerufen wird. Wählen Sie im Dialog Verweis hinzufügen das Register COM und anschließend in der Liste Komponentenname die STATISTICA Object Library. Bestätigen Sie mit OK. Hierdurch wird die notwendige COM Interop-Bibliothek automatisch erstellt. Wird der Knoten Verweise geöffnet, erscheint nun der Eintrag STATISTICA. 270 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 11: PROGRAMMIERUNG IN .NET Zusätzlich wird die Datei Interop.STATISTICA.dll dem Ausgabepfad des Projektes hinzugefügt. Die STATISTICA COM Interop-Bibliothek ist in dieser Datei gespeichert. Um die STATISTICA Object Library innerhalb des .NET-Projektes zu betrachten, müssen Sie mit rechter Maustaste auf den STATISTICA-Verweis klicken und anschließend im Kontextmenü den Befehl Im Objekt-Browser anzeigen wählen. Es ebenfalls möglich, die COM-Interoperabilität manuell zu erzeugen und dann in das .NET-Projekt zu importieren. Dies ermöglicht zusätzlich, die Interop-DLL umzubenennen sowie einen benutzerdefinierten Namensraum (namespace) zu definieren. Das Programm, mit dem diese COM-Interoperabilität erzeugt werden kann, heißt TLBIMP.EXE. Rufen Sie das Programm TLBIMP über Visual Studio mit Verweis auf die Typbibliothek und folgenden Befehlszeilenoptionen auf, die den DLL-Namen sowie Namensraum spezifizieren: STATISTICA-Handbuch – 271 Copyright © StatSoft, 2009 KAPITEL 11: PROGRAMMIERUNG IN .NET In diesem Beispiel wird auf STATIST.EXE verwiesen, da diese Datei die Typbibliothek STATISTICA Object Library enthält. Nach dem Erstellen der InteropDLL kann die Datei im Projektmappen-Explorer wie im vorigen Abschnitt über den Befehl Verweis hinzufügen Ihrem .NET-Projekt hinzugefügt werden. Sie müssen in dem Dialog dann allerdings das Register Durchsuchen wählen, um die neu erstellte Interop-DLL auszuwählen. Um mehrere Versionsnummern von STATISTICA zu unterstützen, ist es notwendig, die verschiedenen Versionen der STATISTICA Object Library mittels separater Interop-DLL-Dateien einzubinden. Verwenden Sie hierfür den TLBIMP-Befehl, um für bestimmte Versionen der STATIST.EXE und anderen DLL-Dateien die entsprechenden Interop-DLL-Dateien zu erzeugen. Vergewissern Sie sich vor dem Verteilen der Anwendung auf verschiedene Rechner, dass die korrekte Version der STATISTICA Interop-DLL eingebunden wurde. Aufgrund der COM-Architektur kann STATISTICA in viele unterschiedliche Entwicklungsumgebungen eingebunden werden. Wenn STATISTICA innerhalb einer externen Entwicklungsumgebung verwendet wird, ist es notwendig, ein Top272 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 11: PROGRAMMIERUNG IN .NET Level-Objekt zu definieren, das als Applikationsobjekt bezeichnet wird. Dieses Applikationsobjekt stellt die STATISTICA-Anwendung dar, die wiederum andere Objekte enthält (zum Beispiel Tabellen und Grafiken). Der Zugriff auf diese untergeordneten Objekte ist allerdings nur dann möglich, sofern das Applikationsobjekt ausgeführt wird. Angenommen, man verwendet den voreingestellten Namensraum STATISTICA, so sollte die Variable als STATISTICA.Application deklariert werden. Um eine neue STATISTICA-Instanz zu generieren, setzen Sie die Variable dann gleich new STATISTICA.ApplicationClass(). Nach der Erzeugung einer Instanz der STATISTICA.ApplicationClass wird ein STATIST.EXE-Prozess gestartet. Dies entspricht dem Starten von STATISTICA aus dem Start-Menü. Die STATISTICA-Instanz ist zunächst verborgen, kann aber durch den entsprechenden Befehl sichtbar gemacht werden. Da dies ein separater Prozess ist, sind alle Aufrufe dieser Instanz prozessextern (out-of-process). Zusätzlich zu dem Objekt STATISTICA.Application gibt es auch eine schlankere, leistungsstärkere Version dieses Objekts namens STATISTICA.Library. Die Library-Version wird separat lizenziert und ist demnach eventuell nicht Bestandteil Ihrer Installation. Diese Version enthält dieselben Schnittstellen wie STATISTICA.Application. In jeder bestehenden Codezeile, die das ApplicationObjekt aufruft, kann dieses Objekt mit dem Library-Objekt ersetzt werden. Die hauptsächliche Einschränkung der Library-Version besteht darin, dass die Features der STATISTICA-Benutzeroberfläche nicht verfügbar sind. Wird demnach im obigen Beispiel das Applikationsobjekt als neue STATISTICA.LibraryClass generiert, wäre es nicht möglich, das Objekt (die STATISTICA-Benutzeroberfläche) sichtbar zu machen. STATISTICA-Handbuch – 273 Copyright © StatSoft, 2009 KAPITEL 11: PROGRAMMIERUNG IN .NET Die Library-Version von STATISTICA wird prozessintern geladen, womit der Zugriff auf die COM-Interfaces effizienter als bei der Application-Version des Objektes ist (die prozessextern geladen wird). Da prozessintern geladen wird, können nicht mehrere Instanzen dieser Library-Version generiert werden. Normalerweise wird in einem Programm allerdings nur eine Instanz des LibraryObjekts bzw. Application-Objekts generiert. 274 – STATISTICA-Handbuch Copyright © StatSoft, 2009 KAPITEL 11: PROGRAMMIERUNG IN .NET STATISTICA-Handbuch – 275 Copyright © StatSoft, 2009 KAPITEL 11: PROGRAMMIERUNG IN .NET 276 – STATISTICA-Handbuch Copyright © StatSoft, 2009 Der einfachste Weg zur Hilfe bei der Programmbedienung und zu einem breiten Angebot an Information über STATISTICA ist das Elektronische Handbuch, das mehr als 100 Megabytes an Literaturhinweisen, Illustrationen und Beispiele enthält. Dieses Hypertext-Dokument bietet mehr als nur Erklärungen von Optionen in STATISTICA. Es enthält zahlreiche Beispiele, Überblicke und Illustrationen mit Tausenden von Tipps zur Optimierung Ihrer Arbeit. STATISTICA-Handbuch – 277 Copyright © StatSoft, 2009 ANHANG A: WEITERE HILFE Das STATISTICA Elektronische Handbuch ist sehr umfassend und bietet auch einen integrierten Statistischen Ratgeber (siehe Seite 33), begleitet vom kompletten Inhalt des preisgekrönten Elektronischen StatistikLehrbuchs und dem Glossar von StatSoft. Das Elektronische Statistik-Lehrbuch von StatSoft wurde von der Encyclopedia Britannica wegen seiner Qualität, Genauigkeit, Gestaltung und Bedienbarkeit empfohlen. Dieses Textbuch wird schon seit Jahren weltweit in Bildungs- und Forschungsaktivitäten von Universitäten und Forschungsinstituten eingebunden. Die Website von StatSoft bietet Zugang zu vielen nützlichen Quellen für die professionelle Datenanalyse und enthält darüber hinaus: eine ständig aktualisierte Sektion Frequently Asked Questions (häufig gestellte Fragen) einen Download-Bereich, in dem Anwender der aktuellen Versionen von STATISTICAProdukten herunterladbare Updates ihrer Software bekommen. Wir arbeiten fortlaufend an einer Steigerung der Kompatibilität von STATISTICA auch mit Anwendungen, die nicht den Standardkonventionen entsprechen. Darum kann ein Herunterladen eines Updates 278 – STATISTICA-Handbuch Copyright © StatSoft, 2009 ANHANG A: WEITERE HILFE hilfreich sein, wenn das aufgetretene Problem durch eine unübliche Systemkonfiguration oder einen Konflikt mit anderen Anwendungen verursacht wurde. Betriebssystems bereit, wenn Sie Ihre StatSoftNiederlassung kontaktieren. Wenn die oben angegebenen Quellen Ihre Frage nicht beantworten, können Sie uns eine E-Mail schreiben. Bitte geben Sie dabei Seriennummer (wählen Sie Info im Hilfe-Menü zur Anzeige Ihrer Seriennummer), Informationen über Ihre Hardware [Prozessortyp (CPU), Speicherumfang (RAM) und Festplattenkapazität] sowie die Version des Betriebssystems an. Senden Sie Ihre E-Mail an [email protected]. Sie können auch Ihre regionale StatSoftNiederlassung anrufen, um mit einem Techniker zu sprechen (in Deutschland 040 - 4688660). Anschriften der StatSoftNiederlassungen finden Sie im Hilfe-Menü unter Info im Register Niederlassungen: Bitte halten Sie stets Ihre Seriennummer (wählen Sie Info im Hilfe-Menü zur Anzeige Ihrer Seriennummer), Informationen über Ihre Hardware sowie über die Version des STATISTICA-Handbuch – 279 Copyright © StatSoft, 2009 ANHANG A: WEITERE HILFE 280 – STATISTICA-Handbuch Copyright © StatSoft, 2009 STATISTICA-Handbuch – 281 Copyright © StatSoft, 2009 ANHANG A: WEITERE HILFE 282 – STATISTICA-Handbuch Copyright © StatSoft, 2009 STATISTICA wird mittels WebSTATISTICA Server die komplette Webfähigkeit hinzugefügt, einschließlich der Möglichkeit, STATISTICA interaktiv von einem Webbrowser aus auszuführen. Sofern eine Internetverbindung besteht, wird von nahezu jedem Computer auf dieser Welt der einfache und schnelle Zugriff auf Daten und mächtige analytische Werkzeuge ermöglicht. Dieses Produkt wird mit einer Auswahl von Webbrowser-basierten Benutzeroberflächen (in der Form von Dialogen, die extrem einfach zu navigieren und zu verwenden sind) angeboten, die es ermöglichen, mit einem standardmäßigen Webbrowser Analysen zu spezifizieren und sich Ergebnisansichten erstellen zu lassen. Es werden ebenfalls Tools angeboten, um diese Dialoge anzupassen, um neue, benutzerangepasste Oberflächen zu erstellen oder um neue Funktionen hinzuzufügen. Die Oberfläche in dem Webbrowser kann beispielsweise aus einem einfachen Dialog bestehen, der lediglich drei Schaltflächen enthält, wobei das Klicken einer dieser Schaltflächen, eine Serie von Analysen ausführt und detaillierte Berichte erstellt. WebSTATISTICA Server fügt der gesamten Produktlinie von STATISTICA, der Datenanalyse, Data Mining und Qualitätsregelkarten/Six Sigma-Methoden, eine neue Dimension und eine große Anzahl von neuen Anwendungsmöglichkeiten hinzu. WebSTATISTICA Server ist ein hoch skalierbares Anwendungssystem auf Unternehmensebene, das eine webbasierte Datenanalyse und ein Datenbank-Gateway umfasst. Dieses System basiert auf der Technologie der verteilten Verarbeitung und unterstützt vollständig Konfigurationen von mehrstufigen Client-Server-Architekturen. WebSTATISTICA Server bietet die Analyse-, Abfrage-, Berichts- und Grafikfunktionen von STATISTICA über eine einfach zu verwendende, interaktive, standardmäßige Weboberfläche an. Sie wird als eine komplette, zur Installation bereitstehende Anwendung angeboten, die eine interaktive, Webbrowser-basierte („Point-andClick“-)Benutzeroberfläche umfasst, die es Anwendern in entfernten Orten ermöglicht, interaktiv Datensätze zu erstellen, Analysen STATISTICA-Handbuch – 283 Copyright © StatSoft, 2009 ANHANG B: WebSTATISTICA auszuführen und Analyseergebnisse zu betrachten. Aufgrund seiner offenen Architektur umfasst WebSTATISTICA Server jedoch ebenfalls Development Kit Tools (wobei die gesamten Syntaxkonventionen auf Industriestandards wie VB Script, C++, HTML und XML basieren), die es einer IT-Abteilung ermöglichen, alle Hauptkomponenten des Systems anzupassen oder zu erweitern, indem neue Komponenten und/oder unternehmensspezifische Analyse- oder Datenbankfunktionen hinzugefügt werden. Das System ist mit allen gebräuchlichen WebserverPlattformen (z. B. UNIX Apache, Microsoft IIS) kompatibel, funktioniert in Microsoft .NET- als auch Sun/Java-Umgebungen und erfordert keine Anpassungen von vorhandenen Firewall- und Internet/Intranet-Sicherheitssystemen. WebSTATISTICA Server wird als eine Komplettlösung angeboten, die alle Analysefunktionen eines beliebigen STATISTICAProdukts oder einer beliebigen Kombination von Produkten enthalten kann, z. B. von STATISTICA Basis bis zu Produkten der Enterprise-Linie (u. a. STATISTICA Enterprise und Data Miner). Die Installation der WebSTATISTICA ServerSoftware umfasst als Minimum die Analysefunktionen von STATISTICA Basis und eine Netzwerklizenz von 5 Nutzern. Man kann hierbei entweder eine bestimmte Version von WebSTATISTICA Server einschließlich der erforderlichen Analysefunktionen erwerben (z. B. STATISTICA Basis für 10 Benutzer) oder die Web ServerFunktionalität (wie sie in diesem Abschnitt beschrieben wird) für alle oder einen Teil der Nutzer der bereits verwendeten STATISTICANetzwerklizenz hinzufügen (z. B. die Web Server-Funktionalität für 20 der 50 Nutzer von STATISTICA Enterprise hinzufügen). Der wahrscheinlich deutlichste Vorteil der WebSTATISTICA Server-Technologie liegt darin, dass die Leistungsstärke jedes einzelnen Produkts der STATISTICA-Produktfamilie für jeden beliebigen Computer in der Welt zur Verfügung gestellt wird, sofern der Rechner mit dem Internet verbunden ist. Die WebSTATISTICA ServerAnwendungen fügen demnach der gesamten Produktlinie der STATISTICA Datenanalyse, Data Mining und Qualitätssicherung/Six SigmaSoftware eine neue Dimension unbegrenzter Möglichkeiten hinzu. Beispielsweise können die aktuellsten Daten und Berichte (die z. B. mittels Abfragen des im Unternehmen vorhandenen Data Warehouse aktualisiert werden) – einschließlich interaktiver Drill-Down-Optionen, um aus den Ergebnissen zusätzliche Einsichten über die Geschäftslage zu erhalten – nun für autorisierte Angestellte überall auf der Welt und unabhängig vom Rechnertyp verfügbar gemacht werden. Wo auch immer eine Internetverbindung verfügbar ist (d. h. nahezu überall), besteht nun gleichzeitig Zugriff auf Abfragen, Berichte und Analysewerkzeugen des umfassendsten Datenanalysesystems. Ein weiterer ebenso wichtiger Ansatz, aus der WebSTATISTICA Server-Funktion Vorteile zu ziehen, liegt darin, es als Kern und natürliche Erweiterung eines STATISTICA-Produkts der Enterprise-Linie (z. B. STATISTICA Enterprise oder Data Miner) zu verwenden. Insbesondere kann WebSTATISTICA Server als Kern eines unternehmensweiten Netzwerkes dienen, das den Teilnehmern ermöglicht, gemeinschaftlich zu arbeiten und Ergebnisse 284 – STATISTICA-Handbuch Copyright © StatSoft, 2009 ANHANG B: WebSTATISTICA (Berichte), sowie Skripte von Analysen oder Abfragen auf schnellem Wege auszutauschen. Benutzer- oder Gruppenrechte (siehe Technischen Hinweis weiter unten) können von Administratoren verwaltet werden, so dass nur bestimmte Gruppen von Nutzern Zugriff auf bestimmte Daten oder Berichte erhalten. Dank der Verfügbarkeit über das Internet ist WebSTATISTICA Server ein perfektes System, um Gemeinschaftsprojekte von Mitarbeitern zu erleichtern, die sich in verschiedenen Betriebsstätten aufhalten (selbst auf unterschiedlichen Kontinenten), verschiedenen Branchen des Unternehmens angehören, Heimarbeit betreiben oder sich häufig auf Geschäftsreise befinden. Unabhängig davon, ob sich die Anwender nahe zum WebSTATISTICA Server befinden (z. B. im selben Gebäude) oder weit entfernt (z. B. auf einem anderen Kontinent), liegt der Nutzen nicht nur in der vereinfachten Gemeinschaftsarbeit, sondern auch in der Option, rechenintensive und zeitaufwendige Aufgaben an die Servercomputer zu übergeben. Insbesondere da die meisten leistungsstarken Mehrprozessor-CPUs (und/oder mehrere Computer) gewöhnlich als Server verwendet werden, können Anwender nun die rechenintensiven Aufgaben abgeben und beispielsweise „im Hintergrund“ Abfragen ausführen, die Terabytes von Daten auf einem entfernten Server scannen und auch gleichzeitig lange Sequenzen von Analysen und Berichten ausführen. Der Computer des Anwenders wird hierbei nicht beansprucht, so dass noch weitere Aufgaben durchgeführt werden können. Aufgrund dieser Architektur verteilter Verarbeitung kann WebSTATISTICA Server in hocheffizienter Manier aus Mehrprozessor-CPUs und/oder mehreren Computern Vorteile ziehen, wobei diese Vorteile der mehrstufigen ClientServer-Architektur dem Anwender direkt weitergegeben werden. Die Stufen bestehen hierbei aus: Stufe 1 ist die Benutzeroberfläche des Clients (ein einfacher Browser oder STATISTICA Client, siehe weiter unten), Stufe 2 ist die WebSTATISTICA ServerSoftware und gegebenenfalls die Einrichtung eines „Informationsdienstes des Unternehmens“ (bestimmte Abfragen, Skripte von benutzerangepassten Analysen usw.) und Stufe 3 sind die STATISTICA-Datenbanken (z. B. STATISTICA Data Warehouse) oder andere Datenbanken des Unternehmens. In der Desktop-Version von STATISTICA werden alle Berechnungen auf dem lokalen Rechner durchgeführt, wobei Ressourcen anderer Rechner nur dann beansprucht werden, wenn die In-Place Database Processing (IDP)Schnittstelle zu externen Datenbanken eingerichtet worden ist. Mit IDP werden die Daten von einem Datenbankserver direkt und asynchron abgerufen (unter Verwendung verteilter Verarbeitung, wenn dies vom Server unterstützt wird), womit die Notwendigkeit eines Datenimports umgangen und eine lokale Kopie des Datensatzes erstellt wird. Insbesondere verwendet IDP die Verarbeitungsressourcen (mehrere CPUs) des Server-Computers, um die Abfrage-Operationen auszuführen, die Datensätze zu extrahieren und diese an den STATISTICA-Computer zu senden, während STATISTICA die erhaltenen Datensätze gleichzeitig verarbeitet. Bei Verwendung einer Client-Server-Version von STATISTICA ist der lokale Computer nur für die Benutzeroberfläche von STATISTICA zuständig, wobei sämtliche Berechnungen auf dem Server ausgeführt werden. Die ClientServer-Architektur bietet bei größeren Projekten (z. B. rechenintensive Aufgaben oder die Bearbeitung extrem großer Datensätze) offensichtliche Vorteile, da der lokale Rechner nach der Übergabe dieser Projekte an den Server andere Aufgaben durchführen kann. STATISTICA-Handbuch – 285 Copyright © StatSoft, 2009 ANHANG B: WebSTATISTICA Obwohl für den Client keine Komponenten des STATISTICA-Systems zwingend notwendig sind (lediglich ein Browser), bietet die Installation von STATISTICA auf der Clientseite weitere Möglichkeiten. Man könnte sich fragen: „Warum sollte man WebSTATISTICA Server verwenden, wenn auf dem Laptop bereits eine bereits eine STATISTICA-Version installiert ist?“ Die Antwort ist, dass es die STATISTICAInstallation auf dem Client-Rechner ermöglicht, zusätzliche Vorteile aus der mehrstufigen ClientServer-Architektur (siehe oben) zu ziehen. Es bietet sich nun an, die lokale STATISTICAInstallation interaktiv mit dem Server zu nutzen, indem bestimmte zeitaufwendige Aufgaben übertragen und/oder Daten zwischen allen drei Ebenen ausgetauscht werden. WebSTATISTICA lässt sich innerhalb der lokalen STATISTICAInstallation starten, wobei sich deren Interaktion flexibel regeln lässt. Eine Vielzahl von Optionen ist verfügbar, um die Aufgaben zwischen Desktop-Rechner und Server zu verteilen. Falls die Ausgabe von WebSTATISTICA im Browser betrachtet wird, bieten sich ebenfalls Optionen, einen Teil oder alle Ausgabeobjekte zur Weiterverarbeitung auf den Desktop-Rechner zu transferieren. Dies kann beispielsweise mit einem Klick auf einer kleinen Schaltfläche realisiert werden, die von WebSTATISTICA Server optional (abhängig von der Benutzerkonfiguration) an jedes Ausgabeobjekt (Tabelle oder Grafik) angehängt werden kann. Es bietet sich somit die Option, das Objekt (eine STATISTICA-Tabelle oder -Grafik) auf den Client-Rechner in seinem originalen STATISTICA-Format (im .sta- oder .stgDateiformat) herunterzuladen, so dass es mittels der lokal installierten STATISTICA-Werkzeuge auch offline weiterverarbeitet werden kann. Die WebSTATISTICA-Plattform basiert auf den fortgeschrittenen Technologien der verteilten Verarbeitung und des Multithreading, um große Rechenvorgänge optimal zu verwalten. Diese Technologie ermöglicht die schnelle Verarbeitung von selbst sehr großen rechenintensiven Projekten, wobei die Vorteile von Servern mit Mehrprozessor-CPUs oder gar mehreren parallelen Servern voll genutzt werden. Diese Abbildung zeigt ein Projekt, das auf einem Server mit vier Prozessoren ausgeführt wird, inklusive des Monitors der Systemleistung, der anzeigt, dass die Ressourcen aller vier CPUs, die im Multithreading-Modus ein einzelnes rechenintensives STATISTICA Data MinerProjekts ausführen, voll ausgeschöpft werden. Die WebSTATISTICA-Architektur liefert zusätzlich eine plattformunabhängige, browserbasierte Benutzeroberfläche und die ultimative Fähigkeit, die Projekte oder Gruppen von Nutzern auf Unternehmensebene „über den 286 – STATISTICA-Handbuch Copyright © StatSoft, 2009 ANHANG B: WebSTATISTICA Büroflur oder über Kontinente hinweg“ zu verwalten. Eine der besonderen Fähigkeiten bezüglich der Technologie der verteilten Verarbeitung von STATISTICA liegt in der flexiblen Skalierbarkeit, die sich nicht nur auf alle CPUs des aktuellen Servers bezieht (um neben mehreren Aufgaben/Nutzern auch einzelne rechenintensive Projekte zu unterstützen), sondern selbst mehrere Servercomputer umfasst. Dieses einzigartige Feature ist wichtig, da es eine signifikante Leistungssteigerung ermöglicht. STATISTICA wendet die parallele Verarbeitung auch über mehrere Hardwareeinheiten an (wie es von einigen Supercomputern praktiziert wird). Beim Vorhandensein von drei Servern mit jeweils vier Prozessoren ist es beispielsweise möglich, dass STATISTICA einzelne Projekte auf allen 12 Prozessoren ausführen kann (wenn der Umfang dieses Projekts eine derartige Verarbeitung erfordert). Die Benutzeroberfläche von STATISTICA lässt sich also von einem oder mehreren Benutzern gleichzeitig von jedem Computer in der Welt erreichen (sofern ein Internetanschluss vorliegt, selbst bei langsamer Verbindung), wohingegen der Server alle Berechnungen und Datenoperationen durchführt, so dass die Sicherheitsarchitektur und die Zugriffsrechte auf die entsprechenden Projekte und Benutzerklassen von einem Netzwerkadministrator verwaltet werden können. WebSTATISTICA bietet eine geradlinige Benutzeroberfläche, die eine Auswahl von interaktiven Arbeitsabläufen im Bereich Datenanalyse, Data Mining, Qualitätsregelung, Datenbankverwaltung, Datenbankabfragen und Grafikanpassung ermöglicht. Nach Anmeldung in das WebSTATISTICASystem ... Mit der Umsetzung von WebSTATISTICA können die Anwender das Programm vom Clientrechner interaktiv in einer Browseroberfläche ausführen, die der Oberfläche der Desktopversion von STATISTICA ähnelt. Sofern der Rechner mit dem Internet verbunden ist, kann die Clientseite der Anwendung (das „Frontend“) auf jedem beliebigen Computer (selbst auf einem Laptop) ausgeführt werden. Die tatsächlichen Berechnungen und andere Arbeiten an den Daten werden jedoch auf dem (entfernten) Server ausgeführt, der gewöhnlich über leistungsstärkere Prozessoren und weitaus größere Speicherressourcen verfügt (die darüber hinaus mittels der optimierten Architektur des Multihreading und der verteilten Verarbeitung verwaltet werden, so dass die maximale Leistung erreicht wird). STATISTICA-Handbuch – 287 Copyright © StatSoft, 2009 ANHANG B: WebSTATISTICA ... kann eine Datenquelle (Datensatz oder bestehende Datenbankverbindung) ausgewählt werden, ... (oder mittels Verknüpfung im benutzerdefinierten My Menu), ... ... können Variablen und bestimmte optionale Analyseparameter festgelegt werden ... ... können anschließend die Daten im interaktiven WebSTATISTICA-Tabelleneditor betrachtet und bearbeitet werden, ... ... kann die durchzuführende Analyse mittels des standardmäßigen Menüsystems gewählt werden 288 – STATISTICA-Handbuch Copyright © StatSoft, 2009 ANHANG B: WebSTATISTICA ... und Ergebnisse interaktiv betrachtet werden. interaktiven Erstellung von Data-MiningModellen, die durch das Ziehen von Pfeilen in der Modell-Arbeitsfläche realisiert wird, siehe unten). Alle diese Möglichkeiten können mittels eines Standardbrowsers durchgeführt werden. Zusätzlich zu diesen voreingestellten, geradlinigen Möglichkeiten der Benutzeroberfläche umfasst WebSTATISTICA auch ein Toolkit, welches den Anwendern ermöglicht, die Benutzeroberfläche anzupassen und benutzerdefinierte Anwendungen zu entwickeln, die bestimmte vordefinierte Funktionen enthalten. Diese Anpassungen können derart standardisiert werden, dass sie den Erfordernissen der bestimmten Anwendungen Rechnung tragen. Es besteht eine Vielzahl von interaktiven Möglichkeiten zur Durchführung bestimmter Datenbankoperationen, der Qualitätsregelung oder des Data Mining (einschließlich der STATISTICA-Handbuch – 289 Copyright © StatSoft, 2009 ANHANG B: WebSTATISTICA Die unübertroffene Kompatibilität mit Industriestandards ist ein weiterer Punkt in der langen Liste der einzigartigen Vorteile von WebSTATISTICA Server. WebSTATISTICA Server kann auf allen verbreiteten Webserver-Plattformen (z. B. UNIX/Apache oder IIS) installiert werden und erfüllt demnach auch die bestehenden lokalen Sicherheitsprotokolle (Firewalls), wie sie von den Firmenkunden verlangt werden. WebSTATISTICA Server verwendet fortgeschrittene proprietäre Technologie, die direkt von StatSoft entwickelt wurde, um die hohe Leistungsfähigkeit und Skalierbarkeit sicherzustellen (z. B., dass selbst für mehrere Mehrprozessor-Rechner der Ansatz der verteilten Verarbeitung effizient durchgesetzt werden kann). Diese Technologie basiert auf der jahrelangen Erfahrung, die StatSoft durch Bereitstellung und Einrichtung leistungsfähiger und hochskalierbarer Unternehmenssysteme bei bedeutenden Unternehmen in den Vereinigten Staaten und überall in der Welt erhalten hat. Die Protokolle, die WebSTATISTICA Server für den Datenaustausch verwendet, folgen jedoch dem Industriestandard (z. B. XML), um Folgendes sicherzustellen: (1) Plattformunabhängigkeit, (2) einen reibungslosen Übergang beim Vorhandensein neuer Technologien und (3) die 290 – STATISTICA-Handbuch Copyright © StatSoft, 2009 ANHANG B: WebSTATISTICA Erleichterung von Benutzeranpassungen für den Kunden. Hierbei ist zu beachten, dass Benutzeranpassungen zusätzlich durch die Tatsache erleichtert werden, dass ausschließlich dem Industriestandard folgende Syntaxkonventionen (wie VB, C++, HTML und XML) verwendet werden, um die verschiedenen Analyse- und Ausgabeoptionen in WebSTATISTICA zu konfigurieren. Obwohl im Allgemeinen das Design in einer typischen Konfiguration auf zwei Computern basiert, dem Webserver (z. B. auf einem UNIXApache-System) und zumindest einem STATISTICA Server (optional auf mehrere STATISTICA Server skalierbar), kann der STATISTICA Server in vielen Fällen auch auf demselben Rechner installiert werden, falls dies erwünscht wird (z. B. bei Verwendung von IIS): Das Design erlaubt unter Verwendung einer standardmäßigen Skriptsprache auf dem Webserver eine flexible Implementierung des Webservers in das System. Der Zweck des Webservers besteht darin, Anfragen von Anwendern zu bündeln (die von deren Browser erhalten werden), diese an den STATISTICA Server zu senden und anschließend die Antworten des STATISTICA Servers zu verarbeiten, so dass sie dem Anwender im Browser dargestellt werden können. Die Kommunikation zwischen Webserver und STATISTICA Server wird mittels einer Technologie realisiert, die den Industriestandard folgenden XML-Konventionen zugrunde liegt. Das System ist vollkommen anpassbar, und für Kunden, die ihre eigenen Modifikationen oder Erweiterungen für dieses (bereits einsatzfähige) System entwickeln möchten, wird ein Development Tool Kit angeboten, das die Modifikation aller Aspekte der Skripte ermöglicht, die von STATISTICA (auf STATISTICA Server-Seite) ausgeführt werden und die die Erscheinung der Benutzeroberfläche regeln, die den Anwendern auf der (browserbasierten) Clientseite entgegentritt. Hierbei werden nur standardmäßige, weitverbreitete Tools (wie VB oder XML/HTML) verwendet, um das System anzupassen oder zu erweitern. Die gegenwärtigen WebseitenDefinitionen und auszuführende STATISTICA-Skripte werden auf dem STATISTICA Server auf einen gesonderten Speicherplatz abgelegt, wo sie sequentiell verarbeitet werden. Das System umfasst darüber hinaus einen hoch optimierten Manager, der die eintreffende zu verarbeitende Last optimal über STATISTICA-Handbuch – 291 Copyright © StatSoft, 2009 ANHANG B: WebSTATISTICA die mehreren Pfade von STATISTICA und mehreren STATISTICA Server verteilt. Das Softwaresystem WebSTATISTICA Server enthält ebenfalls die STATISTICA Visual BasicWeberweiterungen. Diese Erweiterungen der SVB-Sprache ermöglichen dem SkriptSchreiber, die resultierenden Grafiken und Tabellen auf den automatisch generierten Webseiten darzustellen oder das Erscheinungsbild dieser generierten Ausgabeseiten durch das Hinzufügen von HTML-Befehlen wunschgemäß anzupassen. Sicherheit und Authentifikation sind Schlüsselfunktionen von WebSTATISTICA Server. Zum Beginn einer Sitzung melden sich die Benutzer mit ihrem Benutzernamen und Kennwort an. Hierbei ist es Systemadministratoren möglich, den Zugriff auf Datenquellen und Skripte anhand der Benutzer- oder Gruppenrechte zu regeln. Die höchste Stufe der Zugriffsrechte ermöglicht fortgeschrittenen Nutzern (oder Administratoren) die Ausführung von nahezu jedem beliebigem Skript (z. B. um die Systemadministration oder Wartungsarbeiten durchzuführen). Dieser Stufe müssen demnach gesonderte (höchste) Zugriffsrechte zugewiesen werden, da aufgrund der allgemeinen Struktur und Leistungsstärke von STATISTICA Visual Basic den autorisierten Nutzern der Zugriff auf alle Ressourcen des Netzwerks ermöglicht wird. Es ist zu beachten, dass dieses System innerhalb eines „traditionellen“ STATISTICA ConcurrentNetzwerkes (d. h. ohne Webfähigkeit) oder einer STATISTICA Enterprise-Lizenz integriert werden kann. Ein Kunde kann demnach WebSTATISTICA mit einer Netzwerk-Lizenz von 50 Nutzern kombinieren, so dass 20 dieser Nutzer den Zugriff auf den WebSTATISTICA Server erhalten. Die kompetitiven Vorteile von WebSTATISTICA Server beginnen offensichtlich mit der umfangreichen Liste von besonderen Features, die direkt in STATISTICA enthalten sind. Im Gegensatz zu Konkurrenzprodukten wird darüber hinaus eine komplette Anwendung (eine „Lösung“) mit einer webbasierten Benutzeroberfläche angeboten, die ein einfaches „Development Kit“ weit übertreffen. Außerdem ist es nicht erforderlich, dass zunächst eine bestimmte Webserver-Software installiert werden muss (die ggf. nicht mit den Sicherheitsstandards und anderen Vorgaben des Kunden in Einklang zu bringen sind). Darüber hinaus wird unser System mittels VB, C++, HTML und XML geregelt, die alle dem Industriestandard folgen und bequem von Anwendern oder Systemadministratoren modifiziert werden können. Hinzuzufügen ist, dass unsere Technologien der verteilten Verarbeitung und des Multithreading eine Leistung und Ansprechbarkeit des Systems liefern, die von keinem anderen Konkurrenzprodukt erreicht wird. Die Anwendung WebSTATISTICA Knowledge Portal ist optional verfügbar, womit Anwendern ermöglicht wird, Ausgabedokumente über das Internet effektiv und sicher zu verwalten. Es unterstützt die Einrichtung mehrerer Arbeitsgruppen von Nutzern (jede einzelne mit unterschiedlichen Zugriffsrechten, womit der Zugriff auf unterschiedliche Bereiche der Datenbank der Ausgabedokumente verwaltet wird), eine intuitive Baumansicht der verfügbaren Materialen und Optionen, die Dokumente auf dem Webserver zu veröffentlichen und in Echtzeit zu aktualisieren. Besuchen Sie die Website www.statsoft.com, um eine Präsentation über die Features von WebSTATISTICA zu betrachten. Der Film beinhaltet u. a. ein Schritt-für-Schritt-Beispiel. 292 – STATISTICA-Handbuch Copyright © StatSoft, 2009 Zusätzlich zu der Eigenschaft als umfassendes innovatives Analysewerkzeug bieten alle STATISTICA-Produkte frei gestaltbare Benutzeroberflächen (mit einfachen Knopfdrucklösungen für Neueinsteiger), flexible präsentationsreife Ausgabemöglichkeiten (einschließlich verschiedener Berichtsformate wie .pdf, Word, .rtf, .html und Ausgabe in ein Webportal), vollständige Unterstützung von OLE und ActiveX sowie Webfähigkeit. Außerdem enthalten alle Produkte ein optimiertes Datenmanagement zur Behandlung großer Datenbestände, interaktive Werkzeuge zur Datenbankabfrage und ein breites Spektrum an Import- und Exportfunktionen. Alle Produkte können Datenbestände unbegrenzten Umfangs, mehrere Eingabedateien und Multitasking handhaben. In jedes Produkt ist eine große Auswahl von Werkzeugen zur interaktiven Erstellung von Visualisierungen und Grafiken höchster Qualität integriert, sowie Automatisierungsoptionen und eine professionelle Visual Basic- und NETkompatible Entwicklungsumgebung mit mehr als 13.000 extern aufrufbaren Funktionen. Dieses Produkt bietet eine Auswahl grundlegender statistischer Verfahren in einem benutzerfreundlichen Paket, das alle Leistungen und die Bedienerfreundlichkeit der STATISTICA-Technologie bereithält. • Alle Grafikwerkzeuge von STATISTICA • Elementare Statistiken, Gliederungen und Tabellen • Verteilungsanpassung • Multiple lineare Regression • Varianzanalyse • Nichtparametrische Verfahren Dieses Produkt bietet ein umfassendes Spektrum von linearen und nichtlinearen Modellen mit fortgeschrittenen Prognosewerkzeugen einschließlich der Funktionen zur automatischen Modellbestimmung und umfassender interaktiver Grafikunterstützung. • Allgemeine Lineare Modelle • Verallgemeinerte lineare/nichtlineare Modelle • Allgemeine Regressionsmodelle STATISTICA-Handbuch – 295 Copyright © StatSoft, 2009 ANHANG C: PRODUKTFAMILIE • • • • • • • • Modelle partieller kleinster Quadrate Varianzkomponenten Survival-Analyse Nichtlineare Regression Quasilineare Regression Loglineare Analyse von Häufigkeitstabellen Zeitreihenanalyse/Prognose Strukturgleichungsmodelle Dieses Produkt bietet eine breite Palette von explorativen Techniken für unterschiedliche Datentypen mit interaktiven Visualisierungstools. • Clusteranalyse • Faktorenanalyse • Hauptkomponenten- und Klassifikationsanalyse • Kanonische Analyse • Diskriminanzanalyse • Allgemeine diskriminanzanalytische Modelle • Reliabilitäts- und Item-Analyse • Klassifikationsbäume • Korrespondenzanalyse • Multidimensionale Skalierung • Erwartete mittlere quadratische Abweichung und Varianzkomponenten mit Konfidenzintervallen • Flexible Handhabung von mehreren abhängigen Variablen, gleichzeitige Analyse von mehreren Variablen mit gleichem oder unterschiedlichem Design • Grafische Darstellungen der Varianzkomponenten Dieses Produkt beinhaltet eine umfassende Auswahl an Netzarchitekturen und TrainingsAlgorithmen. • Automatische Suche nach der besten Architektur • Multilayer-Perzeptron • Radiale-Basis-Funktionen • Selbstorganisierende Karten • Zeitreihenanalyse mittels Neuronaler Netze für Regressions- und Klassifikationsprobleme • Eine Auswahl von schnellen und effizienten Trainings-Algorithmen einschließlich Gradient-Descent, Conjugate-Gradient und BFGS • Eine Vielzahl analytischer Grafiken für eine Eine umfassende Auswahl an Techniken zur Analyse von experimentellen Daten, die sowohl feste als auch zufällige Effekte enthalten. Der Ansatz basiert auf REML (Restricted Maximum Likelihood Estimation), wobei es STATISTICA VEPAC ermöglicht, Schätzungen der Varianzkomponenten zu ermitteln und sie für Aussagen zur Genauigkeit verwenden, während beim Vergleich fester Effekte gleichzeitig mehrere Quellen von Streuung vorliegen. • Streuungsplots • Mehrere Plot-Layouts für den direkten Vergleich mehrerer abhängiger Variablen vereinfachte Interpretation der Ergebnisse • Stichprobenauswahl für die Optimierung der Netzwerkleistung und Verbesserung der Generalisierungsfähigkeit • Sensitivitätsanalyse, Lift-Charts und ROC-Kurven • Erstellen eines Gesamtnetzwerkes aus bereits bestehenden Einzelnetzwerken • Benutzerfreundliche C-Code und PMML (Predictive Model Markup Language) Neural Network Code Generators Dieses Produkt stellt ein präzises und benutzerfreundliches Forschungswerkzeug für die Analyse aller Aspekte der statistischen 296 – STATISTICA-Handbuch Copyright © StatSoft, 2009 ANHANG C: PRODUKTFAMILIE Teststärke (Macht) und der Berechnung von Stichprobenumfängen dar. • Berechnung von Stichprobenumfängen • Schätzung von Konfidenzintervallen • Generator für statistische Verteilungen Dieses Produkt bietet anpassungsfähige (z. B. aus anderen Umgebungen aufrufbare), präsentationsreife Regelkarten mit Automatisierungsoptionen zur Vereinfachung von Routineaufgaben (ein umfassendes Werkzeug für Six Sigma-Methoden). • Multiple Karten (Six Sigma-Stil) • X-quer und R-Karten; X-quer und S-Karten; Np-, P-, U-, C-Karten • Paretoanalyse • Prozessfähigkeitsindizes • MA- und MR-Karten, EWMA-Karten • Short-Run-Karten (inkl. Sollwert- und Zielwertkarten) • CuSum-Karten (kumulative Summen) • Runs-Tests • Interaktives, analytisches Brushing • Aktionen und Ursachen zuweisen, flexible Alarmmeldungen Dieses Produkt stellt ein umfangreiches Paket für Prozessfähigkeit, Wiederhol- und Vergleichpräzision und andere Verfahren im Rahmen der statistischen Prozesslenkung dar (ein umfassendes Werkzeug für Six SigmaMethoden). • Prozessfähigkeitsanalysen mit Grafiken • Ishikawa (Ursache-Wirkung)-Diagramme • Wiederhol- und Vergleichpräzision • Varianzkomponenten für Zufallseffekte • Weibull-Analyse • Stichprobenpläne Dieses Produkt bietet eine große Auswahl von Verfahren zur Erstellung und Auswertung von Versuchsplänen, Techniken zur Visualisierung und interaktive Wunschfunktionen zur Prozessoptimierung (ein umfassendes Werkzeug für Six Sigma-Methoden). • Fraktionelle faktorielle Pläne • Mischungspläne • Lateinische Quadrate • Suche nach optimalen 2(k-p)-Plänen • Residualanalyse und Transformationen • Optimierung von einzelnen/mehreren Response-Variablen • Zentral zusammengesetzte Pläne • Taguchi-Designs • Pläne minimaler Aberration und maximaler Unvermengtheit • 2(k-p) fraktionelle faktorielle Pläne mit Blöcken • Pläne mit Nebenbedingungen • D- und A-optimale Designs • Wunschprofile zur Prozessoptimierung Eine Komplettlösung zur multivariaten statistischen Prozesslenkung innerhalb einer skalierbaren SoftwarePlattform. • Univariate und multivariate Methoden für Qualitätssicherung, Prognosemodelle und Methoden zur Datenreduktion • Funktionen zur Bestimmung der kritischsten Prozesse, Rohmaterialien und Umgebungsfaktoren einschließlich der Bestimmung ihrer optimalen Einstellungen, um Produkte höchster Qualität herzustellen • Interaktive oder automatische Überwachung der Prozesseigenschaften während der einzelnen Produktionsschritte STATISTICA-Handbuch – 297 Copyright © StatSoft, 2009 ANHANG C: PRODUKTFAMILIE • Basierend auf Produktionsergebnissen bekannter Daten können Prognosemodelle erstellt, evaluiert und angewendet werden. • Interaktive Überwachung mittels DashboardZusammenfassungen und automatisch aktualisierten Ergebnissen • Automatisierte Überwachung mit Regeln, Alarm-Ereignissen und konfigurierbaren Aktionen • Multivariate Techniken einschließlich Partielle Kleinste Quadrate (PLS), Hauptkomponentenanalyse (PCA), Neuronale Netze, Rekursives Partitionieren, Support Vector Machines, Independent Components Analysis, Clusteranalyse usw. Zusätzlich zu den oben aufgelisteten allgemeinen Funktionen bieten die unternehmensweiten Lösungen von STATISTICA eine umfassende Auswahl von Groupware-Funktionalitäten, Benutzeroberflächen für Webbrowser (beim Gebrauch vom STATISTICA Web-Server), spezialisierte Datenbanken und eine hochoptimierte Schnittstelle zu unternehmensweiten Datenbeständen, einschließlich Optionen zur schnellen Vor-OrtVerarbeitung großer Datenmengen aus externen Servern ohne Erstellung lokaler Kopien. Darüber hinaus stehen Angebote zur Einrichtung und Schulung beim Kunden zur Verfügung. Dieses System bietet eine umfassende Auswahl von Data-Mining-Lösungen mit einer sehr einfach zu bedienenden Benutzeroberfläche (optional Webbrowserbasiert, siehe WebSTATISTICA Seite 300) und einer Deployment-Engine. Die integrierten und automatisierten Lösungen lassen sich für eine große Bandbreite von Geschäftsanwendungen verwenden und sind einfach einzurichten, dabei aber leicht anzupassen. Eine spezielle SPCVersion (QC Data Miner) für die Analyse großer Datenströme von QC-Daten ist ebenfalls verfügbar. Die Data-Mining-Lösungen werden über fünf mächtige Module gesteuert: • Allgemeiner Datenexplorer (optional mit OLAP) • Klassifizierer • Modellbilder/Multivariater Explorer • Prognostiker • Neural Networks Explorer Eine effiziente Softwarelösung für die Überwachung von Prozessen mit dem Ziel, Qualitätsprobleme zu identifizieren und vorherzusagen. STATISTICA Process Optimization umfasst alle Qualitätsregelkarten, Prozessfähigkeitsanalysen, Versuchsplanungsmethoden und Six-SigmaVerfahren einschließlich einer umfassenden Bibliothek von Techniken für das explorative und prädiktive Data Mining. • Qualitätsprobleme mit modernsten DataMining-Methoden vorhersagen • Ursachen von Problemfeldern ergründen • ROI (Return on Investment) überwachen und verbessern • Vorschläge für Verbesserungen erarbeiten • Prozesse über das Internet in Echtzeit überwachen • SPC-Lösungen über das Internet entwickeln und umsetzen • Verwendung von Multithreading und Distributed Processing, um extrem große Datenströme schnell verarbeiten zu können Eine leistungsstarke Softwarelösung für Text-Mining, Dokumentenwiederherstellung und die Analyse unstrukturierter Daten. Eine optionale Erweiterung für den STATISTICA 298 – STATISTICA-Handbuch Copyright © StatSoft, 2009 ANHANG C: PRODUKTFAMILIE Data Miner, die für den Zugriff und die Analyse von Dokumenten (unstrukturierter Information) in einer Vielzahl von Formaten entwickelt und optimiert wurde. Die Formate umfassen: .txt (Text), .pdf (Adobe), .ps (PostScriptTM), .html, .xml (Webformate) und die meisten Microsoft Office-Formate (z. B. .doc, .rtf). Der optimierte Zugriff auf Webseiten (URL-Adressen) wird ebenfalls unterstützt. • Effiziente Indexierung sehr großer Mengen von Textdokumenten; Ermittlung von Schlüsselwörtern und Ähnlichkeiten zwischen Dokumenten und Begriffen, Extraktion der relevanten Information • Anwendung von Ausschlusslisten (zu ignorierende Wörter) und sprachspezifischen Wortstammalgorithmen (eine Vielzahl von Sprachen wird unterstützt) • Zahlreiche Optionen, die Dokumente in numerische Information zu konvertieren, so dass sie weiterverarbeitet werden können (z. B. Mapping, Clustering, prädiktives Data Mining, Klassifikation von Dokumenten usw.) • Volle Unterstützung für Multithreading bei Installationen auf Mehrprozessor-Servern für die extrem schnelle Indexierung und Suche in riesigen Dokumentarchiven • Kann auch für die Indexierung und Analyse von anderen unstrukturierten Informationen, wie z. B. Sound- oder Bilddateien (nach Anwendung der entsprechenden Vorverarbeitung) verwendet werden • Vollständig in STATISTICA und WebSTATISTICA integriert, womit direkt auf eine große Anzahl verfügbarer Methoden für Learning-, Clusterverfahren, Mapping, Datenvisualisierungen usw. zurückgegriffen werden kann. Viele der Algorithmen, die im STATISTICA Data Miner verfügbar sind, wie z. B. die Machine-Learning-Algorithmen (k-Nearest Neighbor, Kernel-, Naiver BayesKlassifikator und Support Vector Machine) sind besonders gut für das Text Mining oder die Analyse anderer unstrukturierter Information geeignet. STATISTICA SAL adressiert Kundenbedürfnisse in verschiedenen Branchen wie dem Einzelhandel oder dem Banken- und Versicherungsgeschäft. Die implementierten Algorithmen sind extrem schnell und skalierbar, sie erlauben die Extraktion von Sequenz- und Assoziationsregeln innerhalb einer einzigen Analyse. Bereits als Stand-alone-Version kann das Tool sowohl für die Modellbildung als auch für den Modelleinsatz (Deployment) genutzt werden. Im STATISTICA Data Miner ist SAL als fester Tool-Bestandteil integriert, so dass die Ergebnisse aus STATISTICA SAL dort schnell und mühelos eingesetzt werden können. • Bei der Extraktion von Sequenz- und Assoziationsregeln wird auf eine Technik zurückgegriffen, wie sie bei der Bildung von Bäumen verwendet wird. • Beim Speichern der Sequenz- und Assoziationsmodelle kommt eine effiziente und zugriffssichere (thread-safe) relationale Datenbank-Technologie zum Einsatz. • Mehrfach-Antworten, mehrfache Dichotomien und metrische Variablen können innerhalb einer Analyse gehandhabt werden. • Innerhalb einer einzigen Analyse können sowohl Sequenz- als auch Assoziationsregeln ermittelt werden. • Sequenz- und Assoziationsregeln lassen sich für mehrere Dimensionen simultan ermitteln. • Aufgrund der Möglichkeit, assoziatives und sequenzielles Mining zu betreiben, sowie der Fähigkeit, Regeln für bestimmte Items zu extrahieren, lässt sich die Software für DataMining-Prognosen einsetzen. • Das Modul bietet eine hierarchische Clusteranalyse (Fusion über Nächster Nachbar, Single-Linkage), um wahrscheinlich STATISTICA-Handbuch – 299 Copyright © StatSoft, 2009 ANHANG C: PRODUKTFAMILIE auftretende Item-Cluster aufzuspüren. Hierin liegt ein hoher praktischer Nutzen, etwa im Einzelhandel. Ein integriertes Mehrbenutzersystem für die allgemeine Datenanalyse und als Informationsdienst im Forschungsbereich eines Unternehmens. STATISTICA Enterprise kann optional die Funktionen eines beliebigen oder auch aller STATISTICA-Produkte zur Verfügung stellen. • Data Warehouse-Integration • Intuitive Abfrage- und Filterwerkzeuge • Benutzerfreundliche Administration • Automatische Verteilung von Berichten • Benachrichtigung bei Alarm-Ereignis Dieses Produkt wurde für Anwendungen (einschließlich Six SigmaMethoden) für die lokale und globale Qualitätssicherung entwickelt. STATISTICA Enterprise/QC bietet unter anderem eine leistungsstarke Datenbank (oder eine optimierte Schnittstelle zu bereits bestehenden Datenbanken), Überwachung der Produktion und Benachrichtigungen über Alarm-Ereignisse in Echtzeit, eine umfassende Auswahl von Analysewerkzeugen für Ingenieure, hochentwickelte Berichtsfunktionen für die Betriebsleitung und eine flexible Berichtsgestaltung. • Webfähige Benutzeroberfläche und Berichte, Werkzeuge für interaktive Datenbankabfrage • Nach Anwendertyp differenzierte Oberfläche (z. B. Werker, Ingenieur usw.) • Groupware-Funktionalität für die gemeinsame Nutzung von Datenbankabfragen und anderen speziellen Anwendungen • Unbefristete Benachrichtigungen über AlarmEreignisse einschließlich Ursache- und Aktionsmeldungen • Skalierbar, anpassbar und kann in bereits bestehende Datenbanken/ERP-Systeme integriert werden Diese Erweiterung ermöglicht das automatisierte Überwachen von bis zu Tausenden kritischen Prozessen und Produktparametern. Die fortlaufende Überwachung ist eine automatisierte und effiziente Methode für: • Simultane Überwachung vieler kritischer Parameter • Das Bereitstellen von „Schnappschüssen“ der aktuellen Resultate der Überwachungsaktivitäten, die anhand der Zuständigkeiten der Belegschaft zugeordnet werden können • Dashboards, die mit Benutzern/Gruppen assoziiert werden Die Softwarelösung zum Erkennen und Implementieren effektiver Strategien für die fortgeschrittene multivariate Prozessüberwachung und -lenkung. STATISTICA MultiStream wurde allgemein für die Prozessindustrie konzipiert, ist allerdings besonders gut geeignet, Betreibern von Kraftwerken zu helfen, ihre Daten (aus bereits bestehenden Prozessdatenbanken für die multivariate Prozessüberwachung) in Beratungssysteme wirksam einzusetzen. STATISTICA MultiStream ist ein komplettes Unternehmenssystem, das (bei voller Webfähigkeit) auf einer robusten, hochentwickelten Client-Server-Architektur basiert. Es bietet die Möglichkeit einer zentralen Verwaltung der angewendeten Modelle sowie brandaktuelle Technologien für Ursache-Wirkungs-Analysen und Data-MiningPrognosen. Die Analysewerkzeuge sind nahtlos in einem eingebauten Dokumentenmanagementsystem integriert. 300 – STATISTICA-Handbuch Copyright © StatSoft, 2009 ANHANG C: PRODUKTFAMILIE • Automatisierte (nichtlineare) UrsacheWirkungs-Analyse und Feature Selection von Tausenden Parametern, um eindeutig zu erkennen, welche Parameter höchstwahrscheinlich die Prozessprobleme verursachen • Automatisierte und interaktive Analyse gemeinsamer Anforderungen, um Parameter und Prozesse zu identifizieren, die in einem bestimmten Zeitintervall vom normalen Betriebsablauf abweichen • Hochentwickelte lineare und nichtlineare Modelle (z. B. SVM, Rekursives Partitionieren, Neuronale Netze) zum Erstellen feinfühliger multivariater Kontrollmechanismen, um multivariate Abweichungen früh zu erkennen, bevor Probleme verursacht werden • STATISTICA kann auf jedem beliebigen Rechner (einschließlich Linux, UNIX) interaktiv via Webbrowser ausgeführt werden • Zeitaufwendige Tasks können auf den Server geladen werden • Verwendung einer mehrstufigen ClientServer-Architektur • Projektbetreuung über das Internet • Koordinierung von Projekten „über den Büroflur oder über Kontinente hinweg“ • Unterstützung von Multithreading und verteilter Verarbeitung selbst bei mehreren Servern. • Hochentwickelte Data-Mining-Algorithmen zur Prognose und Optimierung der Schlüsselindikatoren • Gleichzeitiges Verfolgen von Hunderten von Datenströmen • Übersichtliche Zusammenfassungen von Ergebnissen kritischer Prozessparameter mittels effizienter Dashboards und DrillDown-Optionen • Standardisierte und benutzerangepasste Analysewerkzeuge zur Ursache-WirkungsAnalyse mittels Verwendung brandaktueller Data-Mining-Technologien • Warnungen bezüglich (prognostizierter) Probleme und Gerätefehler, bevor sie auftreten (prädiktiver Alarm), womit kostspieliges Herunterfahren und außerplanmäßige Wartungen vermieden werden • Beobachtet in Echtzeit „alles“, was die Prozessleistung beeinflusst Das ultimative Unternehmenssystem, das volle Webfähigkeit bietet: Eine komplette, hochskalierbare Lösung für die Verwaltung elektronischer Dokumente. Mit dem STATISTICA Document Management System können Dokumente jeglichen Typs schnell, effizient und sicher verwaltet werden [z. B. Auffinden, Zugriff, Inhaltssuche, Überprüfung, Organisierung, Bearbeitung (mit Audit-Trail und Versionsführung), Freigabe usw.]. • Sehr transparent und benutzerfreundlich • Flexible, anpassbare (optional browser/webfähige) Benutzeroberfläche • Elektronische Signaturen • Umfangreiche Audit-Trail-Optionen • Optimierte Suche • Werkzeuge für Dokumentenvergleich • Datensicherheit • Erfüllt FDA 21 CFR Part 11 • Erfüllt Dokumentationsanforderungen von ISO 9000 (9001, 14001) • Unbegrenzte Skalierbarkeit (von Desktopoder Netzwerk-Versionen bis zu allumfassenden webbasierten weltweiten Systemen) STATISTICA-Handbuch – 301 Copyright © StatSoft, 2009 ANHANG C: PRODUKTFAMILIE • Offene Architektur und Kompatibilität mit Industriestandards • Eine optionale STATISTICAKomponente, die dem Anwender die direkte Integration von Daten ermöglicht, die in der PI Data Historian gespeichert sind. STATISTICA PI Connector verwendet die PI-Benutzerkontensteuerung und das zugehörige Sicherheitskonzept, ermöglicht das interaktive Browsen nach Tags und zieht aus den speziellen PI-Funktionalitäten den Nutzen für Interpolation und Snapshot der Daten. Ein innerhalb eines PI-Systems integriertes STATISTICA wird für straffe und automatisierte Analysen verwendet, wie sie beispielsweise in FDA-regulierten Industrien (Process Analytical Technology – PAT), in der chemischen und petrochemischen Industrie (Advanced Process Control – APC) und in der Energie- und Versorgungsindustrie für Compliance und Beratungssystemen zur Prozessoptimierung von Vorteil sind. Die komplette, leistungsstarke, skalierbare und auf Kundenbedürfnisse anpassbare DataWarehouse-Lösung, die darüber hinaus optional anbietet, die umfassendste Auswahl an Analysewerkzeugen vollständig in das System zu integrieren. Die Anwendungen für STATISTICA Data Warehouse sind hierbei in Komponenten zusammengefasst, die sich flexibel wählen lassen. Diese Komponente umfassen: • STATISTICA Data Warehouse Server Database • STATISTICA Data Warehouse Query (ausgestattet mit WebSTATISTICA Query) • STATISTICA Data Warehouse Analyzer (ausgestattet mit WebSTATISTICA Data Miner, WebSTATISTICA Text Miner, WebSTATISTICA Process Optimization oder • • • optional mit allen Analysewerkzeugen von WebSTATISTICA) STATISTICA Data Warehouse Reporter (ausgestattet mit WebSTATISTICA Knowledge Portal und/oder WebSTATISTICA Interactive Knowledge Portal) STATISTICA Data Warehouse Document Repository (ausgestattet mit WebSTATISTICA Document Management System) STATISTICA Data Warehouse Scheduler STATISTICA Data Warehouse Real Time Monitor and Reporter (ausgestattet mit WebSTATISTICA Enterprise oder WebSTATISTICA Enterprise/QC) Falls Sie den Data-Warehouse-Prozess neu in Ihr Unternehmen integrieren, können StatSoftBerater Sie Schritt-für-Schritt durch den gesamten Prozess begleiten – vom Entwurf der optimalen Data-Warehouse-Architektur, dem eine umfassende Überprüfung Ihrer Informationsspeicherung und Extraktions/Analysebedürfnisse zugrunde liegt, bis zur abschließenden Schulung Ihrer Angestellten und Technischen Support. Die entscheidenden Features und Vorteile der STATISTICA Data Warehouse-Lösung umfassen unter anderem: • Eine komplette Anwendung für den DataWarehouse-Prozess, die speziell für Ihr Unternehmen maßgeschneidert ist • Plattformunabhängige Architektur, die eine nahtlose Integration mit Ihrer bestehenden Infrastruktur sicherstellt • Möglichkeit zur Datenintegration aus einer Vielzahl von Quellen • Nahezu unbegrenzte Skalierbarkeit • Aktualisieren und Synchronisieren von Daten verschiedener Quellen – manuell oder automatisch via Scheduler • Komplett webfähige Systemarchitektur, um die ultimativen Funktionalitäten rund um den Globus allen Standorten Ihres Unternehmens 302 – STATISTICA-Handbuch Copyright © StatSoft, 2009 ANHANG C: PRODUKTFAMILIE • • • • • • • zur Verfügung zu stellen (z. B. durch Zugriff mittels Webbrowser) Hochentwickeltes Sicherheitskonzept und Authentifizierung Umfassende Optionen zum Dokumentenmanagement, um die Verwaltung der Dokumente verschiedener Dateitypen zu optimieren und um Regulierungsauflagen zu erfüllen (z. B. FDA 21 CFR Part 11 und ISO 9000) Hochentwickelte analytische Komponenten zur Säuberung und Abgleich von Daten und um automatisiertes Data Mining, Artificial Intelligence und Prozessüberwachung in Echtzeit zu integrieren Automatisches Veröffentlichen maßgeschneideter Berichte im Knowledge Portal, einschließlich interaktiver Berichte und Ergebnisse (d. h. bei Erhalt der Anpassungsfähigkeit für einzelne Nutzer, inklusive DrillDown-Option und Teilauswahl) Backups und Archivierungen Für bestimmte Aufgabenprofile programmierbar, anpassbar und erweiterbar (offene Architektur, die Erweiterungen mittels VB, C++, Java und HTML zulässt) Basierend auf robuster, ausgiebig getesteter, hochskalierbarer, brandaktueller Technologie, um Ihre Investition zum Durchbruch zu verhelfen [einschließlich der hochoptimierten IDP-Technologie (In-Place Database Processing), Multithreading, Distributed/ Parallel Processing und der Möglichkeit, CPU-Ressourcen mehrerer Server zusammenarbeiten zu lassen, um nahezu die Performance eines Supercomputers zu erhalten] STATISTICA Data Warehouse ist eine Komplettlösung zur Datenspeicherung und Informationsverteilung, die ermöglicht, den Informationsfluss innerhalb Ihres Unternehmens zu steuern, so dass allen autorisierten Mitarbeitern flexibler, sicherer und schneller Zugriff auf kritische Informationen zur Verfügung gestellt werden kann. Das System ist nahezu plattformunabhängig und passt in jede bestehende Datenbankarchitektur und Hardwareumgebung. Informationen aus mehreren Datenbankformaten und -quellen (von manuellen Dateneinträgen bis zu Einrichtungen zur automatischen Datenerfassung) können effizient kombiniert werden. Darüber hinaus kann das System durch Integration von weiteren vollständig kompatiblen Komponenten der STATISTICA-Produktlinie erweitert werden. Zu diesen Komponenten gehören unter anderem: • STATISTICA Data Miner für hochentwickelte Lösungen, die auf Data Mining und künstlicher Intelligenz (z. B. Neuronale Netze) basieren, um mit innovativen Methoden aus den Daten Wissen und Prognosen zu generieren • STATISTICA Process Optimization und Enterprise/QC die enge Integration mit der Softwarelösung für Qualitäts- bzw. Prozessregelung und Ertragsmanagement • STATISTICA Text Miner für das automatische Verarbeiten unstrukturierter Information in Dokumenten, Datenbanken oder Webverzeichnissen (via Webcrawling) • STATISTICA Knowledge Portal für die Präsentation von Berichten, Karten und Handlungsanweisungen mittels eines sicheren Access-Portals über das Internet, um die Informationen und Entscheidungshilfen den Endanwendern (Management, Vertrieb, Ingenieure usw.) weltweit zur Verfügung zu stellen (d. h., dass man von überall auf der Welt mittels eines Webbrowsers auf das STATISTICA Knowledge Portal Zugriff hat) STATISTICA Data Warehouse kann mit jeder Plattform, Datenbank oder Datenquelle verbunden werden und kann auf jede beliebige Betriebsgröße bzw. jeden Anwendungsumfang angepasst werden. Das Programm basiert auf STATISTICA-Handbuch – 303 Copyright © StatSoft, 2009 ANHANG C: PRODUKTFAMILIE einer Datenbank und einem Datenbankschema, das speziell für Ihr Unternehmen angepasst wird. Die Lösung kann entweder einschließlich einer leistungsstarken Datenbank-Engine (SQL Server) installiert werden oder als (virtuelles) Datenbankschema, das mit den meisten dem Industriestandard folgenden Datenbanken kompatibel ist. STATISTICA Data Warehouse kann demnach nahtlos in Ihr bereits bestehendes Datenbanksystem integriert werden. Da STATISTICA Data Warehouse nicht für einen speziellen Datenbank-Anbieter oder eine spezielle Hardware konzipiert wurde, besteht vollkommene Plattformunabhängigkeit. Die Data Warehouse-Software kann mit jedem Datenbankformat verbunden werden, so dass Information aus verschiedenen Quellen effizient kombiniert und zusammengefasst werden kann. Die Anwendungssoftware von STATISTICA Data Warehouse kann auf Servern mit mehreren Prozessoren oder auf einer Bank von Mehrprozessor-Servern ausgeführt werden, so dass nahezu die Performance eines Supercomputers erreicht wird. Das System kann sich mühelos selbst riesigen Datengrößen und Analyseproblemen anpassen. STATISTICA Data Warehouse extrahiert Information aus Quellen, die sich überall auf der Welt befinden können, und kann anschließend die Analyseergebnisse einem Rechner zur Verfügung stellen, der sich überall auf der Welt befinden kann. Die Webkomponente des Systems basiert auf bewährter WebSTATISTICA-Technologie, die weltweit von Unternehmen verwendet wird, um sicheren Zugriff mittels standardmäßiger Webbrowser zu gewährleisten. Im Gegensatz zu anderen webbasierten Lösungen erfordert STATISTICA Data Warehouse keine zusätzlichen Komponenten, die auf den ThinClients installiert werden müssen. Das System kann demnach weltweit von (autorisierten und authentifizierten) Nutzern verwendet werden: aus Hotelzimmern via Modem, von zu Hause aus, aus dem Büro oder aus Produktionsstätten, die sich auf den entferntesten Orten der Welt befinden können (via Satellitenverbindung). STATISTICA Data Warehouse implementiert ein detailliertes und technisch ausgereiftes Sicherheitssystem, um sicherzustellen, dass das firmeneigene Wissen vor unautorisierten Zugriffen geschützt ist. Da dieses System als Informationsdienst des Unternehmens als das hauptsächliche Entscheidungshilfesystem dient, ist die Sicherheit dieses Systems die oberste Priorität. Durch das Einführen von Nutzergruppen mit unterschiedlichen Zugriffsrechten (bezüglich der Information und durchführbaren Tätigkeiten) und der Erfordernis der regelmäßigen Passwortaktualisierung implementiert STATISTICA Data Warehouse den höchsten Grad an Sicherheit. Darüber hinaus werden besondere Sicherheitsvorkehrungen getroffen, um Eindringungsversuche ("Hacking") zu erkennen und zu verhindern. STATISTICA Data Warehouse ermöglicht vollständiges Dokumentenmanagement, das dem Industriestandard und gesetzlichen Richtlinien folgt. STATISTICA Document Management System kann nahtlos in STATISTICA Data Warehouse integriert sein, um den Informationsfluss innerhalb des Unternehmens zu optimieren, so dass sich hieraus Produktivitätssteigerungen ergeben. Darüber hinaus kann dieses System derart konfiguriert werden, dass es alle Richtlinien zum Dokumentenmanagement sowie alle Regulierungen zur Dokumentensicherheit, Audit-Trails und Elektronischen Signaturen/Authentifizierung erfüllt (beispielsweise vorgeschrieben nach FDA 21 CFR Part 11: Elektronische Aufzeichnungen; 304 – STATISTICA-Handbuch Copyright © StatSoft, 2009 ANHANG C: PRODUKTFAMILIE Elektronische Unterschriften oder ISO 9001 4.2: Allgemeine Forderungen zur Dokumentation). STATISTICA Data Warehouse kann die fortschrittlichsten Methoden der Datenanalyse umfassen, die weit über OLAP hinausgehen, um die komplexesten – und für andere Anwendungen unzugänglichen – Muster in den Daten für die Wissensextraktion zu vereinfachen. Da STATISTICA Data Warehouse aus denselben leistungsstarken Komponenten wie die gesamte STATISTICA-Produktlinie besteht, können diese Analysewerkzeuge bequem und nahtlos integriert werden. STATISTICA bietet das umfassendste Paket an Werkzeugen für Data Mining, Text Mining, Datenanalyse, Grafiken (bzw. Visualisierungen), Qualitäts- und Prozesslenkung (einschließlich Six Sigma) auf dem Markt an. Diese Ressourcen und Technologien können in STATISTICA Data Warehouse direkt mit den Datenquellen verbunden werden, so dass die fortschrittlichsten Technologien und Algorithmen für alle Quellen wirksam eingesetzt werden können. Es lassen sich beispielsweise Hunderte von NeuronalenNetzwerk-Architekturen, leistungsstarke Baummethoden für Klassifikationsprognosen (z. B. stochastisches Gradient Boosting), flexible Ursache-Wirkungs-Analysen, Regelkartenmethoden, mächtige BusinessForecasting-Methoden oder hochentwickelte grafische Analysemethoden anwenden, um die Rohdaten im Data Warehouse in nützliche und verwertbare Information zu verwandeln, so dass sich für Unternehmensentscheidungen klare Implikationen ergeben. STATISTICA Data Warehouse ist eine offene Architektur, so dass man nicht in die Abhängigkeit eines einzelnen Anbieters gezwängt wird. Man kann demnach schnell auf Anforderungen reagieren, die im Data Warehouse aufgenommen werden sollen. Wie bei allen anderen Anwendungen und Lösungen der STATISTICA-Produktfamilie lässt sich auch STATISTICA Data Warehouse mittels Programmiersprachen wie Visual Basic, C++, Java oder HTML automatisieren und anpassen. Dieses Feature ist von besonderer Bedeutung, wenn es für Ihr Unternehmen erforderlich ist, sich neuen Informationen und Marktsituationen schnell anzupassen. Da das System angepasst werden kann, ohne gezwungen zu sein, auf Programmierer eines bestimmten Anbieters zurückzugreifen, die sich auf eine spezifische Programmiersprache spezialisiert haben (was bei vielen Konkurrenzprodukten erforderlich ist), besteht nach wie vor die Freiheit, die gewünschten Data-Warehouse-Erweiterungen selbständig zu entwickeln. Neben benutzerangepassten Berichten können auch Analysen und Datentransformationen mittels VB, C++, Java oder HTML maßgeschneidert werden. Darüber hinaus bietet StatSoft ergänzend Dienstleistungen bezüglich Systemintegration, Programmierungen und Consulting an. Eine komplette Softwarelösung für die verarbeitende Industrie, die (mittels bereits gesammelter und verwalteter Daten) die fundamentalen kausalen Zusammenhänge zwischen den Produkten und deren zugrundeliegenden Prozessen herausdestilliert. PROCEED implementiert den patentierten Ansatz, der von Caterpillar Inc. entwickelt wurde und sich dort unter der Verwendung der STATISTICA Enterprise bewährt hat. Unternehmen im Hochtechnologie-Sektor sammeln heutzutage eine unermessliche Menge an Daten. • Daten über die Produktionsprozesse STATISTICA-Handbuch – 305 Copyright © StatSoft, 2009 ANHANG C: PRODUKTFAMILIE • Daten über Tests der Rohmaterialien, Teilerzeugnisse und Werkstoffe, die gerade verarbeitet werden • Daten über die qualitätskritischen Merkmale eines Produkts. All diese Bestrebungen der Datenerfassung werden durch die zunehmende Automatisierung, gesteigerte Speicherkapazitäten und Fortschritte in der Sensor- und Messtechnik weiterhin vorangetrieben. Für die heutigen Produzenten stellen die verfügbaren Informationen eine Goldmine dar – allerdings nur dann, wenn sie dazu in der Lage sind, dies in verwertbare Information umzumünzen. Die Erhebung von Daten ist nicht hinreichend, um Veränderungen im Unternehmen zu bewirken. Um die Veränderungen durchzusetzen, müssen die Daten zunächst in Wissen transformiert werden, das dann in ein Format übersetzt werden muss, welches ermöglicht, mit denjenigen zu kommunizieren, die diese Änderungen durchführen können. Mit PROCEED ist es nun möglich, bezüglich der Datenerfassung einen positiven Return on Investment zu erzielen. PROCEED kombiniert neue und traditionelle Methoden der Wissensextraktion, um: Alternative zu Investitionen in neue oder aktuellere Betriebseinrichtungen (Hardware), die mehrere Millionen Euro erfordern. Basierend auf mehr als 20 Jahre an Erfahrung in der Anwendung von Data-Mining-Prognosen und der Entwicklung von Technologien zur Prozessoptimierung in verschiedenen Industrien wird es Kraftwerken mit STATISTICA PowerSolutions ermöglicht, die vorliegenden Betriebseinrichtungen und Kontrollsysteme optimal zu nutzen. Hierbei werden aus den verschiedenen Anlagen alle gesammelten Daten wirksam eingesetzt, um die Gelegenheiten zur Optimierung aufzuspüren. Dies gilt auch für ältere Modelle wie Zyklonfeuerung mittels Kohlenstaub (mit Wandfeuerung als auch Tangentialfeuerung). • einfache und komplexe kausale Zusammenhänge zwischen Produktionsprozessen und Produktqualität herzuleiten und zu validieren • verwertbare Information anzuwenden, so dass Prozessverantwortliche und Spezialisten verschiedene Was-wäre-wenn-Szenarien vergleichen und bei Zielkonflikten simultan optimieren können Dies ist ein Lösungskonzept für Energieversorgungsunternehmen, um die Kraftwerksleistung zu optimieren, die Effizienz zu steigern und die Emissionen zu reduzieren. Dieses Produkt ist eine sehr attraktive 306 – STATISTICA-Handbuch Copyright © StatSoft, 2009 ANHANG C: PRODUKTFAMILIE STATISTICA-Handbuch – 307 Copyright © StatSoft, 2009 HANDBUCH: INDEX .NET 269 Abfrage 263 ActiveX 185, 194, 257 Dokumente 258 Objekte 257 Allgemeine Einführung Benutzeroberfläche 3 Bes. Eigenschaften 4 Software-Technologie 5 Webfähigkeit 7 Allgemeine Lineare Modelle 37, 295 Analyse fortsetzen 256 Register Standard vs. Register Details 18 wiederholen 255 Analyse-Makros 242 Analysen für Gruppen 46 ANOVA-Beispiel 34 Anpassung 12, 133 Bedienung von STATISTICA 231 Benutzeroberfläche 232 Dokumente 233 Erscheinungsbild von STATISTICA 231 Grafiken 29, 208, 235 Individuelle Arbeitsweise 134 lokal vs. permanent 233 Netzwerk 237 STATISTICA Visual Basic 149, 241 Steuerung aus anderen Anwendungen 149 Symbolleisten 147 Systemstandards 234 verschiedene Konfigurationen 236 Ansicht-Menü 233 Arbeitsmappe 16, 21, 23, 24, 25, 47, 93, 94, 96, 134, 147, 152, 157, 158, 159, 160, 162, 163, 167, 180, 181, 186, 187, 188, 193, 194, 203, 232, 233, 234, 250, 252, 253, 255, 258 Analyse wiederholen 255 Anmerkungen und Kommentare 159 Baum 187 Eingabetabelle 192 Überblick 185 Attributive Messsystemanalyse 84 Audit-Trail 103 Ausgabe 15 Arbeitsmappe 158, 185 Bericht 162, 194 Einzelfenster 160 Grafik 196 HTML 166 Microsoft Word 165 PDF 164 Tabelle 189 Web 167 Ausgabesteuerung 141, 157 Ausreißer umkodieren 70 Autofiltern 140 Auto-Sichern 158 Datenaufbereitung – Säuberung und Filterung 65 Direkter Datenzugriff auf Datenbanken 60 Eingabedaten direkt aus Excel 57 Ergebniszusammenfassungen 79 Gruppenanalyse 46 Korrelationen 11 STATISTICA Data Miner Recipe 86 STATISTICA Enterprise 110 STATISTICA im regulierten Umfeld 102 STATISTICA Visual Basic 248 Tabellen- und BatchFormeln 74 Variablenbündel 42 WebSTATISTICA 97 Benutzeroberfläche 3 Ablauf der Analyse 137 anpassen 133, 232 Eigenschaften 133 interaktiv 136 Bericht 25, 162, 194 aus Arbeitsmappen 163 Baum 195 GxP 108 HTML 166 Microsoft Word 165 PDF 164 RTF 164 Browserbasierte Benutzeroberfläche 150, 283 Brushing 139, 222 Batch-Formeln 74, 76 Beispiele ANOVA 34 C/C++ 5 Codes 37, 72, 109, 110 308 – STATISTICA-Handbuch Copyright © StatSoft, 2009 HANDBUCH: Data Miner 298 Deployment 95 Data Miner Recipe 86, 199 Projektdateien 201 Data Warehouse 302 Data-Mining-Menü 142 Daten Auswahl der Datei 13 Batch Formeltransformationen 74, 77, 78 direkter Zugriff auf Datenbanken 60 Dubletten filtern 66 Missing Data 71 Säubern und Filtern 65 Transformationen 305 umkodieren 66, 68, 72, 74 Unvollständige Daten filtern 68 Datenbanken Direkter Zugriff 60 Datentabellen 13 DDE (Dynamic Data Exchange) 259 Dialog Optionen Grafikregister 208 Dialoge Analysespezifikation 138 Ausgabeselektion (Ergebnisse) 138 Intelligente Dialogführung 19 Optionen 16 DIN 55319 80, 84 Document Management System 301 Dokumente anpassen 233 Dokumenttypen 145 Symbolleisten 146 Drag & Drop siehe Ziehen-und-Ablegen Eingabetabellen 192 Einzelfenster 160 Elektronisches Handbuch 33, 277 Elektronisches StatistikLehrbuch 26 Enterprise-Linie 298 Ergebnistabelle 22 Ergebnisübersicht 83 Ergebniszusammenfassungen 79 Excel 31, 55, 57, 58, 59, 147, 149, 152, 153, 158, 162, 185, 187, 188, 194, 195, 196, 213, 245, 246, 258, 259 Eingabedaten direkt aus Excel 57 in STATISTICA öffnen 152 Export der Ausgabe 6, 15 Export von Daten 295 Externe Datenbanken 265 Externe Server 265 Extras-Menü 234 Fähigkeitsanalyse siehe Prozessfähigkeitsanalyse Fälle Dubletten filtern 66 Schaltfläche in der Symbolleiste 13 Fallnamen 191 Fallstatus 222 Filtern von Daten siehe Daten – Säuberung und Filterung Formel in Tabellen 14 INDEX Funktion extern aufrufbar 3, 246, 295 intern verwendete 12, 74, 75, 104, 151, 211, 245 Grafiken 196, 207 Anpassung 208, 210, 219, 235 automatische Aktualisierung 152 benutzerdefinierte 209 Blockdaten 214, 218 Brushing 222 Eingabedaten 214, 215 Fallstatus 222 Kategorien 214 Menü 220 mit STATISTICA Visual Basic erzeugen 227 Referenzen 209 Spezielle Grafiken 226 Standardgrafiken 219 STATISTICA Visual Basic 209 Zusammenfassung 79 Grafikfenster anpassen 29 erstellt aus Tabellen 28 Grafik-Menü 143 GxP-Bericht 108 Hilfe 33, 277 Höhere Modelle 295 HTML 151, 284, 291, 292, 299, 303, 305 Import von Daten 6, 152, 265, 285, 295 STATISTICA-Handbuch – 309 Copyright © StatSoft, 2009 HANDBUCH: INDEX ISO 21747 80, 82, 83, 84 Java 5 k-Nearest-Neighbor 72 Knoten 89 Knowledge Portal 167, 178 Kontextmenü 15 Kopieren 24 Kopieren mit Kopfzeile 24 Korrelationsbeispiel 11 Korrelationsmatrix 16 Makros 42, 197 Analyse-Makros 242 aufzeichnen 4, 42, 53, 149, 241, 242, 243 in Symbolleisten/Menüs hinzufügen 247 Master-Makros 243 Tastatur-Makros 243 über Befehlszeile ausführen 248 Master-Makros 243 Mehrere Analysen durchführen 134 Menü Ansicht 233 benutzerdefiniert 148 Data Mining 142 Datei 13 Daten 13 Extras 234 Fälle-Schaltfläche 13 Grafik 143 Kontextmenü einer Tabelle 15 Statistik 142 Var.-Schaltfläche 13 Microsoft OfficeIntegration 152, 258 Microsoft Word Bericht 165 Integration 153 Missing Data 59, 69, 71, 72, 73, 87, 107, 202 auf einen bestimmten Wert setzen 71, 72, 106 ersetzen 72, 73 Modell-Deployment 298 Monitoring and Alerting Server 300 Multimedia-Tabelle 13, 189 Multivariate explorative Verfahren 296 Multivariate statistische Prozesslenkung 297 Navigationsbaum (Bericht) 195 Neuronale Netze 296 Nodes 89 Office-Integration siehe Microsoft OfficeIntegration OLE-DB 263 OLE-Objekte 195 OLE-Unterstützung 258 Optionen Analyse fortsetzen 144 Automatisches Minimieren 143 Auto-Sichern 158 in den Vordergrund 145 Info-Box verbergen 145 verbergen 144 PDF-Datei speichern als PDF 165 PI connector 302 Poweranalyse 296 PROCEED 305 Process Optimization 298 Projekte siehe STATISTICA-Projekte Prozessanalyse 297 Prozessfähigkeitsanalyse 80 QC Miner siehe Process Optimization Qualitätsregelkarten 297 Query 263 Recipe siehe Data Miner Recipe Register Standard 4, 18, 19, 21, 36, 38, 44, 82, 180, 231 Regulierte Bereiche 102 RTF Bericht 164 Format 194 SAL (Sequence Association and Link Analysis) 299 Server-Integration 97 Six-Sigma-Grafiken 79 Six-Sigma-Werkzeuge 297 Sperren von Tabellen 106 SQL 60, 64, 119, 120, 125, 127, 263, 264, 304 Standardeinstellungen 234 Start-Menü 137 310 – STATISTICA-Handbuch Copyright © StatSoft, 2009 HANDBUCH: STATISTICA Anpassung 231 Aufruf aus anderen Anwendungen 149 Bes. Eigenschaften 4 Gemeinsame Systemeigenschaften 295 Software-Technologie 5 Übersicht der Kernfunktionen 3 STATISTICA Automated Neural Networks 296 STATISTICA Basis 295 STATISTICA Data Miner 298 STATISTICA Data Miner Recipe 86, 199 STATISTICA Data Warehouse 302 STATISTICA Document Management System 301 STATISTICA Enterprise 300 STATISTICA Enterprise Manager 110 STATISTICA Enterprise/QC 300 STATISTICA EnterpriseLinie 298 STATISTICA Explorative Verfahren 296 STATISTICA Höhere Modelle 295 STATISTICA Monitoring and Alerting Server 300 STATISTICA MultiStream 300 STATISTICA Multivariate Statistische Prozesslenkung 297 STATISTICA PI Connector 302 STATISTICA Poweranalyse 296 STATISTICA PowerSolutions 306 STATISTICA Process Optimization 298 STATISTICA Prozessanalyse 297 STATISTICA Qualitätsregelkarten 297 STATISTICA Query 263 STATISTICA Sequence Association and Link Analysis 299 STATISTICA StartSchaltfläche 146 STATISTICA Text Miner 298 STATISTICA Unternehmensweites Data-Mining-System 298 STATISTICA Variance Estimation and Precision 296 STATISTICA Versuchsplanung 297 STATISTICA Visual Basic 42, 149, 197, 209, 241 Analyse-Makros 242 Beispiel 248 Editor und Debugger 243 Eigenschaften 149 Master-Makros 243 Methoden 149 mit SVB Grafiken erstellen 227 Programme ausführen 246 Struktur 246 Tastatur-Makros 243 STATISTICA-Projekt speichern 198 STATISTICA-Projekte 198 Statistik-Menü 142 Statistischer Berater 33 INDEX StatSoft Website 278 Streuungsplot 49, 50 STR-Format 194 Symbolleiste 138, 146 anpassen 147 benutzerdefiniert 147 Tabelle 13, 189 Batch-Formeln 76 Bildlauf unterteilen 30 drucken 25 Eingabe 192 Ergebnisse 22 Fallnamen 191 Formeln 14, 75 Info-Feld 191 Kontextmenü 15 Kopfleiste 190 sperren 106 Titel 191 Variablennamen 191 verschlüsseln 105 Zellformatierung 192 Ziehen-und-Ablegen 31 Tabellenformeln 74 Tastatur-Makros 243 Technischer Support 279 Teilen von Tabellen 30 Text Miner 298 Umkodierung siehe Daten umkodieren Var.-Schaltfläche 13 Variable Auswahl 20 automatische Vorauswahl 140 Invariante Variablen filtern 69 STATISTICA-Handbuch – 311 Copyright © StatSoft, 2009 HANDBUCH: INDEX Spezifikationen 14 Variablenbündel-Beispiel 42 Variablennamen 191 VEPAC (Variance Estimation and Precision) 296 Verschlüsselung von Tabellen 105 Versuchsplanung 297 Visual Basic 241 Eigenschaften 149 Methoden 149 Webfähigkeit 7 Website, StatSoft 278 WebSTATISTICA 97, 150, 167, 283 Inhalte publizieren 169 Knowledge Portal 167 WebSTATISTICA Server 301 XML 151, 284, 290, 291, 292, 299 Ziehen-und-Ablegen 31, 152, 186, 188, 196, 232 Zusammenfassung Grafiken 79 312 – STATISTICA-Handbuch Copyright © StatSoft, 2009 HANDBUCH: NOTIZEN STATISTICA-Handbuch – 313 Copyright © StatSoft, 2009