Untitled

Transcription

Untitled
HANDBUCH
ii – STATISTICA-Handbuch
Copyright © StatSoft, 2009
HANDBUCH: INHALT
Beispiel 1: Korrelationen ..............................................................................11
Beispiel 2: ANOVA ......................................................................................34
Beispiel 3: Variablenbündel ..........................................................................42
Beispiel 4: Analyse für Gruppen...................................................................46
Beispiel 1: Eingabedaten direkt aus Excel ....................................................57
Beispiel 2: Direkter Datenzugriff aus Datenbanken .....................................60
Beispiel 3: Datenaufbereitung – Bereinigung und Filterung ........................65
Beispiel 4: Tabellenformeln und Batch-Formeln .........................................74
Beispiel 5: Ergebniszusammenfassungen .....................................................79
Beispiel 6: STATISTICA Data Miner Recipes ..............................................86
Beispiel 7: WebSTATISTICA – Herunter-/Hochladen von Analysen
vom bzw. auf den Server ........................................................................97
Beispiel 8: STATISTICA in regulierten Bereichen ......................................102
Beispiel 9: STATISTICA Enterprise............................................................ 110
Allgemeines ................................................................................................ 133
Unterstützung mehrerer Analysen .............................................................. 134
Interaktive Benutzeroberfläche ...................................................................136
STATISTICA Visual Basic und Steuerung von STATISTICA aus
anderen Anwendungen..........................................................................149
Webbrowser-basierte Benutzeroberfläche: WebSTATISTICA ....................150
Microsoft Office-Integration .......................................................................152
STATISTICA-Handbuch – iii
Copyright © StatSoft, 2009
HANDBUCH: INHALT
Überblick.....................................................................................................157
1. STATISTICA-Arbeitsmappen ..................................................................158
2. Einzelfenster ........................................................................................... 160
3. Berichte ...................................................................................................162
4. Microsoft Word ....................................................................................... 165
5. Ausgabe über das Web............................................................................167
Arbeitsmappen ............................................................................................ 185
Tabellen (Multimedia-Tabellen) .................................................................189
Berichte .......................................................................................................194
Grafiken ......................................................................................................196
Makros (STATISTICA Visual Basic-Programme) ......................................197
STATISTICA-Projekte .................................................................................198
Data Miner Recipe ...................................................................................... 199
Einführung ..................................................................................................207
Anpassen von Grafiken ...............................................................................208
Allgemeine Grafikkategorien......................................................................214
Grafiken für Eingabedaten ..........................................................................215
Grafiken für Blockdaten .............................................................................218
Grafiken des Grafik-Menüs ........................................................................220
Brushing und Fallstatus...............................................................................222
Andere spezialisierte Grafiken ....................................................................226
Grafiken mit STATISTICA Visual Basic erstellen ......................................227
Anpassen der interaktiven Benutzeroberfläche ..........................................232
Anpassen von Dokumenten ........................................................................233
Lokale und permanente Anpassungen ........................................................ 233
Allgemeine Standardeinstellungen ............................................................. 234
Anpassen von Grafiken ...............................................................................235
Einrichten unterschiedlicher Konfigurationen von STATISTICA ...............236
Angepasste Konfigurationen für Einzelanwender im Netzwerk ................237
iv – STATISTICA-Handbuch
Copyright © StatSoft, 2009
HANDBUCH: INHALT
STATISTICA Visual Basic (SVB)-Makros aufzeichnen ............................. 242
Beispiel: Aufzeichnung einer Analyse........................................................248
ActiveX-Objekte und Dokumente (Technischer Hinweis) .........................257
OLE-Unterstützung .....................................................................................258
DDE-Unterstützung ....................................................................................259
Einführung ..................................................................................................263
Kurze Schritt-für-Schritt-Anleitung ............................................................ 264
Vor-Ort-Verarbeitung von Daten externer Server
(IDP-Technologie) ................................................................................265
Das Einbinden der STATISTICA Object Library in das .NET-Projekt .......269
Manuelles Erstellen der COM Interop ........................................................271
Unterstützung mehrerer STATISTICA-Versionen .......................................272
Generierung der STATISTICA-Instanz ........................................................272
Die Library-Version von STATISTICA .......................................................273
Hilfe zur Programmbedienung ..........................................................................275
WebSTATISTICA............................................................................................... 281
STATISTICA-Produktfamilie ............................................................................293
STATISTICA-Handbuch – v
Copyright © StatSoft, 2009
HANDBUCH: INHALT
vi – STATISTICA-Handbuch
Copyright © StatSoft, 2009
2 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
STATISTICA ist ein integriertes System für Datenmanagement, Analyse, Data
Mining, Visualisierung und Anwendungsentwicklung mit einem breiten Spektrum
von einfachen und höheren analytischen Verfahren für kaufmännische,
wissenschaftliche und industrielle Anwendungen.
STATISTICA enthält nicht nur allgemeine analytische und grafische Verfahren,
sondern auch umfassende Implementierungen spezialisierter Analysen (z. B. für
Data-Mining-Prognosen, Businessapplikationen, Sozialwissenschaften, Biometrie
oder Ingenieuranwendungen). Alle Analysen stehen als Teil eines Gesamtpakets zur
Verfügung, das sich über verschiedene Benutzeroberflächen bedienen lässt. Dies
umfasst:
 eine hochoptimierte interaktive Benutzeroberfläche (mit Optionen, STATISTICA
innerhalb von Microsoft Office und anderen Anwendungen auszuführen),
 eine komplett browserbasierte Benutzeroberfläche (in WebSTATISTICA), die
dem Thin-Client-Prinzip folgt und jedem beliebigen Computer mit
Internetzugang Zugriff auf STATISTICA ermöglicht und
 eine umfassende, dem Industriestandard folgende und .NET-kompatible
Programmierschnittstelle (.NET-kompatibles Visual Basic) mit mehr als 13.000
extern aufrufbaren Funktionen.
STATISTICA-Handbuch – 3
Copyright © StatSoft, 2009
KAPITEL 1: ÜBERSICHT
Die interaktive Benutzeroberfläche lässt sich bequem mittels Makros automatisieren
und anpassen, wobei eine Vielzahl von Methoden verwendet und die Makros in
einem VB-Skript aufgezeichnet werden können. Mit der eingebauten
Entwicklungsumgebung können Schnittstellen mit anderen Anwendungen oder
benutzerdefinierten Erweiterungen jeglicher Komplexität erzeugt werden, von
einfachen Verknüpfungen bis zu großangelegten Entwicklungsprojekten.
Die STATISTICA-Produktlinie zeichnet sich durch eine breite Auswahl von
implementierten Analyseverfahren sowie die Verwendung modernster
Softwaretechnologien aus (siehe Softwaretechnologie unten). Diese Technologien
ermöglichen die nahezu unbegrenzte Kapazität, Leistung und Vielfalt der
Anpassungsoptionen von STATISTICA. Eine der wichtigsten Besonderheiten der
STATISTICA-Anwendungen liegt darin, auch unerfahrenen Benutzern die
Anpassung von STATISTICA an ihre Bedürfnisse zu ermöglichen. Nahezu jeder
Aspekt von STATISTICA lässt sich anpassen, einschließlich der Benutzeroberfläche.
STATISTICA kann eingesetzt werden:

Sowohl von Neuanwendern zum Ausführen von Routinearbeiten mittels
Standarddialogen für Analysen (nur wenige selbsterklärende Schaltflächen
enthaltend) oder durch Aufrufen von STATISTICA mit Webbrowsern (und einem
stark vereinfachten „Frontend“),

als auch von erfahrenen Analytikern, professionellen Statistikern und
Anwendungsentwicklern, die jede der hochoptimierten Verfahren von
STATISTICA in Benutzeranwendungen oder Rechnerumgebungen einbinden
können, wobei .NET und webkompatible Softwaretechnologien zum Einsatz
kommen.
4 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 1: ÜBERSICHT
Die Standardkonfiguration von STATISTICA (seine Benutzeroberfläche und
Systemeinstellungen) sind das Resultat jahrelanger Aufmerksamkeit gegenüber
Nutzerwünschen.
Wir haben Rückmeldungen von Zehntausenden unserer Anwender erhalten, die
Hunderttausende von Nutzern in allen Kontinenten und allen Berufsfeldern
repräsentieren. Wichtigste Erkenntnis war die Unterschiedlichkeit der Bedürfnisse
und Präferenzen unserer Anwender. Um diesen unterschiedlichen Anforderungen
zu begegnen, bietet STATISTICA eine der flexibelsten und am leichtesten
anzupassenden Benutzeroberflächen aller heutigen Anwendungen sowie eine
Methodenvielfalt, die ihresgleichen sucht.
Obwohl STATISTICA Zugang zu einem mächtigen Arsenal höherer
Softwaretechnologien (siehe Softwaretechnologie unten) verschafft, müssen Sie
diese nicht kennen, denn sie wurden auf eine automatische und intuitive
Arbeitsweise hin ausgelegt. Ein Neuanwender sieht vielleicht nie mehr als einige
wenige selbsterklärende Schaltflächen. Fortgeschrittene Optionen sind jedoch nur
ein Register oder Mausklick davon entfernt. Nahezu alle Aspekte von STATISTICA
(von der Startkonfiguration, Erstellung und Handhabung der Ausgabe bis zu
STATISTICA-Meldungen zur Auswahl des nächsten Schrittes) lassen sich per
Mausklick verändern. Außerdem „erinnert“ sich STATISTICA an Ihre Auswahl bis
zur erneuten Modifikation. Fast jeder Dialog zur Analysenauswahl oder Ausführung
einer Routineoperation lässt sich leicht ersetzen (z. B. vereinfacht, erweitert oder
mit benutzerdefinierten Verfahren kombiniert). STATISTICA wird stets so aussehen
und so arbeiten, wie Sie es möchten.
Die Leistungsfähigkeit, Anpassungsfähigkeit und breite Auswahl von Optionen zur
Ausrichtung auf Ihre Bedürfnisse wird dadurch möglich, dass STATISTICA nahezu
alle derzeit verfügbaren führenden Softwaretechnologien benutzt und unterstützt.
Jede der mehr als 13.000 Funktionen von STATISTICA ist für externe
Anwendungen zugänglich. In Hinblick auf Umfang oder Komplexität der zu
speichernden oder abzurufenden Daten gibt es praktisch keine Beschränkungen.
STATISTICA ist für Web- und Multimedia-Anwendungen optimiert.
STATISTICA-Handbuch – 5
Copyright © StatSoft, 2009
KAPITEL 1: ÜBERSICHT
Berechnungsverfahren und grafische Verfahren werden von zahlreichen geeigneten
Optimierungen getragen, wie beispielsweise das Berechnungsverfahren der
„vierfachen Präzision“, das die Einschränkungen des Standards vom IEEEFließkomma überwindet. Hiermit wird eine rechnerische Präzision geliefert, die
normalerweise nur in speziellen mathematischen Anwendungen (die über ArbitraryPrecision-Arithmetik verfügen) aber nicht in weitverbreiteten datenverarbeitenden
Anwendungen wie Statistik- oder Data-Mining-Programmen gefunden wird.
Im Ergebnis bietet STATISTICA unübertroffene Geschwindigkeit, numerische
Präzision und Flexibilität, die durch Multithreading unterstützt wird (sowie der
hochentwickelten Architektur verteilter asynchroner Verarbeitung, die in der ClientServer-Version und WebSTATISTICA angeboten wird, wobei letztere Variante
direkten Zugang über das Internet ermöglicht).
Der Datenzugriff basiert auf einer flexiblen Datenstromtechnologie, mit der
STATISTICA einfache Eingabetabellen des lokalen Laufwerks sowie Abfragen aus
multidimensionalen Datenbanken bearbeiten kann. Letztere können in externen
Data-Warehouses Terabytes von Daten umfassen und werden vor Ort verarbeitet
(d. h. ohne sie auf den lokalen Speicher zu übertragen; diese Funktion ist in den
unternehmensweiten Versionen von STATISTICA verfügbar).
Beispielsweise kann man STATISTICA zur gleichen Zeit mehrfach öffnen (in jeder
Kombination von Umgebungen: lokal, im Netzwerk oder in einer Client-Server d. h.
webbasierten Umgebung), jeweils mehrere Datenanalysen für mehrere simultan
geöffnete Datendateien oder Abfragen durchführen und die Ergebnisse in separaten
Projekten ablegen. Die Eingabe- und Ausgabetabellen sowie die Grafiken von
STATISTICA können von nahezu unbegrenzter Größe sein und Hierarchien von
Dokumenten unterschiedlichen Typs umfassen. Die Ausgabe lässt sich in
unterschiedliche Ausgabekanäle leiten, wie beispielsweise Multimedia-Tabellen,
Arbeitsmappen, Berichte (einschließlich PDF-Dateien und Microsoft OfficeDokumente), das Internet sowie das optionale STATISTICA Document Management
System, das nahtlos in jede STATISTICA-Anwendung integriert werden kann.
6 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 1: ÜBERSICHT
Eine der besonderen Eigenschaften der STATISTICA-Produktfamilie besteht in der
vollständigen Webfähigkeit. Sofern ein STATISTICA-Server installiert ist, kann man
von jedem beliebigen Computer mit Internetzugang auf die umfassenden
Funktionen des STATISTICA-Systems zugreifen. Dies umschließt nicht nur die
Optionen, vorbereitete Skripts über das Internet auszuführen, sondern eine Fülle
von interaktiven Funktionalitäten, einschließlich solcher Arbeitsprozesse wie dem
Erstellen eines Data-Mining-Prognosemodells, das durch das Ziehen von Pfeilen in
der interaktiven Data Miner-Arbeitsfläche realisiert wird (wobei lediglich der
Browser ohne installierte Client-Software verwendet wird). Für weitere
Informationen siehe Anhang B – WebSTATISTICA, Seite 283.
Die meisten in diesem Handbuch beschrieben Funktionen sind in allen
STATISTICA-Produkten verfügbar. Daneben beziehen sich einige Abschnitte dieses
Handbuchs auf bestimmte Produkte (wie z. B. bei den Serverfunktionen von
WebSTATISTICA oder der Produktlinie STATISTICA Data Miner).
STATISTICA hat seit dem Erscheinen der ersten Version in allen vergleichenden
Untersuchungen von Statistiksoftware die besten Bewertungen erhalten. Nur
wenige Produkte haben in der Geschichte der Softwareindustrie solch einen Rekord
erzielt.
Weitere Informationen über StatSoft und die Rekordbewertungen von STATISTICA
finden Sie auf unserer Website unter www.statsoft.de.
STATISTICA-Handbuch – 7
Copyright © StatSoft, 2009
KAPITEL 1: ÜBERSICHT
8 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
9/28/09
Nach der Installation von STATISTICA kann das
Programm durch Auswahl von STATISTICA aus dem Menü Programme des
Windows-Startmenüs gestartet werden. Alternativ kann man entweder auf
STATIST.exe im Windows-Explorer oder ein beliebiges Symbol einer STATISTICADatei wie z. B. einer Tabelle doppelklicken, um das Programm zu starten.
Beim ersten Start von STATISTICA erscheint ein Dialog, über welchen die Ansicht
der Benutzeroberfläche festgelegt werden kann. Zur Auswahl stehen eine intuitive
Multifunktionsleiste (Ribbon Bar) im Stil von Office 2007 und eine Ansicht
klassischer Menüs und Symbolleisten. Auch später kann jederzeit zwischen den
beiden Ansichten gewechselt werden (über die Option Menüs bzw. über
Multifunktionsleiste aus dem Menü Ansicht). Die Angaben in diesem STATISTICAHandbuch beziehen sich auf die klassische Ansicht.
STATISTICA-Handbuch – 11
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Anschließend öffnet sich eine leere Tabelle und der Dialog Willkommen bei
STATISTICA wird aufgerufen. Der Dialog Willkommen bei STATISTICA enthält
Optionen, die nützlich sind, um auf häufig verwendete Funktionen von
STATISTICA zuzugreifen.
Falls gewünscht, kann das Kontrollkästchen Diesen Dialog nicht wieder anzeigen
aktiviert werden, so dass dieser Dialog beim nächsten Aufruf von STATISTICA
nicht erneut erscheint.
Nahezu jeder Aspekt des Verhaltens und der
Erscheinung von STATISTICA (auch viele in diesem Beispiel dargestellte
elementare Eigenschaften wie die Lenkung der Ausgabe) können dauerhaft den
persönlichen Präferenzen angepasst werden. Bereits der erste Schritt, nämlich das
Öffnen von STATISTICA, kann angepasst werden, zum Beispiel der StandardVollbildmodus, das Aussehen der Tabellen und Symbolleisten und viele andere
Aspekte von STATISTICA, die in diesem Handbuch illustriert werden.
12 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Öffnen Sie für dieses Beispiel Adstudy.sta,
indem Sie im Menü Datei den Befehl Beispieldatei öffnen wählen, so dass der
Dialog STATISTICA-Daten öffnen aufgerufen wird. Führen Sie auf dem Ordner
Datasets und anschließend auf der Datei Adstudy einen Doppelklick aus. Im Menü
Datei können ebenfalls Datendateien mit dem Befehl Öffnen aufgerufen werden.
Alternativ kann man auf die Schaltfläche
klicken, die in jedem StartMenü (der erste Dialog, der nach Auswahl eines Befehls in den Menüs Statistik,
Data-Mining oder Grafik aufgerufen wird) enthalten ist, oder die Schaltfläche
klicken, die sich in der Symbolleiste befindet.
STATISTICA-Datendateien
werden immer in Tabellen angezeigt (d. h., eine Tabelle ist eine Datendatei). Die
Anzeige aller STATISTICA-Tabellen verwendet die mächtige MultimediaTabellentechnologie von StatSoft. Die Tabellen können nicht nur praktisch
unbegrenzte Datenmengen beinhalten, sondern auch Ton, Videos, eingebettete
Dokumente, Automatisierungs-Skripts und benutzerdefinierte Schnittstellen.
Es können mehrere Datentabellen gleichzeitig geöffnet und mit jeweils
unterschiedlichen Analysen verbunden sein. Die mit STATISTICA produzierten
Ergebnisse werden meistens in (Multimedia-)Tabellen ausgegeben. Optionen für
das Datenmanagement sind über das Menü Daten verfügbar, sobald eine Tabelle
geöffnet ist.
Die Symbolleiste Tabelle zeigt die Schaltflächen
(Variablen) und
, die
Menüs mit Befehlen zur Umstrukturierung der Datendatei enthalten (z. B. Variablen
oder Fälle Hinzufügen oder Verschieben).
- Menü:
- Menü:
STATISTICA-Handbuch – 13
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Alle oben aufgeführten Befehle werden im Elektronischen Handbuch erklärt.
Markieren Sie hierzu einen Befehl, und klicken Sie auf Ihrer Tastatur F1, um das
entsprechende Hilfe-Thema aufzurufen.
Die Köpfe der Variablen (Spalten) in der
Tabelle enthalten die Variablennamen. Ein Doppelklick auf den ersten
Variablenkopf – Geschlecht – öffnet den Dialog mit den Spezifikationen für diese
Variable.
Mit den Optionen in diesem Dialog können unter anderem
der Variablenname und das Format verändert und eine Formel zur Neuberechnung
der Variablenwerte eingegeben werden. Beginnt der Inhalt des Feldes Langer Name
mit einem Gleichheitszeichen (=), wird STATISTICA ihn als eine Formel
interpretieren [hinter einem Semikolon (;) darf ein Kommentar folgen]. Gibt man
zum Beispiel in das Feld Langer Name für die erste Variable =(v2+v3+v4)/3 oder
=mean(v2:v4) ein, dann werden die aktuellen Werte dieser Variablen für jeden Fall
(Zeile) der Tabelle durch den Durchschnitt der Variablen zwei bis vier ersetzt.
Spezifikationen für alle Variablen können gemeinsam in einem kombinierten
Variablenspezifikationen-Editor angezeigt und verändert werden. Er ist über die
Schaltfläche Alle Spez. im Dialog für die Variablenspezifikationen erreichbar.
14 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Eine nützliche Eigenschaft von Tabellen ist
die Liste der in ihren Kontextmenüs verfügbaren Befehle. Kontextmenüs sind
dynamische Menüs, die durch Klicken der rechten Maustaste auf ein Element (z. B.
wie in folgender Abbildung eine Tabellenzelle) angezeigt werden. Das
Kontextmenü von Tabellen schließt eine Auswahl von DatenmanagementFunktionen und andere auf die aktuelle Variable (Spalte), den Fall (Zeile) oder
einen Zellenblock bezogene Optionen ein.
Die Ausgabe kann in STATISTICA angepasst
werden (siehe Fünf Ausgabekanäle auf Seite 157). Jede Ausgabe kann in fünf
Kanäle geleitet werden:
STATISTICA-Handbuch – 15
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE





Arbeitsmappen (siehe Seite 158),
Einzelfenster (siehe Seite 160),
Berichte (siehe Seite 162),
Microsoft Word (siehe Seite 165) und
Das Web (siehe Seite 167)
Die vier erstgenannten Ausgabekanäle werden über die Optionen im Register
Ausgabemanager des Dialoges Optionen gesteuert (erreichbar über das Menü Datei Ausgabemanager oder das Menü Extras - Optionen). Es gibt eine Vielzahl von
Möglichkeiten, die Ausgabe ins Web zu publizieren, abhängig von der verwendeten
STATISTICA-Version. Die Ausgabekanäle lassen sich in vielen Kombinationen
verwenden (z. B. Arbeitsmappe und Bericht gleichzeitig). Jeder der Ausgabekanäle
lässt sich auf verschiedene Weise anpassen. Auch können alle Ausgabeobjekte
(Tabellen und Grafiken) andere eingebettete und verknüpfte Objekte und
Dokumente enthalten, so dass die Ausgabe von STATISTICA hierarchisch
organisiert werden kann.
Im Folgenden wird eine
Korrelationsmatrix für die Variablen in der Datendatei Adstudy.sta berechnet. Um
zum Start-Menü Elementare Statistik und Tabellen zu gelangen, wählt man
Elementare Statistik aus dem Menü Statistik
16 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
oder aus dem Menü des STATISTICA-Startsymbols
des Bildschirmes aus.
in der linken unteren Ecke
Es sollte kein Block (d. h. eine Gruppe von Zellen) markiert sein; um eine
vorhandene Markierung aufzuheben, muss nur in eine beliebige Zelle der Tabelle
geklickt werden. Ist ein Block markiert, geht STATISTICA davon aus, dass die zu
diesem Block gehörenden Variablen absichtlich für die Analyse ausgewählt
wurden. Wenn man dann später auf OK oder die Schaltfläche Zusammenfassung
drücken würde, erzeugte STATISTICA automatisch Korrelationen für die Variablen
des ausgewählten Blocks, anstatt die Auswahl von Variablen abzufordern.
In dem Start-Menü Elementare Statistik und Tabellen (folgende Abbildung)
STATISTICA-Handbuch – 17
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
wählen Sie Korrelationsmatrizen mit einem Doppelklick (oder wählen Sie die
Option und klicken Sie auf die Schaltfläche OK), um den Dialog Produkt-Moment
und partielle Korrelationen aufzurufen.
Wie die meisten Analysedialoge
(und verschiedene andere Dialogtypen von STATISTICA) ist der Dialog ProduktMoment und partielle Korrelationen in Register aufgeteilt, die sich nach den Typen
von verfügbaren Optionen richten. Normalerweise gibt es wenigstens zwei
Kategorien von verfügbaren Analyseoptionen.
Das Dialogregister Standard enthält die üblicherweise meist genutzten Optionen.
Hierüber kann man schnell eine Standardanalyse durchführen, ohne in einer
Vielzahl von Optionen suchen zu müssen.
18 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Das Register Details/Grafiken enthält alle Optionen des Registers Standard sowie
eine Auswahl weniger häufig genutzter Optionen (in diesem Fall z. B. Optionen zur
Speicherung von Matrizen und zur Berechnung von selten geforderten Statistiken
und Grafiken). Darüber hinaus existieren je nach spezifiziertem Analysetyp häufig
weitere Register.
In einigen Fällen gibt es auch nur das Register Standard. Wie in allen Dialogen in
STATISTICA erhält man über die Taste F1 oder das Symbol
in der oberen rechten
Ecke ein Hilfethema mit Informationen zu den verfügbaren Optionen des gerade
ausgewählten Registers.
Alle Dialoge in STATISTICA folgen den
Konventionen der „intelligenten Dialogführung“. Ist man sich nicht sicher, was als
Nächstes ausgewählt werden soll, klickt man einfach auf OK oder die Schaltfläche
STATISTICA-Handbuch – 19
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Zusammenfassung.
STATISTICA springt dann zu dem nächsten logischen Schritt
und fordert eventuell noch fehlende Eingaben ab (z. B. Variablen für die Analyse).
Jeder Dialog für die Analysespezifikation in
STATISTICA enthält wenigstens eine Schaltfläche Variablen. Das Anklicken dieser
Schaltfläche öffnet einen Dialog zur Variablenauswahl, in dem die Variablen für die
Analyse festgelegt werden.
Die Schaltfläche 1 Liste (quadr. Matrix) (oder
das Drücken der Tastenkombination ALT+1) führt in diesem Beispiel zu dem Dialog
Auswahl: Variablen für Analyse. Dieser Dialog wird auch aufgerufen, wenn die
Schaltfläche Zusammenfassung geklickt wird, sofern zuvor keine Variablen
gewählt wurden. (Wie bereits angemerkt: Falls ein Block von Variablen in der
Datendatei markiert wurde, werden diese Variablen automatisch für die Analyse
ausgewählt, so dass beim Klicken der Schaltfläche Zusammenfassung eine
Korrelationsmatrix dieser markierten Variablen erzeugt wird.)
Der Variablenauswahldialog unterstützt verschiedene Wege der Auswahl
(einschließlich der Windows-Standards UMSCHALT+Klick und STRG+Klick zur
Auswahl von Bereichen bzw. unterbrochenen Listen von Variablen).
Der Dialog bietet auch mehrere Abkürzungen und Optionen für die Betrachtung des
Inhaltes der Datendatei. So kann man z. B. die Variablenliste erweitern, um die
langen Namen oder Formeln der Variablen zu sehen (Klick auf die Schaltfläche
Lang); oder man kann eine Variable zoomen (Klick auf die Schaltfläche Zoom), um
eine Liste all ihrer Werte und einiger deskriptiver Statistiken zu erhalten (siehe
folgende Abbildung).
20 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Wählen Sie in diesem Beispiel in dem Dialog Auswahl: Variablen für Analyse die
Schaltfläche Alle auswählen und klicken anschließend auf OK, um in den Dialog
Produkt-Moment und partielle Korrelationen zurückzukehren. Klicken Sie danach
auf die Schaltfläche Zusammenfassung, um eine Standard-Korrelationsmatrix für
die ausgewählten Variablen zu erhalten.
Anstelle der Schaltfläche Zusammenfassung hätten Sie auch in den Registern
Standard oder Details/Grafiken die Schaltfläche Zusammenfassung: Korrelationen
anklicken können. Abhängig von den spezifizierten Einstellungen zur Ausgabe (im
Register Ausgabemanager des Dialogs Optionen aus dem Menü Extras) kann die
Korrelationstabelle auch in einem Bericht, einem Einzelfenster oder in einem
Word-Dokument, und nicht in eine Arbeitsmappe – wie oben gezeigt – ausgegeben
werden.
STATISTICA stellt äußerst anpassungsfähige
Werkzeuge und Methoden zur Verfügung, um die wichtigsten Ergebnisse in
STATISTICA-Handbuch – 21
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Grafiken und/oder Tabellen zusammenzufassen. Zum Beispiel wird durch das
Klicken der Schaltfläche
eine Grafikzusammenfassung für jedes
Variablenpaar der Korrelationsmatrix aufgerufen.
Diese Grafiken bilden für jede einzelne Korrelation nicht nur die Punkte im
Scatterplot ab, sondern auch die Verteilungen (Histogramme) für alle Variablen
sowie die entsprechenden Korrelationskoeffizienten und Regressionsgleichungen.
STATISTICA beinhaltet viele solcher Abbildungen, um deskriptive Statistiken,
Korrelationen, Ergebnisse von Studien zur Messmittel- oder Prozessfähigkeit oder
anderen Arten von Datenanalysen zusammenzufassen.
In STATISTICA werden in
Tabellen nicht nur Daten gespeichert, sondern auch numerische Ergebnisse
dargestellt. Tabellen besitzen zahlreiche Eigenschaften und Optionen zur
Darstellung. In diesem Beispiel werden signifikante Korrelationen in einem anderen
Format markiert (per Voreinstellung in Rot), damit sie leichter zu erkennen sind
(siehe in der Tabelle Korrelationen in der Spalte Geschlecht die zugehörige Zelle
für Messung07). Tabellen können einzelne Zeilen oder auch Gigabytes von Output
enthalten und bieten viele Optionen, um die Betrachtung der Ergebnisse zu
erleichtern und sie in vordefinierten Grafiken zu visualisieren (siehe unten in
diesem Beispiel). Wie oben bereits erwähnt, werden Tabellen in STATISTICA von
der mächtigen Multimedia-Tabellentechnologie von StatSoft gesteuert. Neben
nahezu unbegrenzten Datenmengen können sie Videos, Ton, benutzerdefinierte
Schnittstellen und selbstablaufende Skripts beinhalten. Die
22 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Gestaltungsmöglichkeiten von Tabellen sind sehr vielfältig (weitere Einzelheiten zu
Tabellen finden Sie ab Seite 189).
Die meisten Tabellenoptionen erreicht man über die
Schaltflächen der Tabellen-Symbolleiste und die Kontextmenüs (werden nach
einem rechten Mausklick auf eine Tabellenzelle angezeigt). Eine Beschreibung
dieser Optionen erhält man über die Hilfetaste (F1) oder durch Anklicken des
Symbols
in der Symbolleiste und anschließendem Anklicken des entsprechenden
Symbols auf der Symbolleiste. Beispielsweise lassen sich die Anzeigeformate für
jede Spalte verändern, Ausgaben editieren oder leere Fälle und Variablen für
zusätzliche Bemerkungen oder einzufügende Ergebnisse aus anderen Quellen
hinzufügen. Tabellen können flexibel ausgedruckt werden (per Voreinstellung in
präsentationsreifer Qualität mit Gitterlinien). Da Tabellen auch als Eingabedaten
verwendet werden, lässt sich auch leicht eine Analyse spezifizieren, die Ergebnisse
früherer Auswertungen verwendet (z. B. könnte die Korrelationsmatrix für die
Spezifikation einer Analyse zur Multidimensionalen Skalierung dienen). Um eine
Ergebnistabelle als Eingabetabelle zu verwenden, aktivieren Sie die entsprechende
Tabelle und wählen Eingabetabelle aus dem Menü Daten.
Alle Ergebnisse lassen
sich in individuellen Fenstern, Berichten, Word-Dokumenten oder Arbeitsmappen
anzeigen und speichern. Arbeitsmappen stellen den voreingestellten und
vielseitigsten Weg zur Behandlung von Analyseergebnissen dar (weitere
Einzelheiten zu Arbeitsmappen finden Sie auf den Seiten 158 und 185). Abhängig
von den Einstellungen im Ausgabemanager (erreichbar über das Menü Datei Ausgabemanager, siehe nächster Absatz) lassen sich Ergebnisse ausgeben in eine
einzige Arbeitsmappe mit den Ergebnissen aller Analysen, separate Arbeitsmappe
mit Ergebnissen (Tabellen und Grafiken) je Analyse, die Arbeitsmappe mit der
originalen Datendatei oder eine bereits bestehende Arbeitsmappe. Des Weiteren
lässt sich festlegen, ob Ergebnisse automatisch in eine Arbeitsmappe ausgegeben
werden sollen, oder ob durch Anklicken des Schaltflächensymbols
ausgewählte Tabellen oder Grafiken manuell in eine Arbeitsmappe geschrieben
werden sollen.
Welche Art der Arbeitsmappe Sie wählen, oder ob Sie
überhaupt Arbeitsmappen verwenden, hängt allein von Ihren Präferenzen beim
Speichern von Daten und Ergebnissen ab. Um die Ausgabe der Ergebnisse nur für
eine bestimmte Analyse umzulenken, klicken Sie auf die Schaltfläche
im
STATISTICA-Handbuch – 23
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Spezifikationsdialog der Analyse oder Grafik und wählen dort Ausgabe, um den
Dialog Analyse/Grafik Ausgabemanager anzuzeigen.
Um Ausgabeoptionen für alle Analysen zu ändern, wählen Sie Optionsfeld Globale
Ausgabeoptionen (Einstellungen gelten auch für globale Optionen) im Dialog
Analyse/Grafik Ausgabemanager, oder nutzen Sie den (globalen) Ausgabemanager
(Register Ausgabemanager im Dialog Optionen, erreichbar über Ausgabemanager
im Menü Datei oder über Optionen im Menü Extras).
In allen Arbeitsmappen können einzelne Dokumente (z. B. Tabellen und Grafiken)
oder Gruppen von Dokumenten ausgedruckt, extrahiert, kopiert und aus einer
Arbeitsmappe gelöscht werden. Weitere Einzelheiten finden Sie im Überblick zu
den Arbeitsmappen auf Seite 185 sowie im Elektronischen Handbuch.
Tabelleninhalte können entweder
mit der Tastaturkombination STRG+C (kopiert nur den Inhalt des ausgewählten
Blocks) oder über Auswahl von Mit Kopfzeile kopieren aus dem Menü Bearbeiten
(kopiert den Block zusammen mit den Variablen- und Fallnamen) in die
Zwischenablage kopiert werden. Beim Einfügen in ein Dokument eines
Textverarbeitungsprogramms erscheinen die Tabellen abhängig von der im
Textverarbeitungsprogramm unter Inhalte einfügen getroffenen Auswahl als aktive
24 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
(dort editierbare) STATISTICA-Objekte, als RTF-formatierte Standardtabellen, als
unformatierter Text, als Grafik oder im HTML-Format.
Zur Erstellung eines Ausdrucks der Ausgabetabelle wählen
Sie Drucken aus dem Menü Datei (oder drücken STRG+P), um den Dialog Drucken
anzuzeigen, in dem die Druckoptionen spezifiziert werden. Eine schnellere
Methode ist das Anklicken des Druckersymbols . Dies führt nicht zur Anzeige
des Dialoges Drucken, sondern druckt das gesamte aktuelle Dokument. Wollen Sie
ein bestimmtes Dokument aus einer Arbeitsmappe drucken, aktivieren Sie das
Dokument in der Arbeitsmappe und wählen die Option Markierung im Dialog
Drucken. Sie können auch ein Dokument aus der Arbeitsmappe extrahieren (durch
Ziehen aus der Baumansicht oder über Als Einzelfenster extrahieren im Menü
Arbeitsmappe) und es dann drucken.
Arbeitsmappen bieten die wohl
flexibelsten Optionen zur Verwaltung der Ausgabe (siehe die Seiten 158 und 185).
Manchmal kann es jedoch sinnvoll sein, automatisch ein Protokoll aller Ergebnisse
(d. h. des Inhalts aller Tabellen und Grafiken) im Berichtsstil eines
Textverarbeitungsprogramms zu produzieren, in das Kommentare und
Anmerkungen an beliebige Positionen eingefügt, Objekte nebeneinander platziert
werden können, usw. (siehe die Seiten 160 und 194 zu weiteren Einzelheiten
über Berichte).
STATISTICA-Handbuch – 25
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Um einen solchen Bericht zu erstellen, öffnen Sie im Register Ausgabemanager des
Dialogs Optionen oder im Dialog Analyse/Grafik Ausgabemanager das Listenfeld
für Ausgabe Bericht. Wählen Sie in diesem Listenfeld eine der Optionen Mehrere
Berichte (einen für jede Analyse/Grafik), Gemeinsamer Bericht (für alle
Analysen/Grafiken) oder Datei auswählen (wodurch der Dialog Öffnen aufgerufen
wird, in dem ein bereits bestehender Bericht ausgewählt werden kann). Um den
Ausgabemanager (für globale Veränderungen) aufzurufen, wählen Sie
Ausgabemanager im Menü Datei oder Optionen im Menü Extras und anschließend
das Register Ausgabemanager. Der Dialog Analyse/Grafik Ausgabemanager (für
lokale Veränderungen) wird geöffnet, indem Sie im Spezifikationsdialog für die
Analyse bzw. Grafik auf die Schaltfläche
klicken und dort Ausgabe
wählen. Im Ausgabemanager kann auch die Menge erweiterter Information
festgelegt werden, die zu den Ergebnissen mitgeliefert werden soll.
Zurück zu dem Beispiel und der berechneten Korrelationsmatrix.
Abgesehen von den ersten beiden Spalten zu Mittelwert und Standardabweichung
repräsentiert jede der Zellen in der Korrelationsmatrix einen Wert (im Bereich
zwischen –1,00 und +1,00), der die Beziehung zwischen den Variablen
widerspiegelt (siehe entsprechende Zeilen- und Spaltenbeschriftungen). Je höher
der absolute Wert des Korrelationskoeffizienten, desto enger die Beziehung; ist der
Wert positiv, dann ist die Beziehung „positiv“ (d. h. hohe Werte der einen Variablen
korrespondieren mit hohen Werten der anderen Variablen; entsprechend niedrige
Werte der einen Variablen mit niedrigen Werten der anderen Variablen). Ist der
Wert negativ, dann ist es umgekehrt (d. h. niedrige Werte der einen Variablen
korrespondieren mit hohen Werten der anderen Variablen). Weitere Hinweise zur
Interpretation von Korrelationskoeffizienten erhalten Sie im Elektronischen
26 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Handbuch. Dieses beinhaltet den gesamten Inhalt des Elektronischen StatistikLehrbuchs von StatSoft (eine preisgekrönte allgemeine Informationsquelle zur
Statistik, die von der Encyclopedia Britannica wegen ihrer Qualität, Genauigkeit,
Gestaltung und Bedienbarkeit empfohlen wird). Siehe auch den Statistischen
Berater (Seite 33).
Um das Elektronische Handbuch aufzurufen, wählen Sie STATISTICA Hilfe aus dem
Menü Hilfe. Geben Sie dann den entsprechenden Begriff (z. B. Korrelationen) in das
Feld Suchbegriff(e) eingeben des Registers Suchen ein, klicken auf die Schaltfläche
Themen auflisten und wählen dann das gewünschte Thema aus dem Feld Thema
wählen aus (in diesem Fall Korrelationen – Einführung):
STATISTICA-Handbuch – 27
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Eines der wichtigen (und oft übersehenen) im Elektronischen Handbuch
behandelten Themen befasst sich mit der Bedeutung, die die Untersuchung von
Scatterplots bei Korrelationen besitzt. So können z. B. sehr große und hoch
signifikante Korrelationskoeffizienten ausschließlich auf einen einzigen
ungewöhnlichen Datenpunkt („Ausreißer“) zurückzuführen sein. Ist dies der Fall,
dann wäre der Korrelationskoeffizient wertlos, selbst wenn er statistisch signifikant
wäre: Er besäße keinerlei Voraussagekraft. Diesen Bedenken sowie den
Ratschlägen des Elektronischen Statistik-Lehrbuchs folgend untersuchen wir nun
einen Scatterplot, der einen bestimmten Korrelationskoeffizienten der Tabelle, und
damit die Beziehung zwischen zwei Variablen visualisiert.
Bei der Untersuchung der
Tabelle können Korrelationen – z. B. die zwischen den Variablen Messung09 und
Messung05 – grafisch betrachtet werden. Um einen Scatterplot für diese beiden
Variablen zu erstellen, klicken Sie mit der rechten Maustaste auf den
entsprechenden Korrelationskoeffizienten (-0,467199). In dem sich öffnenden
Kontextmenü wählen Sie Grafiken für Eingabedaten - Scatterplot mit Messung09 Regression, 95% Konf.:
Die gewünschte Grafik wird am Bildschirm angezeigt.
28 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Wir erkennen in der Grafik, dass es keine ungewöhnlichen Muster in den Daten
gibt. Wir müssen uns somit nicht um Ausreißer sorgen (siehe die kurzen
Bemerkungen zu Ausreißern auf Seite 28 sowie das Thema über Ausreißer im
Elektronischen Handbuch).
Beachten Sie, dass sich in dem Moment, in dem das
Grafikfenster in den Vordergrund kam, die Symbolleiste verändert hat. Die
Symbolleiste Grafik-Werkzeuge (die bei allen Grafikfenstern erscheint)
unterscheidet sich von der Symbolleiste der Tabellen.
Sie enthält eine Vielzahl von Werkzeugen für die Grafikbearbeitung sowie zum
Zeichnen. Alle diese Optionen sind auch in Menüs verfügbar, und die meisten
lassen sich ebenfalls über das Kontextmenü erreichen, das man per Klick der
rechten Maustaste auf spezielle Grafikelemente erhält. Dabei sind die
Kontextmenüs hierarchisch aufgebaut: Die ersten ein oder zwei Optionen beziehen
sich speziell auf das ausgewählte Grafikelement, während die unteren Optionen
Dialoge anzeigen, die Optionen für weitere mit dem ausgewählten Grafikelement in
Beziehung stehende Elemente enthalten. Klickt man mit der rechten Maustaste
irgendwo in den leeren Raum jenseits der Grafikachsen, wird ein Menü mit
globalen Optionen angezeigt (siehe unten).
STATISTICA-Handbuch – 29
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Weitere Informationen zur Bearbeitung von Grafiken findet man ab Seite 208 und
im Elektronischen Handbuch. Wir kehren zurück zur Tabelle.
Tabellen können durch Ziehen des Teilungsfeldes
(kleines Rechteck oben am vertikalen Rollbalken oder links am horizontalen
Rollbalken) in bis zu vier Abschnitte geteilt werden. Dies ist sinnvoll, wenn man
bei großer Informationsmenge Ergebnisse aus verschiedenen Bereichen der Tabelle
betrachten möchte. Wenn man mit dem Mauszeiger auf das Teilungsfeld zeigt,
verändert sich der Cursor in das Zeichen
oder . Um die Teilung nun
vorzunehmen, hält man die linke Maustaste gedrückt und zieht den Cursor an die
gewünschte Position.
Durch Ziehen des Teilungsfeldes, das sich jetzt zwischen den Abschnitten befindet,
kann die Teilung verändert werden.
30 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Informationen zur Markierung von Datenbereichen über Ausschnittsgrenzen sowie
zur unterschiedlichen Geschwindigkeit beim Markieren siehe Wie kann man einen
Block in der Tabelle über den angezeigten Teil hinaus erweitern? im
Elektronischen Handbuch.
STATISTICA unterstützt alle Standardfunktionen zum
Ziehen-und-Ablegen (Drag & Drop) wie gängige Tabellenkalkulationsprogramme
(z. B. Microsoft Excel). Um zum Beispiel einen markierten Datenblock zu
verschieben, führt man den Mauszeiger auf die Grenze der Auswahl (der
Mauszeiger verändert sich in einen Pfeil) und zieht den Block an die neue Position.
Zum Kopieren eines Datenblockes zeigt man auf die Grenze der Auswahl (der
Mauszeiger verwandelt sich in einen Pfeil) und zieht bei gedrückter STRG-Taste die
Auswahl an die neue Position. Während des Ziehens wird neben dem Mauszeiger
ein Pluszeichen (+) angezeigt. Daran erkennt man, dass der Text kopiert und nicht
verschoben wird (siehe unten).
STATISTICA-Handbuch – 31
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Zum Einfügen eines Blockes zwischen Zeilen oder Spalten zeigt man auf die
Grenze der Auswahl (der Mauszeiger verwandelt sich in einen Pfeil) und zieht dann
bei gedrückter UMSCHALT-Taste die Auswahl an die neue Position.
Beim Zeigen zwischen Zeilen wird zwischen diesen ein Einfügungszeichen
angezeigt. Lassen Sie die Maustaste dann los, wird der Block zwischen diese beiden
Zeilen eingefügt (und erzeugt dabei neue Fälle). Beim Zeigen zwischen Spalten
wird zwischen diesen ein Einfügungszeichen angezeigt. Beim Loslassen der
Maustaste wird dann der Block zwischen diese beiden Spalten eingefügt (und
erzeugt dabei neue Variablen).
Wird während des Ziehens der Auswahl auch die STRG-Taste gedrückt, wird der
Block kopiert und eingefügt statt verschoben und eingefügt; neben dem Mauszeiger
erscheint ein Pluszeichen (siehe nächste Abbildung).
Des Weiteren kann eine Wertereihe im Block durch Ziehen des Ausfüllkästchens
(ein kleines ausgefülltes Quadrat rechts unten an der Blockgrenze) extrapoliert
werden (automatisches Ausfüllen).
32 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
STATISTICA bietet ein umfassendes
kontextsensitives Elektronisches Handbuch für alle Prozeduren und Optionen des
Programms (es bietet mehr als 100 Megabyte komprimierter Dokumentation). Man
erreicht es durch Auswahl des Befehls STATISTICA Hilfe im Menü Hilfe oder durch
das Klicken der Schaltfläche
in der STATISTICA-Symbolleiste. Man kann auch
ein Register eines Dialoges oder einen Menübefehl, für den weitere Information
erwünscht wird, einfach auswählen (bzw. hervorheben) und anschließend die Taste
F1 drücken, so dass das entsprechende Hilfethema aufgerufen wird. Alternativ kann
man auf die Hilfeschaltfläche
klicken, die sich in der Titelzeile aller Dialoge
befindet.
Dank seiner dynamischen Hypertext-Organisation, der Registerstruktur (z. B.
Inhalte, Index, Suche und Favoriten) und weiterer Eigenschaften für die Anpassung
des Hilfesystems findet man Informationen im Elektronischen Handbuch schneller
auf als in traditionellen Handbüchern.
Die Statusleiste am unteren Rand des STATISTICA-Fensters bietet ebenfalls kurze
Erklärungen von Menübefehlen oder Symbolschaltflächen, wenn das entsprechende
Element ausgewählt bzw. angeklickt wird.
Im Elektronischen Handbuch ist ein Statistischer
Wählt man aus dem Menü Hilfe die Option Statistischer Berater,
werden einige einfache Fragen zu der Art des anstehenden Problems und dem Typ
der Daten angezeigt. Nachdem für die Beantwortung der Fragen die entsprechenden
Links geklickt werden, erscheinen Vorschläge zu relevanten/passenden statistischen
Methoden, und es wird mitgeteilt, wo sie in STATISTICA zu finden sind.
Berater integriert.
STATISTICA-Handbuch – 33
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Direkte Verknüpfungen (Hypertext-Links) führen von den Themen des
Statistischen Beraters zu den entsprechenden Einführenden Beschreibungen, in
denen die statistischen Methoden und Prozeduren detailliert diskutiert werden.
Für das Beispiel einer dreifaktoriellen
Varianzanalyse mit Messwiederholung auf einem Faktor (2 x 2 x 3-Design) öffnen
Sie die Datendatei Adstudy.sta. Um die ANOVA/MANOVA-Analyse zu starten,
wählen Sie aus dem Menü Statistik den Befehl ANOVA, womit das Start-Menü
ANOVA/MANOVA aufgerufen wird.
34 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
In diesem Dialog können sowohl sehr einfache Analysen (z. B. über Einfaktorielle
ANOVA-Designs mit nur einem Faktor) als auch komplexere Analysen (z. B.
Designs wie ANOVA mit Messwiederholungen mit Zwischen-Gruppen-Faktoren und
Inner-Gruppen-Faktoren) spezifiziert werden.
Wählen Sie ANOVA mit Messwiederholungen als Analysetyp und
Standarddialog als Spezifikationsverfahren aus. Klicken Sie im ANOVA/MANOVA
Start-Menü dann auf die Schaltfläche OK, um in den Dialog ANOVA/MANOVA mit
Messwiederholungen zu gelangen.
Der erste (Zwischen-Gruppen-)
Faktor ist Geschlecht (mit zwei Stufen: männlich und weiblich). Der zweite
(Zwischen-Gruppen-)Faktor ist Produkt (mit zwei Stufen: Produkt A und Produkt
B). Die beiden Faktoren sind gekreuzt, d. h., es gibt sowohl männliche und weibliche
Personen in den Gruppen Produkt A und Produkt B. Jede dieser Personen
beantwortete drei Fragen. Diesen Messwiederholungsfaktor nennen wir Reaktion:
Er besitzt drei Stufen, repräsentiert durch die Variablen Messung01, Messung02 und
Messung03.
Klicken Sie auf die Schaltfläche Variablen (im Dialog ANOVA/MANOVA mit
Messwiederholungen), um in den Dialog zur Variablenauswahl zu gelangen.
Wählen Sie Messung01 bis Messung03 als abhängige Variablen aus dem
entsprechenden Listenfeld und Geschlecht und Produkt als Faktoren [aus dem
Listenfeld Kategoriale Prädiktoren (Faktoren)].
STATISTICA-Handbuch – 35
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Klicken Sie auf OK, um in den Dialog ANOVA/MANOVA mit Messwiederholungen
zurückzukehren.
Das Design des Versuches, den wir auswerten
wollen, kann wie folgt zusammengefasst werden:
ZwischenGruppen
Faktor 1:
Geschlecht
Person 1
Person 2
Person 3
.
.
.
männlich
männlich
weiblich
.
.
.
ZwischenGruppen
Faktor 2:
Produkt
Produkt A
Produkt B
Produkt B
.
.
.
Messwiederholungsfaktor: Reaktion
Stufe 1:
Messung01
Stufe 2:
Messung02
Stufe 3:
Messung03
9
6
9
.
.
.
1
7
8
.
.
.
6
1
2
.
.
.
Die minimal erforderliche
Auswahl ist nun abgeschlossen. Wäre man nicht an einem
Messwiederholungsfaktor interessiert, müsste man nur noch auf die Schaltfläche OK
drücken, um die Analyseergebnisse zu sehen. In diesem Beispiel muss allerdings
spezifiziert werden, dass die drei ausgewählten abhängigen Variablen als drei
Stufen eines Messwiederholungsfaktors (Inner-Gruppen-Faktor) interpretiert
werden sollen. Anderenfalls würde STATISTICA davon ausgehen, dass diese drei
„verschiedene“ abhängige Variablen wären und eine MANOVA (d. h. eine
Multivariate ANOVA) durchführen.
Um den gewünschten Messwiederholungsfaktor zu definieren, klicken Sie im
Register Standard auf die Schaltfläche Innerhalb-Effekte, die zum Dialog InnerGruppen-Faktoren spezifizieren führt.
36 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
STATISTICA schlägt die Auswahl eines Messwiederholungsfaktors mit 3 Stufen vor
(Standardname R1). Über diesen Dialog lässt sich lediglich ein Inner-GruppenFaktor (Messwiederholung) spezifizieren. Um mehrere Inner-Gruppen-Faktoren zu
definieren, muss das Modul Allgemeine Lineare Modelle verwendet werden
(verfügbar im Zusatzmodul Höhere lineare/nichtlineare Modelle). Um zu einer
umfassenden Diskussion von Messwiederholungen und Beispieldesigns im
Elektronischen Handbuch zu gelangen, drücken Sie auf Ihrer Tastatur die Taste F1
(oder auf das Symbol , das sich im Dialog in der rechten oberen Ecke befindet).
Bearbeiten Sie für dieses Beispiel den Faktornamen (z. B. benennen Sie ihn von R1
auf REAKTION um) und klicken zum Beenden des Dialoges auf die Schaltfläche
OK.
Sie müssen nicht
von Hand Codes für Zwischen-Gruppen-Faktoren eingeben [etwa STATISTICA
mitteilen, dass Variable Geschlecht die zwei Stufen 1 und 2 (oder männlich und
weiblich) aufweist], es sei denn, Sie wollen verhindern, dass STATISTICA
standardmäßig alle Codes verwendet, die es in den ausgewählten
Gruppierungsvariablen des Datenbestandes vorfindet. Wollen Sie eine solche
benutzerdefinierte Codeauswahl vornehmen, dann klicken Sie auf die Schaltfläche
Faktor-Codes, um in den Dialog Codes für unabhängige Variablen (Faktoren) wählen
zu gelangen.
Dieser Dialog bietet verschiedene Optionen. Beispielsweise können Sie sich vor
Ihrer Auswahl über die Schaltfläche Zoom die Werte einzelner Variablen ansehen,
den Datenbestand durchsuchen und die Code-Felder (z. B. Geschlecht und Produkt)
für einzelne oder alle Variablen ausfüllen lassen. Klicken Sie im Dialog Codes für
unabhängige Variablen (Faktoren) wählen auf die Schaltfläche OK, damit
STATISTICA-Handbuch – 37
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
STATISTICA automatisch alle Code-Felder mit allen in den ausgewählten Variablen
vorgefundenen Werten ausfüllt und den Dialog schließt.
Klicken Sie nach Rückkehr in den Dialog
ANOVA/MANOVA mit Messwiederholungen auf die Schaltfläche OK. Die Analyse
wird durchgeführt und der Dialog ANOVA Ergebnisse wird angezeigt, der
verschiedene Optionen zur Ausgabe von Ergebnistabellen und Grafiken enthält.
Der Dialog ist in Register unterteilt, was das schnelle Auffinden der gewünschten
Ergebnisoptionen erleichtert. Möchten Sie zum Beispiel geplante Vergleiche
durchführen, klicken Sie auf Register Vergl. Für die Betrachtung von
Residualstatistiken klicken Sie auf das Register Residuen. Für dieses Beispiel
beschränken wir uns allerdings auf die im Register Standard verfügbaren
Ergebnisse.
Wir beginnen mit der Tabelle der
Zusammenfassung aller Effekte, indem wir auf die Schaltfläche Alle Effekte (mit
dem Symbol
für Zusammenfassung) klicken.
38 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Der einzige statistisch signifikante Effekt der Analyse (wenn man die Konstante
einmal ignoriert) ist Faktor REAKTION (p = 0,007). Dieses Ergebnis kann durch
viele mögliche Muster von Mittelwerten des Effektes REAKTION verursacht sein
(weitere Informationen hierzu entnehmen Sie bitte der ANOVA – Einführung im
Elektronischen Handbuch). Zur Veranschaulichung werden wir die
Gruppenmittelwerte dieses Effekts grafisch betrachten.
Um zum Dialog ANOVA Ergebnisse zurückzukehren, kann man STRG+R drücken,
aus dem Menü Statistik die Option Weiter auswählen oder die Schaltfläche ANOVA
Ergebnisse in der Analyseleiste unten anklicken. Wird der Dialog ANOVA
Ergebnisse angezeigt, klicken Sie auf die Schaltfläche Alle Effekte/Grafiken, um den
Dialog Tabelle aller Effekte aufzurufen, so dass die Mittelwerte für einzelne Effekte
betrachtet werden können.
Dieser Dialog enthält eine zusammenfassende Tabelle aller Effekte (überwiegend
mit Informationen, die wir bereits in der Tabelle Alle Effekte gesehen haben) und
dient dazu, einzelne Effekte aus der Tabelle in Form von Grafiken der
STATISTICA-Handbuch – 39
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
entsprechenden Mittelwerte zu zeigen (optional auch Tabellen mit den
entsprechenden Mittelwerten).
Führen Sie einen
Doppelklick auf den signifikanten Haupteffekt REAKTION (markiert mit einem
Stern in der Spalte p) aus, um die entsprechende Grafik anzuzeigen.
Die Grafik zeigt einen deutlichen absteigenden Trend: Die Mittelwerte der drei
aufeinanderfolgenden Fragen werden immer niedriger. Obwohl dieses Design keine
signifikanten Interaktionen enthält (siehe oben die Diskussion der Tabelle aller
Effekte), sehen wir uns dennoch die Interaktion höchster Ordnung an, um die
Konsistenz dieses stark absteigenden Trends über die Stufen der
Gruppierungsfaktoren zu untersuchen.
Um die
grafische Darstellung der Interaktion höchster Ordnung zu sehen, doppelklicken Sie
(nach erneuter Auswahl der Schaltfläche Alle Effekte/Grafiken aus dem Dialog
ANOVA Ergebnisse) im Dialog Tabelle aller Effekte auf die Zeile
REAKTION*GESCHLECHT*PRODUKT; sie repräsentiert die Interaktion zwischen
den Faktoren 1 (Geschlecht), 2 (Produkt) und 3 (Reaktion). Der Zwischendialog
Anordnung der Faktoren im Plot spezifizieren, in dem sich die voreingestellte
Anordnung der Faktoren in der Grafik umstellen lässt, wird angezeigt (anders als im
vorhergehenden Plot eines einzelnen Faktors können die Effekte hier auf
verschiedene Weisen visualisiert werden).
40 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Klicken Sie OK, um die vorgeschlagene Anordnung zu akzeptieren und die
Mittelwertgrafik zu erzeugen.
Man erkennt, dass das nach Stufen der Zwischen-Gruppen-Faktoren untergliederte
Muster von Mittelwerten keine bedeutenden Abweichungen vom Gesamtmuster der
Mittelwerte aufweist, das die erste Grafik (für den Haupteffekt REAKTION)
aufzeigte. Um die Ergebnisse weiter zu erforschen, könnten Sie nun weitere Effekte
interaktiv untersuchen, zum Beispiel multiple Mittelwertvergleiche anstellen oder
viele weitere Analyseoptionen nutzen.
Dieses Beispiel
veranschaulicht, wie STATISTICA die interaktive Analyse unterstützt. Die
Spezifikation der zu erzeugenden Ausgabe wird vom Benutzer nicht schon verlangt,
ehe er die ersten Ergebnisse gesehen hat. Selbst ein einfaches Analysedesign kann
offensichtlich große Mengen von Ausgabetabellen und zahllose Grafiken erzeugen.
Was davon aber von Interesse ist, sieht man erst, wenn die ersten grundlegenden
Ergebnisse vorliegen. In STATISTICA lassen sich nach Verarbeitung der Daten und
STATISTICA-Handbuch – 41
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Begutachtung grundlegender Ergebnisse gezielt spezifische Ausgaben auswählen
und interaktiv Folgetests und ergänzende Was-wäre-wenn-Analysen durchführen.
Die flexiblen Berechnungsprozeduren in STATISTICA und die große Auswahl an
Optionen zur Visualisierung beliebiger Kombinationen von Ergebniswerten bieten
zahllose Möglichkeiten, Daten zu untersuchen und Hypothesen zu prüfen.
Jede im Verlauf einer interaktiven Datenanalyse getroffene Auswahl
(sowohl bei der Spezifikation der Analyse als auch bei der Auswahl von
Ausgabeoptionen) wird automatisch als Visual Basic-Code (Industriestandard)
aufgezeichnet. Solche Makros können für den wiederholten Gebrauch gespeichert
werden. Man kann sie Schaltflächen zuordnen, bearbeiten und modifizieren, mit
anderen Programmen kombinieren und vieles mehr. Weitere Information hierzu
finden Sie in Kapitel 9 – STATISTICA Visual Basic auf Seite 239 oder im
STATISTICA Visual Basic Primer.
Zum schnellen und einfachen Auffinden einer Teilmenge von Daten innerhalb einer
großen Datendatei bietet STATISTICA die besondere Option Variablenbündel.
Bündel können erstellt werden, um große Mengen von Variablen zu gliedern und
um die wiederholte Auswahl derselben Variablen zu vereinfachen.
Öffnen Sie die Datei EnginePerformance.sta. Dieser Datensatz beschreibt die
Leistung größerer Motoren und enthält verschiedene Prozessparameter, die während
ihrer Herstellung aufgezeichnet wurden. Die Datei umfasst 128 Motoren, deren
Effizienz, Kraftstoffverbrauch und Leistung (die anhand von Tests ermittelt wurden)
sowie 74 Prozessparameter, die während der Herstellung der einzelnen Motoren
aufgezeichnet wurden.
Für dieses Beispiel wird angenommen, dass häufig Analysen erstellt werden, bei
denen derselbe Satz von Variablen wiederholt verwendet wird.
Wählen Sie im Menü Daten den Befehl Variablenbündel-Manager, um den Dialog
Variablenbündel-Manager aufzurufen.
42 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Klicken Sie die Schaltfläche Neu, um den Dialog Neues Variablenbündel
aufzurufen.
Geben Sie unter Name Variablenbündel den Begriff Produktion ein und klicken Sie
anschließend die Schaltfläche OK. Der Dialog Variablenauswahl für Bündel wird
aufgerufen, der alle Variablen des Datensatzes EnginePerformance.sta enthält.
Für diese Analysen ist die Auswahl der Variablen Input01-Input05, Input20,
Input30-Input35 und Input70 erforderlich. Um Bereiche bzw. unterbrochene Listen
STATISTICA-Handbuch – 43
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
von Elementen auszuwählen, können diese Variablen mit den WindowsKonventionen UMSCHALT+Klick und STRG+Klick gewählt werden.
Klicken Sie die Schaltfläche OK, um den Dialog Variablenauswahl für Bündel zu
schließen, so dass man zum Variablenbündel-Manager zurückkehrt.
Die Liste auf der linken Seite des Dialogs zeigt die Namen aller Bündel auf, die für
diese Tabelle definiert wurden (falls erforderlich, können in einzelnen Tabellen
jeweils mehrere Bündel erstellt werden). Das Fenster auf der rechten Seite zeigt den
Inhalt des Bündels an, das momentan im Fenster auf der linken Seite ausgewählt ist.
Wenn beide Listen leer sind, wurden für diese Tabelle keine Bündel erstellt.
Bündel können einer Tabelle mittels der Schaltfläche Neu hinzugefügt, über die
Schaltfläche Bearbeiten verändert und mittels der Schaltfläche Löschen entfernt
werden. Der Name eines Bündels lässt sich über die Schaltfläche Name verändern.
Das Klicken der Schaltfläche Ausgabe an Tabelle erzeugt eine Tabelle, die die
Information über die Bündel der aktiven Datentabelle aufführt.
Klicken Sie in diesem Beispiel die Schaltfläche OK, womit Sie das soeben erstellte
Bündel bestätigen und den Dialog Variablenbündel-Manager schließen. Wählen Sie
im Statistik-Menü anschließend Multiple Regression, um den Dialog Multiple
Lineare Regression aufzurufen. Klicken Sie im Register Standard die Schaltfläche
Variablen, um den Dialog zur Variablenauswahl aufzurufen.
Bündel werden in eckigen Klammern direkt am Anfang der Variablenliste (in
alphabetischer Reihenfolge) aufgeführt. Wählen Sie in der Liste Unabhängige
Variablen das Bündel Produktion, um – mit einem Mausklick – Input01-Input05,
44 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Input 20, Input 30-Input35 und Input 70 als die unabhängigen Variablen dieser
Analyse festzulegen.
Falls Sie unsicher sind, welche Variablen in dem Bündel erfasst wurden, können Sie
in diesem Dialog einfach den Mauszeiger auf den Bündelnamen bewegen, so dass
eine Kurzinfo mit den Variablennummern angezeigt wird.
Zusätzlich kann man die Liste der Variablen (mit Namen) im VariablenbündelManager einsehen, wozu einfach die Schaltfläche [Bündeln] geklickt werden muss.
Es ist zu beachten, dass Bündel lediglich für einzelne Tabellen definiert werden und
nur für die Variablenauswahl verwendet werden. Sie werden demnach nie in einem
Bericht oder einer anderen Ausgabe aufgeführt.
Dieses Beispiel zeigt, dass man erheblich Zeit sparen kann, wenn statt der Suche
nach den richtigen Variablen innerhalb eines großen Datensatzes lediglich ein
einzelnes Bündel ausgewählt muss.
STATISTICA-Handbuch – 45
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
STATISTICA bietet eine mächtige Option, die jede statistische oder grafische
Analyse in eine Analyse für Gruppen umwandeln kann. Wenn im Ergebnisdialog
von praktisch jeder beliebigen Analyse die Resultate betrachtet werden oder wenn
die Grafik-Optionen verwendet werden, kann man eine oder mehrere
Gruppierungsvariablen auswählen und dann folgende Ergebnisse erzeugen: 1) für
alle Fälle in den Daten zusammen und/oder 2) gegliedert nach jeder einzelnen
Kombination von Codes der Gruppierungsvariablen.
Dies ist ein sehr leistungsstarkes neues Werkzeug für die interaktive und
explorative Datenanalyse, das es erlaubt, schnell zu überprüfen, ob ein Muster oder
bestimmtes Resultat in allen Untergruppen, Stichproben oder Schichten der Daten
besteht.
Wird beispielsweise eine Multiple Regressionsanalyse durchgeführt, und man
entscheidet, die Ergebnisse gegliedert nach dem Geschlecht und einer anderen
Gruppierungsvariablen zu betrachten, so ist dies möglich, ohne den aktuellen
Dialog zu schließen. Nach der Aktivierung dieser Option (durch Klicken der
Schaltfläche
Gruppen) werden nach jedem weiteren Aufruf einer
46 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Ergebnisschaltfläche (z. B. beim Erstellen tabellarischer oder grafischer
Ergebniszusammenfassungen) alle Ergebnisse nicht nur für alle Gruppen zusammen
(optional), sondern auch für jede einzelne eindeutige Kombination der spezifizierten
Gruppierungsvariablen berechnet (z. B. nach Geschlecht und einer weiteren
Gruppierungsvariablen).
In einer Arbeitsmappe können die Ergebnisse der Gruppen-Analyse entweder in
separate Ordner platziert werden, die mit der entsprechenden Gruppen-Bedingung
(z. B. Geschlecht=weiblich; Zeit=Nach1) gekennzeichnet sind oder in einen
einzigen Ordner abgelegt werden.
Beispielsweise könnte man mehrere Linienplots zur Beschreibung eines
multivariaten Batchprozesses erstellen, wobei ein separater Graph („Trajektorie“)
für jeden einzelnen Batch erstellt wird.
Diesem Beispiel liegt die Datendatei Tomatoes.sta zugrunde, welches eine der
Beispieldateien ist, die im STATISTICA Elektronisches Handbuch im Abschnitt
Versuchsplanung (siehe Beispiel Versuchsplanung und -auswertung für einen 2332STATISTICA-Handbuch – 47
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Plan) genauer beschrieben wird. Connor und Young (in McLean und Anderson,
1984) berichten über einen Versuch (der von Youden und Zimmerman, 1936,
stammt) über verschiedene Verfahren zur Produktion von Sämlingen für
Tomatenpflanzen, die danach auf einem Feld eingepflanzt werden.
Öffnen Sie zunächst den Datensatz Tomatoes.sta. Wählen Sie im Datei-Menü den
Befehl Beispieldatei öffnen, um den Dialog STATISTICA-Daten öffnen aufzurufen.
Öffnen Sie den Ordner Datasets und anschließend die dort enthaltene Datei
Tomatoes.sta.
In obiger Abbildung sind einige Zeilen (Fälle) dieser Datei aufgeführt. Es sei auch
auf die Elektronische Hilfe zur Versuchsplanung hingewiesen, die ein Beispiel mit
einer kompletten Analyse dieser Daten beinhaltet.
Dieses Beispiel illustriert ein typisches Vorgehen, wie es häufig bei der Analyse
von Daten einer diskreten Produktion bzw. Batchproduktion angewendet wird.
D. h., das Ziel der Analyse besteht darin, dass (grafisch oder analytisch) verifiziert
wird, dass einige Muster oder Verteilungen gleichmäßig für alle Stichproben, Teile
oder Batches gelten.
Im Folgenden wird der Effekt der Variablen Methode, Dünger und Topfgröße auf
den Ertrag (Gewicht) untersucht und abgeschätzt, ob irgendwelche Muster für jede
einzelne Sorte in der Studie gelten. Anstatt eine komplette Varianzanalyse
durchzuführen (wie sie in der Elektronischen Hilfe im Beispiel zur
Versuchsplanung beschrieben wird), werden in den folgenden Abschnitten
vorwiegend grafische Methoden angewendet.
48 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Wählen Sie im Untermenü Grafik den Befehl Streuungsplots, um den Dialog Streuungsplot aufzurufen.
Klicken Sie die Schaltfläche Variablen, und wählen Sie für diese Grafik im
anschließenden Dialog Variablenauswahl Streuungsplot die Variable Gewicht als
die Abhängige Variable und Dünger, Topfgröße und Methode aus der Liste der
Gruppierungsvariablen.
2D Grafiken
Im weiteren Verlauf dieses Beispiels werden für jede einzelne Sorte Grafiken
erstellt, um die Gruppen-Funktion zu illustrieren. Klicken Sie nun im Dialog zur
Variablenauswahl die Schaltfläche OK.
Um den Plot
informativer zu gestalten, werden die Variablen umsortiert, so dass Methode als
erster Faktor in der Liste der Faktoren erscheint. Klicken Sie in der Faktoren-Liste
auf diese Variable, und ziehen Sie die Variable dann, wobei Sie die linke Maustaste
gedrückt halten, auf die oberste Position in dieser Liste.
STATISTICA-Handbuch – 49
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Stellen Sie im Dialog Streuungsplot abschließend sicher, dass die Variable Methode
in der Faktoren-Liste ausgewählt ist, und aktivieren Sie das Kontrollkästchen
Rahmen für Gruppen.
Für die Faktoren Methode, Dünger und
Topfgröße sollen für alle Tomatensorten insgesamt und gegliedert nach den
einzelnen Sorten (eine Grafik pro Sorte) jeweils Streuungsplots erstellt werden.
Klicken Sie die Schaltfläche Gruppen, um den Dialog Gruppen aufzurufen.
Klicken Sie die Schaltfläche Gruppierungsvariable(n), um den Dialog Auswahl nach
Variable aufzurufen, und legen Sie dort Sorte als Gruppierungsvariable fest.
Es ist zu beachten, dass man mehr als eine Gruppierungsvariable festlegen kann,
wobei in diesem Fall alle nachfolgenden Analysen nach jeder eindeutigen
Wertekombination der Gruppierungsvariablen gegliedert werden.
Klicken Sie nun jeweils in den Dialogen
Auswahl nach Variable und Gruppen auf OK, um diese Dialoge zu schließen.
Klicken Sie anschließend im Dialog Streuungsplot auf die Schaltfläche OK, um die
Grafiken zu erstellen.
50 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Man beachte, wie die Streuungsplots erstellt wurden: 1) für Alle Gruppen und 2) für
die einzelnen Sorten (Bonny und Marglobe).
Wenn man diese Grafiken näher betrachtet, stellt man fest, dass für Sorte=Bonny
die Variable Methode anscheinend kaum einen Unterschied ausmacht (bzgl. der
beobachteten Werte für Gewicht), wohingegen bei Sorte=Marglobe die Methode
Ballaststoffe+NO3 die geringste Streuung in den Werten aufzeigt, wobei hier
bezogen auf die Gesamtverteilung generell recht hohe Werte für die Variable
Gewicht vorliegen.
Als Nächstes werden die Optionen der Deskriptiven Statistik verwendet, um diesen
Sachverhalt näher zu untersuchen. Um zum Startmenü Elementare Statistik und
Tabellen zu gelangen, wählen Sie Elementare Statistik im Statistik-Menü. Wählen
Sie Gliederung/einfaktorielle ANOVA, und klicken Sie die Schaltfläche OK, um den
Dialog Gliederung/einfaktorielle ANOVA aufzurufen. Klicken Sie die Schaltfläche
Variablen, und legen Sie dann im Dialog Gruppierungsvariablen und abhängige
Variablen die Variable Gewicht als die abhängige Variable und Methode als
Gruppierungsvariable fest. Klicken Sie anschließend OK, um den Dialog zur
Variablenauswahl zu schließen. Wird dann im Dialog Gliederung/einfaktorielle
ANOVA die Schaltfläche OK geklickt, so wird der Dialog Statistik nach Gruppen Ergebnisse aufgerufen.
Die Statistik nach Gruppen soll weiter nach Tomatensorten untergliedert werden.
Klicken Sie hierzu die Schaltfläche Gruppen und im dadurch aufgerufenen Dialog
STATISTICA-Handbuch – 51
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Gruppen die Schaltfläche Gruppierungsvariable(n). Wählen Sie im
Nach Variable die Variable Sorte als die Gruppierungsvariable.
Dialog Auswahl
Klicken Sie nun in diesem Dialog sowie im Dialog Gruppen jeweils auf OK.
Klicken Sie im Dialog Statistik nach Gruppen - Ergebnisse nacheinander auf 1) die
Schaltfläche Zusammenfassung, 2) die Schaltfläche Varianzanalyse und 3) die
Schaltfläche Interaktionsplots.
52 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
Alle Ergebnisse werden in dem entsprechenden Ordner platziert, entweder im
Ordner Alle Gruppen oder in den Ordnern Sorte=Bonny bzw. Sorte=Marglobe.
Es ist nun also möglich, die Ergebnisse kombiniert für alle Gruppen sowie
gegliedert nach Variable Sorte zu begutachten. Dabei ist ersichtlich, dass für
Sorte=Marglobe die Variable Methode tatsächlich einen Effekt auf den Ertrag
(Gewicht) hat, wohingegen es kein Anzeichen für einen derartigen Effekt bei
Sorte=Bonny gibt.
Mit STATISTICA kann man von fast jedem Ergebnisdialog aus ad hoc
Gruppenanalysen durchführen, wobei die Ergebnisse kombiniert für alle Gruppen
oder gegliedert nach einer oder mehreren Gruppierungsvariablen betrachtet werden
können. Dieses sehr mächtige Feature für die explorative Datenanalyse kann dazu
verwendet werden, Gruppen zu vergleichen und für jede Analyse die Konsistenz der
Ergebnisse über alle Gruppen hinweg zu überprüfen.
Bevor dieses Thema abgeschlossen wird, erscheinen einige Kommentare über die
technischen Details der Implementierung dieses Features hilfreich. Wenn eine
Analyse nach Gruppen durchgeführt wird, wie es in diesem Beispiel illustriert
wurde, wiederholt das Programm tatsächlich alle Berechnungen der Analyse separat
für jede einzelne Gruppe (und alle Gruppen kombiniert). Hierbei wird der
STATISTICA Visual Basic-Makrocode verwendet, der automatisch während der
interaktiven Analysen aufgezeichnet wird und der auch als Makro abgespeichert
werden kann (siehe hierzu auch Kapitel 9 – STATISTICA Visual Basic). Bei der
Analyse sehr umfangreicher Daten (z. B. sehr große unbalancierte Versuchspläne
oder komplexe Analysen, die vor der Ergebnisausgabe iterative Berechnungen
erfordern) können die einzelnen Analysen eine erhebliche Rechenzeit
beanspruchen, speziell dann, wenn den Daten viele Gruppen zugrunde liegen (man
stelle sich z. B. ein komplexes Allgemeines Lineares Modell vor, das für Hunderte
von Gruppen geschätzt werden muss).
Demnach ist es im Allgemeinen ratsam, eine explorative Analyse zunächst mit dem
Erstellen einfacher deskriptiver Statistiken, Häufigkeitstabellen und Grafiken zu
beginnen, um die Struktur der Daten zu verstehen, so dass man einen Überblick
über die Anzahl der einzelnen Gruppen (die auch durch Wertekombinationen in den
Gruppierungsvariablen erzeugt werden) in den Daten erhält.
STATISTICA-Handbuch – 53
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
54 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
STATISTICA-Handbuch – 55
Copyright © StatSoft, 2009
KAPITEL 2: EINFÜHRENDE BEISPIELE
56 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
Zusätzlich zu den herkömmlichen STATISTICA-Tabellen können bei der
Durchführung einer Analyse auch Excel-Dateien direkt in STATISTICA geöffnet
werden und als Datenquelle dienen.
Um den Dialog STATISTICA-Daten öffnen aufzurufen, wählen Sie Beispieldatei
öffnen im STATISTICA Datei-Menü. Wählen Sie Excel-Arbeitsmappe (*.xls) in der
Liste unter Dateityp, die sich am unteren Rand des Dialogs befindet. Führen Sie auf
dem Datasets-Ordner einen Doppelklick aus, und wählen Sie dann die Datei
Weather report.xls. Klicken Sie die Schaltfläche Öffnen, so dass der Dialog Öffne
Datei aufgerufen wird. Klicken Sie die Schaltfläche Als Excel-Arbeitsmappe öffnen,
womit die Excel-Datei aufgerufen wird. Beim Öffnen der Excel-Arbeitsmappe
werden in STATISTICA die Excel- und STATISTICA-Menüs zusammengefügt,
womit man den Zugriff auf die wichtigsten Funktionen beider Anwendungen erhält.
STATISTICA-Handbuch – 57
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Wählen Sie im Statistik-Menü die Option Elementare Statistik. Hierdurch wird der
Dialog Excel-Datei aufgerufen.
Bei einer geöffneten Excel-Arbeitsmappe im STATISTICA-Fenster wird dieser
Dialog immer dann aufgerufen, sobald eine Option aus den Statistik-, Data-Miningoder Grafik-Menüs gewählt wird. Die von STATISTICA für diese Arbeitsmappe
automatisch vorgenommenen Einstellungen können bei Bedarf geändert werden.
Wenn in einer Excel-Arbeitsmappe keine Variablennamen enthalten sind, weist
STATISTICA den Variablen die Namen Var1, Var2, Var3 usw. zu. Wie bei einer
STATISTICA-Tabelle werden für die ausgewählte Analyse alle Werte in einer Spalte
verwendet, sofern keine Fallauswahlbedingungen festgelegt wurden. Klicken Sie
58 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
für dieses Beispiel im Dialog Excel-Datei auf die Schaltfläche OK, um die
Standardeinstellungen zu übernehmen und den Dialog zu schließen. Hierdurch wird
der anschließende Dialog Ansicht/Bearbeiten Spaltentyp aufgerufen.
STATISTICA ermöglicht es, für die einzelnen Spalten die Datentypen zu definieren.
Die Datentypen umfassen Numerisch, Text, Numerisch mit Textlabels und Missing
Data. Leere Zellen einer Excel-Arbeitsmappe werden stets als Missing Data
(fehlende Werte) betrachtet, und falls eine numerische Spalte Textwerte enthält,
werden auch diese Werte als Missing Data angesehen. STATISTICA bietet
bezüglich der Datentypen eine Vorauswahl an, die jeweils auf den ersten Zeilen der
Daten basiert (der Dialog Ansicht/Bearbeiten Spaltentyp kann auch übersprungen
werden, wenn im Dialog Excel-Datei das Kontrollkästchen Ansicht/Bearbeiten der
Spaltentypen vor Import deaktiviert wird). Bei Bedarf kann diese Vorauswahl der
Datentypen verändert werden, indem auf dem Namen der zu ändernden Spalte ein
Doppelklick ausgeführt wird (alternativ mit einfachem Klick auf entsprechender
Spalte und Schaltfläche Bearbeiten), so dass der Dialog Spaltentyp für Import
ändern aufgerufen wird, in dem der bevorzugte Datentyp festgelegt werden kann.
Für dieses Beispiel wird die Vorauswahl übernommen, so dass der Dialog
Spaltentyp für Import ändern mittels der Schaltfläche Abbrechen geschlossen wird.
Wird anschließend im Dialog Ansicht/Bearbeiten Spaltentyp auf die Schaltfläche
OK geklickt, erscheint das Startmenü der ausgewählten Analyse oder Grafik (in
STATISTICA-Handbuch – 59
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
diesem Beispiel das Elementare Statistik und Tabellen-Startmenü), und man kann
mit der Analyse wie gewohnt fortfahren.
STATISTICA bietet mittels STATISTICA Query Zugriff auf nahezu alle
Datenbanken (einschließlich der großen Systemdatenbanken wie Oracle, Sybase
usw.). Auf das Modul STATISTICA Query kann über die Untermenüs Datei Externe Daten oder Daten - Externe Daten zugegriffen werden. STATISTICA Query
importiert Daten aus einer Datenbank direkt in eine STATISTICA-Tabelle, so dass
die Daten in diesem Format gespeichert werden können.
STATISTICA Query ermöglicht den einfachen Datenzugriff mittels Microsofts
OLE-DB-Konventionen (OLE DB – Object Linking and Embedding Database).
OLE DB ist eine mächtige Datenbank-Technologie, die universelle
Datenintegration in einem Unternehmensnetzwerk – von einem Server auf den
Desktop – unabhängig vom Datentyp ermöglicht.
STATISTICA Query unterstützt mehrere Datenbank-Tabellen. Durch Eingabe von
SQL-Anweisungen, die STATISTICA Query automatisch erstellt, wenn Sie die
Komponenten der Abfrage über eine einfache grafische Benutzeroberfläche
und/oder intuitive Menüoptionen und Dialoge auswählen, können bestimmte
Einträge (Datensätze, Zeilen von Tabellen) ausgewählt werden. Es sind daher keine
besonderen SQL-Kenntnisse notwendig, um fortgeschrittene und umfassende
Datenabfragen zu erstellen. Es können mehrere Abfragen, die auf einer oder vieler
verschiedener Datenbank(en) basieren, erzeugt werden, die Daten an eine einzelne
Tabelle zurückgeben. Darüber hinaus können Verbindungen zu mehreren externen
Datenbanken gleichzeitig beibehalten werden.
Erstellen Sie für dieses Beispiel eine neue Datenbankabfrage, indem Sie im
Untermenü Datei - Externe Daten die Option Neue Abfrage erstellen wählen.
Hierdurch werden das Modul STATISTICA Query und der Dialog
Datenbankverknüpfung aufgerufen.
60 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
In diesem Dialog können Sie eine bereits bestehende Datenbankverknüpfung
wählen oder eine neue Verknüpfung definieren. Für dieses Beispiel soll eine neue
Datenbankverknüpfung erstellt werden, so dass in diesem Dialog die Schaltfläche
Neu zu wählen ist, womit der Dialog Datenverknüpfungseigenschaften aufgerufen
wird.
Sie können entweder den OLE-DB-Provider wählen, der Ihnen vom
Datenbankanbieter zur Verfügung gestellt wurde, oder einen der standardmäßigen
OLE-DB-Provider von Microsoft, der mit Ihrem Datenbanksystem kompatibel ist.
In diesem Beispiel wird eine Jet-Datenbank-Datei verwendet, die mit STATISTICA
installiert wurde, so dass die Option Microsoft Jet 3.51 OLE DB Provider zu wählen
ist. Um fortzufahren, klicken Sie die Schaltfläche Weiter >>, womit im Dialog
Datenverknüpfungseigenschaften das Register Verbindung aufgerufen wird.
STATISTICA-Handbuch – 61
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Klicken Sie die Schaltfläche
, die sich neben dem Eingabefeld Geben Sie den
Datenbanknamen ein, oder wählen Sie einen aus befindet, so dass der Dialog
Access-Datenbank auswählen aufgerufen wird. Rufen Sie den Ordner STATISTICA
Examples auf, öffnen Sie dort den Ordner Database, und doppelklicken Sie dort auf
die Datei ProcessData.mdb. Hierdurch wird der Pfad- und Dateiname in dem
Eingabefeld Geben Sie den Datenbanknamen ein, oder wählen Sie einen aus
angezeigt.
Klicken Sie im Dialog Datenverknüpfungseigenschaften auf OK, um den Dialog
Datenbankverknüpfung hinzufügen aufzurufen. Geben Sie in dem Eingabefeld
Name den Begriff Prozessdaten ein, und klicken Sie OK. Erneut wird der Dialog
Datenbankverknüpfung aufgerufen, der die neu definierte Verknüpfung
Prozessdaten aufführt. Wählen Sie diese Verknüpfung, und klicken Sie OK. Das
STATISTICA Query-Fenster erscheint nun im Vordergrund, das im Fenster auf der
linken Seite alle Datenbank-Tabellen in einer Baumansicht anzeigt:
62 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Führen Sie auf der RAWMAT-Tabelle einen Rechtsklick aus, und wählen Sie im
Kontextmenü den Befehl Hinzufügen, so dass die Tabelle im Grafik-Teilfenster (auf
der rechten oberen Seite des STATISTICA Query-Fensters) dargestellt wird. Fügen
Sie anschließend auf gleicher Weise die Tabelle PERSONNEL in das GrafikTeilfenster hinzu.
STATISTICA-Handbuch – 63
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Um die Felder auszuwählen, die die Abfrage umfassen soll, führen Sie im GrafikFenster auf der Tabelle PERSONNEL einen Rechtsklick aus, und wählen in dem
aufgerufenen Kontextmenü den Befehl Alle Felder auswählen aus. Wiederholen Sie
anschließend den Vorgang für die Tabelle RAWMAT. Beachten Sie, dass beide
Tabellen ein Feld ID beinhalten, durch das die Tabellen verknüpft werden können.
Um die Tabellen zu verknüpfen, wählen Sie ID in der Tabelle RAWMAT, und
ziehen dieses Feld bei gedrückter Maustaste auf das Feld ID der Tabelle
PERSONNEL. Wählen Sie nun in dem Fenster auf der unteren rechten Seite, das
Register Vorschau Daten, um eine Vorschau der Abfrage zu erhalten:
Wählen Sie das Register SQL-Ausdruck, so dass der SQL-Ausdruck dargestellt
wird, der durch die Abfrage erzeugt wird.
Um die Daten an eine STATISTICA-Tabelle zurückzugeben, muss der grüne Pfeil
geklickt werden, der sich in der Symbolleiste von STATISTICA Query befindet. Der
Dialog Externe Daten an eine Tabelle übergeben wird aufgerufen, in dem festgelegt
werden kann, ob die Abfrage in die aktuelle oder in einer neuen Tabelle platziert
werden soll. Darüber hinaus können weitere Abfrageparameter angepasst werden.
Wählen Sie die Option Neue Tabelle, und klicken Sie die Schaltfläche Start, um die
Abfrage auszuführen. Nach einer kurzen Bearbeitungszeit werden die Daten an die
STATISTICA-Tabelle übergeben.
64 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Die Daten können nun mit jedem beliebigen STATISTICA-Tool analysiert werden.
Beachten Sie, dass die Tabelle die Datenbankverbindung beibehält, d. h., dass die
Abfrage zu jedem beliebigen Zeitpunkt erneut ausgeführt werden kann, indem aus
dem Untermenü Datei - Externe Daten der Befehl Daten aktualisieren gewählt wird
bzw. die Taste F5 gedrückt wird, während die Tabelle geöffnet ist.
Bei der Bearbeitung einer Datenanalyse oder eines Data-Mining-Projektes wird in
der Praxis die meiste Zeit auf die Aufbereitung der Daten aufgewendet. In einigen
Fällen kann bis zu 90 % der Zeit, die zur Vervollständigung eines Projektes
erforderlich ist, der ordentlichen Bereinigung und Aufbereitung der Daten
zugerechnet werden.
STATISTICA-Handbuch – 65
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Beim Erstellen von Vorhersagemodellen mittels Data-Mining-Tools oder selbst
beim Berechnen einfacher deskriptiver Statistiken (Mittelwerte,
Häufigkeitsverteilungen) können die Ergebnisse der Analysen zu groben
Fehlschlüssen führen, wenn die Daten beispielsweise eine große Anzahl von
Dubletten (beispielsweise wenn gleiche Teilnummern mehrmals erfasst wurden),
Ausreißern, fehlerhaft kodierte Werte (außerhalb des gültigen Datenbereichs) oder
Missing Data (fehlende Werte) beinhalten.
In dem Untermenü Daten - Daten filtern/umkodieren bietet STATISTICA
verschiedene Optionen, um diese Probleme der Datenqualität schnell und effektiv
zu beheben, so dass eine aussagekräftige und stichhaltige Datenanalyse (oder DataMining-Projekt) mit erheblicher Zeitersparnis abgeschlossen werden kann.
Diese Option bietet sich dann an, wenn man vermutet, dass die Datendatei
Dubletten enthält (z. B. doppelte/identische Kundenaufzeichnungen).
Angenommen, man möchte bei einer Analyse der Kundendaten, das typische
Kundenverhalten („Profile“) analysieren, wobei jeder einzelne Kunde nur einmal
berücksichtigt werden soll. Einige Kunden sind jedoch umgezogen und
unbeabsichtigt mehrfach in der Datenbank aufgeführt. Um die Datendatei für die
Analyse zu erstellen, bietet es sich in diesem Fall an, die Option Dubletten filtern zu
verwenden, so dass anschließend jede einzelne Transaktion eindeutig einem
Kunden zugeordnet werden kann.
Öffnen Sie die Datendatei Duplicates.sta. Wählen Sie aus
dem Untermenü Daten - Daten filtern/umkodieren die Option Dubletten filtern, um
den Dialog Dubletten filtern aufzurufen. Klicken Sie im Rahmen Eingabe die
Schaltfläche Variablen, und wählen Sie im Dialog zur Variablenauswahl die
Variable Befragte, so dass alle Befragten auf Dubletten hin überprüft werden.
66 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Klicken Sie im Dialog zur Variablenauswahl auf OK, um zum Dialog Dubletten
filtern zurückzukehren.
Klicken Sie im Rahmen Eingabe auf die Schaltfläche Fälle, um den Dialog
Fallauswahlbedingungen für Tabelle aufzurufen, der Optionen enthält, nur
bestimmte Beobachtungen oder Fälle auf Dubletten zu überprüfen. Schließen Sie
den Dialog Fallauswahlbedingungen für Tabelle mittels der Schaltfläche Abbrechen,
da in diesem Beispiel alle Fälle überprüft werden sollen.
In der Standardeinstellung ist das Kontrollkästchen Fallnamen verwenden
deaktiviert, und für dieses Beispiel wird auch diese Einstellung beibehalten. Wenn
das Kontrollkästchen aktiviert wird, werden die Fallnamen als eines der
Unterscheidungskriterien verwendet, d. h., STATISTICA behandelt nur solche Fälle
als Dubletten, die gleiche Fallnamen haben (vorausgesetzt, der Variableninhalt der
Fälle stimmt auch mit denen der anderen spezifizierten Variablen überein). Wenn
das Kontrollkästchen deaktiviert ist, werden Fallnamen ignoriert.
Lassen Sie auch das Kontrollkästchen Sortierte Daten deaktiviert (da diese
Datendatei bisher nicht sortiert wurde – wenn eine extrem große Datendatei
vorliegt, ist es effizienter, die Daten zunächst zu sortieren).
Überprüfen Sie im Rahmen Ausgabe, dass alle Variablen ausgewählt sind (der
Begriff ALLE erscheint in diesem Fall neben der Schaltfläche Variablen). Diese
Option wird dazu verwendet, die Variablen der Eingabetabelle auszuwählen, die in
der gefilterten Ausgabetabelle enthalten sein sollen. Die Standardeinstellung ist
ALLE.
Überprüfen Sie, ob das Kontrollkästchen Neue Tabelle erzeugen ausgewählt ist
(Standardeinstellung), und aktivieren Sie das Kontrollkästchen Tabelle der
Dubletten erzeugen. Belassen Sie die anderen beiden Optionen bei der
Voreinstellung: Das Kontrollkästchen Reihenfolge beibehalten ist deaktiviert (die
STATISTICA-Handbuch – 67
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
neue Tabelle wird anhand der Variable(n) sortiert, die als Unterscheidungskriterium
gewählt wurden; in diesem Beispiel die Variable Befragte) und das
Kontrollkästchen Formate übernehmen ist aktiviert. Klicken Sie die Schaltfläche
OK.
Zwei neue Tabellen werden erzeugt. Eine der Tabellen besteht aus 10V * 51F (10
Variablen mit 51 Fällen) und enthält die Befragten der Originaltabelle, wobei die
Dubletten ausgeschlossen wurden. Die andere Tabelle besteht aus 10V * 9F und
enthält die Dubletten, die aus der Originaltabelle entfernt wurden.
Wenn Sie die Originaltabelle Duplicates.sta betrachten, bemerken Sie, dass einige
der Variablenüberschriften – Befragte, Staat und Farben – unübliche Formate
enthalten. Wenn Sie die beiden neu erstellten Tabellen betrachten, fällt auf, dass die
Variablenüberschriften für Befragte, Staat und Farben in allen drei Tabellen
dieselben Formate haben. STATISTICA verwendet eine Untergliederung, um die
neuen Tabellen zu erstellen, wobei sichergestellt wird, dass die
Variableneigenschaften der vorherigen Tabelle beibehalten werden.
Schließen Sie nun die beiden neuen Tabellen, lassen aber die Tabelle Duplicates.sta
geöffnet (beachten Sie, dass die Tabelle 10V * 60F enthält). Um den Dialog
Dubletten filtern ein weiteres Mal aufzurufen, wählen Sie im Untermenü Daten Daten filtern/umkodieren erneut die Option Dubletten filtern. Klicken Sie im
Rahmen Eingabe die Schaltfläche Variablen, und wählen Sie im aufgerufenen
Dialog zur Variablenauswahl die Variable Befragte und klicken OK. Lassen Sie im
Rahmen Eingabe das Kontrollkästchen Sortierte Daten deaktiviert. Deaktivieren Sie
darüber hinaus das Kontrollkästchen Neue Tabelle erzeugen, das sich im Rahmen
Ausgabe befindet, und bestätigen Sie mit OK. Der Dialog schließt, aber statt des
Erstellens einer neuen Tabelle wird nun direkt die Tabelle Duplicates.sta
modifiziert. Alle Dubletten wurden aus der Tabelle entfernt, die nun 10V * 51F
beinhaltet.
Es ist zu beachten, dass die Funktion Dubletten filtern bei dem Vergleich auf
Eindeutigkeit nicht zwischen Groß- und Kleinschreibung unterscheidet, d. h., wenn
zwei Befragte vorliegen – C. Barrett und C. BARRETT – wird letzterer
ausgeschlossen.
Es ist nicht unüblich, dass einige Variablen (Parameter oder Datenfelder), die
(beispielsweise) für Vorhersagemodelle verwendet werden, nur sehr wenige gültige
68 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Daten enthalten. Man nehme zum Beispiel an, dass in einer Kundendatenbank, die
Variable Einkommen aufgezeichnet wird, wobei diese Daten direkt von den Kunden
angegeben werden. Üblicherweise werden nur sehr wenige Kunden bereit sein, ihr
derzeitiges Einkommen anzugeben, so dass die meisten dieser Daten (in diesem
Feld der Datenbank) fehlen. Bei Produktionsdaten kann ein Datenfeld aufgeführt
sein, das dazu dient, einen bestimmten Parameter aufzuzeichnen, wobei der
zugehörige Sensor jedoch für einen längeren Zeitraum fehlerhaft arbeitet, so dass
dies zu größtenteils fehlenden (ungültigen) Daten führt.
Das Aufnehmen einer solch „unvollständigen“ Variablen in einer Analyse mag zu
fehlerhaften Ergebnissen führen. Darüber hinaus können solche Variablen
hinderlich sein, überhaupt ein Vorhersagemodell zu erstellen (abhängig davon, wie
Missing Data in der späteren Analyse behandelt werden). Demnach erscheint es
zweckdienlich, solche unvollständigen Variablen mithilfe der Option
Unvollständige Daten filtern (aufrufbar über Untermenü Daten - Daten
filtern/umkodieren) rechtzeitig zu erkennen, um sie von den nachfolgenden
Betrachtungen auszuschließen.
Ein ähnlicher Fall (verglichen mit unvollständigen Daten), der speziell bei
Prozessdaten der verarbeitenden Industrie häufig die Datenqualität beeinträchtigt,
STATISTICA-Handbuch – 69
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
liegt dann vor, wenn einige der aufgezeichneten Variablen (Parameter), die in die
Analysen aufgenommen werden sollen, invariant sind, d. h., dass nahezu alle Werte
identisch sind.
Solche Variablen sind für die Modellbildung nicht nützlich, und die Optionen unter
Invariante Variablen filtern (aufrufbar im Untermenü Daten - Daten
filtern/umkodieren) ermöglichen, diese Variablen automatisch zu erkennen, so dass
sie von den weiteren Analysen ausgeschlossen werden können.
Extreme Datenwerte oder Ausreißer können verschiedenste Analysen stark
beeinflussen und führen beim Data Mining zu Vorhersagemodellen geringer
Qualität. Es gibt keine formale Definition, die einen „Ausreißer“ oder „extremen
Wert“ festlegt, so dass STATISTICAs Grafikwerkzeuge den bevorzugten Ansatz
darstellen, solche unüblichen Beobachtungen zu identifizieren (z. B. könnten für die
wichtigsten Variablen Box-Plots erstellt werden, um extreme Beobachtungen zu
identifizieren, die dann mittels der Brushing-Funktion näher untersucht werden und
in den Daten gekennzeichnet werden).
70 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Für das automatische Erkennen und Entfernen von Ausreißern in Variablenlisten
stellen die Optionen unter Ausreißer umkodieren (aufrufbar aus dem Untermenü
Daten - Daten filtern/umkodieren) verschiedene Tests für Ausreißer (und Ansätze
zum Erkennen von extremen Werten) zur Verfügung.
Ausreißer können zu Missing Data aber auch auf gültige Datenwerte (z. B. auf das
entsprechende Perzentil) umkodiert werden.
Mit Missing Data oder ungültigen Datenwerten sollte man so umgehen, dass es mit
den Zielen der Analyse vereinbar ist. In einigen Fällen stellen fehlende oder
ungültige Werte an sich eine nützliche Information dar, die den Prozess oder zu
untersuchende Variable näher charakterisieren. Zum Beispiel kommt es in der
Marktforschung üblicherweise vor, dass die Befragten es verweigern, detaillierte
persönliche Informationen bezüglich ihrer Gesundheit, finanzieller Angelegenheiten
(z. B. Ersparnisse) usw. anzugeben, so dass die verweigerte Antwort an sich mit
anderen signifikanten Variablen korreliert sein kann. (Z. B. kann das Verweigern
der Antwort bezüglich des Einkommens an sich ein guter Indikator eines hohen
Einkommens sein, wenn in der Umfrage die wohlhabenderen Befragten dazu
tendierten, diese Fragen nicht zu beantworten.)
STATISTICA-Handbuch – 71
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Die Optionen unter Missing Data bearbeiten (aufrufbar aus dem Untermenü Daten Daten filtern/umkodieren) ermöglichen das flexible Umkodieren von Missing Data,
die Definition mehrerer Missing-Data-Werte bzw. -Codes für einzelne Variablen
(diese Werte können dann zu einem einheitlichen Missing-Data-Code der Variablen
umkodiert werden) oder die Kennzeichnung von Variablen, die einen bestimmten
Prozentsatz an Missing Data überschreiten.
Es ist häufig unklar, wie ein fehlender Wert am besten umkodiert werden soll.
Tatsächlich kann es manchmal auftreten, dass durch das Umkodieren von Missing
Data einer Variablen auf einen bestimmten Wert (z. B. der Mittelwert) in den
abschließenden Ergebnissen Verzerrungen auftreten. Man betrachte beispielsweise
wiederum einen Fragebogen, in dem tendenziell die Befragten mit höherem
Einkommen es verweigern, ihr Einkommen anzugeben. In diesem Fall kann das
Zuordnen des mittleren Einkommens zu diesen Befragten (d. h., dass das Missing
Data für Variable Einkommen auf das mittlere Einkommen der gesamten Stichprobe
umkodiert wird) zu sehr irreführenden Ergebnissen führen.
STATISTICA beinhaltet eine sehr effiziente Methode (auch auf sehr große
Datensätze und Datenbanken anwendbar) für das Ersetzen von Missing Data mit
gültigen Datenwerten, die konsistent mit den anderen Beobachtungen der
72 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Stichprobe sind. Details zum k-nearest neighbor-Algorithmus befinden sich in der
Elektronischen Hilfe für das Modul Machine Learning des STATISTICA Data
Miner.
Es lässt sich zusammenfassend sagen, dass das Verwenden der Optionen unter MD
ersetzen (KNN) (aufrufbar unter Daten - Daten filtern/umkodieren) dazu führt, dass der
k-nearest neighbor-Algorithmus in einem ersten Durchlauf der Daten eine (kleinere)
Stichprobe aller verfügbaren Daten wählt. Im zweiten Durchlauf der Datendatei
werden beim Auftreten von Missing Data dort gültige (beobachtete) Werte eingesetzt,
die in der kleineren Stichprobe bei ähnlichen Beobachtungen (mit Bezug auf alle
anderen Variablen, die gewählt wurden) gefunden wurden. Bezogen auf das obige
Beispiel folgt hieraus: Wenn tatsächlich die Befragten höheren Einkommens ihr
Einkommen mit einer geringeren Wahrscheinlichkeit angeben, aber bezüglich
anderer Indikatoren hohen Einkommens Angaben liefern (z. B. der Besitz eines
Luxuswagens, größere Wohnfläche usw.), dann wird der k-nearest neighborAlgorithmus diese Befragten (die ihr Einkommen nicht angegeben haben)
richtigerweise der hohen Einkommensschicht zuordnen.
Der k-nearest neighbor-Algorithmus ist schnell und effizient und bietet eine
effektive Methode zum Ersetzen von Missing Data in der Eingabedatei mit
„vernünftigen Vermutungen“, die auf ähnlichen Datenpunkten in der Stichprobe
basieren. Dieser Ansatz macht keine bestimmten Annahmen über den
Zusammenhang zwischen den Variablen (d. h., dass für die einzelnen Variablen
kein Modell geschätzt werden muss, um die Missing-Data-Werte zu ersetzen),
sondern verwendet einfach die beobachteten Daten als das „Modell“.
STATISTICA-Handbuch – 73
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Für STATISTICA-Tabellen können neue Variablen in Abhängigkeit anderer
Variablen definiert werden, was gelegentlich auch als Variablentransformation
bezeichnet wird. Mittels sogenannter Tabellenformeln kann die Prüfung,
Transformation und Umkodierung der Daten einer einzelnen Variablen realisiert
werden (ein Satz aufeinanderfolgender Transformationsformeln wird hingegen als
Batch-Formel bezeichnet).
Um auf die Tabellenformeln zuzugreifen, doppelklicken Sie auf den Variablenkopf
in einer STATISTICA-Tabelle, so dass der Dialog der Variablenspezifikation
aufgerufen wird. Die Formel wird in dem Feld Langer Name (Label oder Formel mit
Funktionen) (auch Formel-Editor genannt) eingegeben, das sich am unteren Rand
des Dialogs befindet. Beginnt die Eingabe in dem Formel-Editor mit einem
Gleichheitszeichen, interpretiert STATISTICA dies als eine Formel, und überprüft
den Inhalt auf formale Korrektheit.
Innerhalb der Formel kann auf andere Variablen entweder mittels des Namens (z. B.
MESSUNG01 oder ZEIT) oder mittels der Variablennummer verwiesen werden. Im
letzteren Fall wird hierbei der Ausdruck Vx verwendet, wobei x die
Variablennummer darstellt. Zum Beispiel verweist V3 auf die Variablennummer 3.
V0 hat eine besondere Bedeutung und verweist auf die aktuelle Fallnummer.
Tabellenformeln werden fallweise (zeilenweise) ausgewertet. Die Formel wird für
jeden einzelnen Fall in der Tabelle ausgewertet, wobei die Verweise auf andere
Variablen dann mit dem entsprechenden Variablenwert des aktuellen Falls ersetzt
werden.
In STATISTICA ermöglichen Tabellenfunktionen mit Random Access, dass auf
Variablenwerte von anderen Fällen zugegriffen werden kann. Ein Standardbeispiel
hierfür ist die Lag-Funktion, die bezüglich einer Variablen Lags einfügt, d. h. eine
bestimmte Anzahl von Fällen vor- oder zurückspringt.
Die folgende Tabelle führt einige Tabellenformeln und ihre Ergebnisse auf.
74 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Formel
=mean(v1:v3)
=(v0<=10)*1+(v0>10)*2
=((v1=1) AND (v2=5))*5
=student(v4;15)
=iif(V0<= 1; V3; V3+LAG(VCUR; 1))
=contains(v1, "B12C")
Ergebnis
Berechnet jeweils den Mittelwert der
ersten drei Variablen.
Kodiert Fälle 1-10 auf den Wert 1 um.
Die anderen Fälle werden auf den Wert
2 gesetzt.
Ergibt den Wert von 5 wenn v1=1 und
v2=5, andernfalls den Wert 0.
Diese Formel berechnet Werte der
Wahrscheinlichkeitsdichte der
Studentschen t-Verteilung, basierend
auf den Werten von v4 mit 15
Freiheitsgraden.
Bildet die kumulative Summe von
Variable 3.
Liefert 1 (bzw. Zeichenposition), wenn
der Text „B12C“ in Variable 1
gefunden wird. Ergibt 0, wenn kein
Treffer gefunden wird.
Beachten Sie, dass im Dialog zur Variablenspezifikation die Schaltfläche
geklickt werden kann, so dass der Dialog Funktions-Browser aufgerufen wird, der
alle verfügbaren Funktionen und Operatoren (=, +, >, and, or…) aufführt.
Öffnen Sie die Datendatei Adstudy.sta. Es soll eine neue Variable erstellt werden,
die den Mittelwert der Variablen 3 bis 25 darstellt (d. h., MESSUNG01 bis
MESSUNG23).
Doppelklicken Sie hierzu auf den ersten leeren Variablenkopf (direkt nach Variable
25). Der Dialog Fälle und/oder Variablen einfügen wird aufgerufen. Klicken Sie die
Schalfläche OK, um die Standardeinstellung zu bestätigen und eine Variable
hinzufügen.
Hierdurch wird der Dialog zur Variablenspezifikation aufgerufen. Wählen Sie im
Rahmen Anzeigeformat die Option Zahl. Geben Sie in dem Eingabefeld Langer
Name folgende Formel ein:
STATISTICA-Handbuch – 75
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
=mean(v3:v25)
Klicken Sie die Schaltfläche OK. Ein Dialog wird aufgerufen, der darüber
informiert, ob die Syntax der Formel korrekt ist. Klicken Sie die Schaltfläche Ja,
um fortzufahren. Die neue Variable wird nun für jeden einzelnen Fall mit dem über
die Variablen 3 bis 25 gebildeten Mittelwert gefüllt.
Da man auf die Variablen mit ihren Namen oder Nummern verweisen kann, kann
die eben erstellte Formel auch wie folgt ausgedrückt werden:
=mean(MESSUNG01:MESSUNG23)
Tabellenformeln sind nützlich, wenn die Formeln jeweils für eine einzelne Variable
definiert werden sollen. Es gibt jedoch viele Situationen, bei denen das gleichzeitige
Auswerten von mehreren Formeln für verschiedene Variablen erforderlich ist.
Innerhalb von STATISTICA kann dies mit Batch-Formeln realisiert werden.
Öffnen Sie die Datendatei Characteristics.sta. Diese Datendatei enthält
Informationen über die Patienten in einer Studie. In diesem Beispiel wird 1.) der
Body-Mass-Index (BMI) der Patienten berechnet und 2.) die Körpergröße zu
Zentimeter (cm) konvertiert, und anschließend werden diese beiden Variablen dem
Datensatz hinzugefügt.
76 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Wählen Sie im Menü Daten die Option Formeln für Batch mit Transformationen, um
den Dialog Batch Formeltransformationen aufzurufen.
Bezüglich der Syntax von Batch-Formeltransformationen und Tabellenformeln
liegen die Unterschiede darin, dass in der Batch-Option auch mehrere Formeln
unterstützt werden und dass die Batch-Formeln nicht einer bestimmten Variablen
angehängt werden (sie können ohne weiteres von einer zur nächsten Datendatei
kopiert werden). Zudem beginnen die Ausdrücke nicht mit einem
Gleichheitszeichen, sondern mit der Zielvariablen (z. B. v1=... oder Messung03=...),
so dass STATISTICA erkennt, auf welche Variablen die einzelnen Formeln
angewendet werden sollen. Darüber hinaus gibt es die Option, die Batch-Formeln
den entsprechenden Variablen in der Tabelle zuzuweisen und mit der Datendatei
abzuspeichern, womit gegebenenfalls vorhandene Tabellenformeln ersetzt werden.
Es folgen die Berechnungen für den BMI und die Umrechnung der Variable
Größe (in) von Zoll (Inch) in Zentimeter. Die notwendigen Formeln, die in dem
Dialog Batch Formeltransformation eingegeben werden, lauten:
Berechnung
Eingabe unter Batch-Transformation
BMI 
Gewicht (lb )
* 703
Größe(in ) 2
Größe(cm)  Größe(in) * 2,54
BMI = ('Gewicht (lb)' / 'Größe (in)' **2)*703
'Größe (cm)' = 'Größe (in)' *2,54
Geben Sie im Feld Formeln die Liste der Formeln für die Transformationen an, die
auf die aktive Datentabelle angewendet werden sollen. Trennen Sie die einzelnen
Formeln mittels der Eingabetaste.
STATISTICA-Handbuch – 77
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Klicken Sie im Dialog Batch Formeltransformationen die Schaltfläche OK.
Hierdurch wird der Dialog Neue Variablen hinzufügen? aufgerufen. Klicken Sie die
Schaltfläche Ja, um die beiden neuen Variablen der Datendatei Characteristics.sta
hinzuzufügen.
Ein Dialog wird aufgerufen, der darüber informiert, ob die Ausdrücke, die in dem
Dialog Batch Formeltransformationen eingegeben wurden, bezüglich der Syntax
korrekt sind. Ist dies der Fall, können Sie mit Schaltfläche Ja fortfahren.
STATISTICA berechnet die Formeln und fügt der Tabelle zwei neue Spalten mit den
zwei Variablen BMI und Größe (cm) hinzu.
Die Optionen im Dialog Batch Formeltransformationen sind speziell für die
Transformation großer Datensätze geeignet und optimiert. Die Formeln werden
78 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
hierbei eine nach der anderen, d. h. sequentiell, ausgewertet, so dass beliebige
Ergebnisse von einer der aufgeführten Transformationen als Eingabe einer
nachfolgenden Transformation dienen können. Es ist demnach möglich, mit einer
Formel eine neue Variable zu erstellen, die direkt in einer nachfolgenden Formel
verwendet werden kann.
Klicken Sie in der oberen rechten Ecke des Dialogs Batch Formeltransformationen
die Schaltfläche , um das entsprechende Thema in der STATISTICA Hilfe
aufzurufen, das diese Optionen näher beschreibt. Darüber hinaus wird hier auf
verschiedene andere Themen verwiesen, die Beispiele von Formeln und SyntaxRegeln enthalten.
In STATISTICA wird eine Zusammenfassung von Grafiken und Berichten in ein
einzelnes (Grafik-)Dokument von verschiedenen Analysen unterstützt. Dies ist
besonders im Bereich Six Sigma und in der industriellen Fertigung ein beliebtes
Instrument, um die Qualität einer einzelnen Variable mit sechs (oder weniger)
Einzelgrafiken und -tabellen zusammenfassen.
STATISTICA beinhaltet viele solcher Darstellungen (siehe diese und folgende
Abbildung), um die grundlegenden deskriptiven Statistiken, Korrelationen,
Ergebnisse von Studien zur Messmittel- oder Prozessfähigkeit oder andere Arten
der Datenanalyse zusammenzufassen.
STATISTICA-Handbuch – 79
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
In den letzten Jahren haben europäische (und andere internationale) Hersteller
Standards für die Berechnung von Prozessfähigkeitsindizes entwickelt, die explizit
der systematischen und zufälligen Prozessstreuung im Zeitablauf sowie NichtNormalverteilungen Rechnung tragen. Diese Indizes wurden unter anderem in der
Automobilindustrie und von deren Zulieferern übernommen. STATISTICA
unterstützt diese Standards vollständig.
Prozessfähigkeitsindizes messen den Anteil der beobachteten (Normal-)Verteilung,
der innerhalb der Spezifikationsgrenzen des betrachteten Teils liegt. Diese Indizes
können demnach die Qualität eines Prozesses zusammenfassen, der zur Herstellung
von Produkten oder Teilen dient, die konsistent mit Entwurfsspezifikationen sein
müssen. Kurz gesagt beschreiben DIN (Deutsche Industrie Norm) 55319 und ISO
(International Organization for Standardization) 21747 die anzuwendenden
Regeln, wenn zwischen verschiedenen Verteilungsmodellen gewählt wird und wie
man einer zeitabhängigen Streuung des Prozesses Rechnung trägt.
Beispiel: Selbst dann, wenn die Verteilungen von Datenpunkten innerhalb der
einzelnen Stichproben jeweils einer Normalverteilung folgen, verursacht eine
80 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
systematische oder zufällige Streuung, die bei der Entnahme der
aufeinanderfolgenden Stichproben im Zeitablauf auftritt, dass die resultierende
Verteilung der Werte nicht mehr einer Normalverteilung folgt. Es gibt demnach
viele Fälle, in denen auf einer Normalverteilung basierende Berechnungen der
Prozessfähigkeit nicht anwendbar sind. Darüber hinaus ist es von Interesse, jegliche
zeitabhängige Streuung oder Trends zu erkennen, da sie auf Maschinenverschleiß
oder andere Prozessprobleme hinweisen können.
Das folgende Beispiel illustriert Schritt-für-Schritt, wie Prozessfähigkeitsindizes
nach diesen internationalen Standards berechnet werden und wie eine effiziente
Ergebnisübersicht in einem einzelnen Dokument erstellt werden kann.
Der diesem Beispiel zugrundeliegende Datensatz ist in
Montgomery (1985, Seite 177, 1991, Seite 234) aufgeführt. Es wird die Datendatei
Pistons.sta verwendet, die sich im Ordner der Beispieldateien befindet. Hierbei ist
speziell die Überwachung der Größe (Durchmesser) der Kolbenringe für
Fahrzeugmotoren von Interesse. Daher wurden mehrere Stichproben mit jeweils
fünf Beobachtungen dem fortlaufenden Herstellungsprozess entnommen. Wie es bei
vielen laufenden Herstellungsprozessen der Fall ist, erfolgt die
Stichprobenentnahme im Zeitablauf, so dass eine Streuung der Prozessqualität im
Zeitablauf die Gesamtstreuung beeinflusst.
Wählen Sie im Menü Datei den Befehl Beispieldatei öffnen (um direkt den
Dateiordner mit den Beispieldateien zu öffnen), anschließend den Ordner Datasets,
und doppelklicken Sie auf Pistons.sta (bzw. wählen Sie die Datei und klicken Sie
die Schaltfläche Öffnen).
Wählen Sie im Untermenü Statistik - Industrielle
Statistiken & Six Sigma die Option Prozessanalyse. Wählen Sie anschließend im
Dialog Verfahren der Prozessanalyse die Option Prozessfähigkeit ISO/DIN
(Verteilungszeitmodelle).
STATISTICA-Handbuch – 81
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Bestätigen Sie dann im Dialog Verfahren der Prozessanalyse die Auswahl mittels
der Schaltfläche OK. Klicken Sie im Register Standard des Dialogs ISO 21747 Einstellungen Prozessfähigkeit die Schaltfläche Variablen. Wählen Sie im Dialog
Variablen auswählen (Gruppierungsvariable optional) die Variable Größe als die
Variable für die Analyse und Stichprobe als Zeit/Gruppierungsvar. und bestätigen Sie
mit OK.
Klicken Sie im Dialog ISO 21747 - Einstellungen Prozessfähigkeit die Schaltfläche
Toleranzen, um den Dialog Toleranzen eingeben/ändern aufzurufen, wo die
entsprechenden Grenzwerte festgelegt werden können. Die Grenzwerte definieren
den maximal und (oder) minimal zulässigen Wert des entsprechenden Teils. Legen
Sie in diesem Fall den unteren und oberen Grenzwert (UGW, OGW) mit 74 +/- 0,05
(UGW=73,95; OGW=74,05) fest. Geben Sie hierzu im Feld Sollwert den Wert 74
und im Feld Delta den Wert 0,05 ein.
82 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Klicken Sie OK, um die Eingaben zu bestätigen.
In diesem Dialog stehen zahlreiche weitere Optionen zur Verfügung, um die Regeln
zu modifizieren, die dazu verwendet werden, für die Daten die angemessensten
Verteilungen und Verteilungszeitmodelle zu bestimmen, so dass die passenden
Prozessfähigkeitsindizes berechnet werden können. Sie können in der oberen
rechten Ecke des Dialogs die Schaltfläche
klicken oder F1 drücken, um das
entsprechende Thema der STATISTICA Hilfe aufzurufen, das zu allen Optionen in
diesem Dialog genaue Angaben enthält. Beispielsweise Details bezüglich der
(kleinen) Unterschiede zwischen DIN und ISO, die hier diskutiert werden.
Klicken Sie nun im Dialog ISO 21747 - Einstellungen Prozessfähigkeit die
Schaltfläche OK, um die Analysen für die Variable Größe durchzuführen.
Klicken Sie im Dialog ISO 21747 - Ergebnisse
die Schaltfläche Zusammenfassung, um die Ergebnisübersicht der
Analyse zu betrachten.
Prozessfähigkeit
STATISTICA-Handbuch – 83
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Wie ersichtlich sind alle relevanten Details (nach ISO 21747 und/oder DIN 55319)
auf einer einzelnen Seite zusammengefasst, die für die Beurteilung notwendig sind,
ob der Prozess als fähig oder nicht fähig (oder fragwürdig) eingestuft werden soll.
Als weiteres Beispiel für diese Art der Ergebniszusammenfassungen in
STATISTICA wird eine attributive Messsystemanalyse durchgeführt.
Im Allgemeinen muss jedes Messsystem, das in der Fertigung verwendet wird,
validiert werden, um sicherzustellen, dass die entsprechenden Messmittel die zu
betrachtenden Qualitätsmerkmale mit hinreichender Genauigkeit und Präzision
messen. Es liegt häufig der Fall vor, dass ein Messmittel von besonderer Bedeutung
vorhanden ist, das bestimmt, ob ein gefertigtes Teil von hinreichender Qualität ist.
Anders ausgedrückt, misst dieses Messmittel einfach das Attribut
Annahme/Ablehnung.
Um die Qualität eines Messmittels zu bestimmen, wird wiederholt eine Studie
durchgeführt, wobei das Messmittel (Annahme/Ablehnung-Entscheidung) auf
Referenzteile mit bekannten Abweichungen von den Sollwerten angewendet wird.
Dieser Vorgang wird in dem entsprechenden Abschnitt der STATISTICA Hilfe
sowie dem AIAG (Automotive Industry Action Group) Measurement System
Analysis (MSA) Manual (2000) beschrieben.
Das folgende Beispiel illustriert die Analyse, die im MSA-Manual auf den Seiten
81-86 beschrieben ist.
Wählen Sie im Menü Datei den Befehl Beispieldatei
öffnen (um direkt den Dateiordner mit den Beispieldateien zu öffnen), anschließend
den Ordner Datasets, und doppelklicken Sie auf AttributeGageStudy.sta (bzw.
wählen Sie die Datei und klicken Sie die Schaltfläche Öffnen). Diese Datei enthält
die Daten, mit bereits zusammengefassten Annahme-Daten, der attributiven
Messsystemanalyse, die im MSA-Manual (S. 84) beschrieben ist.
Wählen Sie im Untermenü Statistik - Industrielle
Statistiken & Six Sigma die Option Prozessanalyse. Wählen Sie anschließend im
Dialog Verfahren der Prozessanalyse die Option Attributive Messsystemanalyse
(analytische Methode), und klicken Sie die Schaltfläche OK. Klicken Sie im
folgenden Dialog Attributive Messsystemanalyse (analytische Methode) auf die
Schaltfläche Variablen. Wählen Sie in der Liste Teilenummern die Variable Teile, in
der Liste Referenzwerte die Variable Referenz und in der Liste Annahme/Antwort
84 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
die Variable Annahme. Klicken Sie anschließend die Schaltfläche OK, um diesen
Dialog zu schließen und um zum Dialog Attributive Messsystemanalyse
(analytische Methode) zurückzukehren. Legen Sie im Rahmen Toleranzen für
Berechnung die Untere Grenze auf den Wert -0,01 fest. Aktivieren Sie das
Kontrollkästchen Andere Grenze anzeigen, und spezifizieren Sie diese Grenze mit
dem Wert 0,01.
In diesem Beispiel sind wir daran interessiert, die Messmittel-Leistung eines
Prozesses zu beurteilen, wobei ein gefertigtes Teil als nicht akzeptabel (es sollte
abgelehnt werden) gilt, wenn der wahre Wert unterhalb der unteren Grenze von
-0,01 fällt (ausgedrückt als Abweichung vom Sollwert). Von insgesamt jeweils 20
Referenzteilen und Messungen werden in der Datendatei in der Spalte Annahme die
Anzahl derjenigen Referenzteil-Messungen zusammengefasst, die als nicht
akzeptabel gewertet wurden (d. h., dass sie abgelehnt wurden).
Klicken Sie nun im Dialog Attributive Messsystemanalyse
(analytische Methode) auf die Schaltfläche OK, und klicken Sie im anschließenden
Dialog Ergebnisse auf die Schaltfläche Zusammenfassung, um die
Ergebnisübersicht zu betrachten.
STATISTICA-Handbuch – 85
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Alle wichtigen Ergebnisse, um den Bias oder die Wiederholbarkeit (der
Messungen) des attributiven Messsystems zu bestimmen, sind auf einer einzigen
Seite zusammengefasst. Für Details bezüglich der Interpretation der aufgeführten
Statistiken und Grafiken siehe das Elektronische Handbuch.
Ein allgemeiner Trend im Data Mining besteht in der wachsenden Bedeutung von
Lösungen, die statt auf immer ausgefeilteren Analysetools eher auf einfachen
analytischen Prozessen basieren. STATISTICA Data Miner Recipes (SDMR) bietet
eine intuitive grafische Oberfläche, die es auch Neueinsteigern ermöglicht, einen
analytischen Data-Mining-Prozess gemäß eines „Kochrezeptes“ Schritt für Schritt
auszuführen. Mit diesen intuitiven Dialogen lassen sich die verschiedenen DataMining-Aufgaben wie Regressionen und Klassifikationen durchführen. Für
nutzerangepasste Lösungen lassen sich schnell passende Recipes bilden.
Vervollständigte Recipes können als Projektdateien gespeichert werden, mit deren
Hilfe sich schnell Neudaten auswerten lassen.
86 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
SDMR umspannt den gesamten Data-Mining-Prozess – von der Abfrage externer
Datenbanken bis zur abschließenden Anwendung der Lösungen – und beinhaltet im
Allgemeinen die folgenden Schritte.
1. Datenaufnahme – das Identifizieren der Datenquellen
 Verbindungsaufbau zu ODBC- oder OLE-DB-Datenbanken
 Verbindung mit STATISTICA-Datendateien
2. Datenbereinigung und das Entfernen redundanter Prädiktoren
 Flexible und effiziente Methoden der Stichprobenziehung (einfach,
geschichtet, systematisch usw.)
 Weitere flexible Möglichkeiten zum Erkennen und Umkodieren von Missing
Data
 Erkennen von Ausreißern
 Transformieren der Daten vor der Durchführung nachfolgender Schritte
 Erkennen und Entfernen redundanter Prädiktoren
3. Erkennen der wichtigen Prädiktoren aus einer großen Anzahl von Variablen
 Feature Selection von sehr großen Datensätzen (mit mehr als Tausenden von
Variablen)
 Aufspüren wichtiger Interaktionen zwischen den Prädiktoren mittels BaumMethoden
4. Erstellen eines Pools performanter Modelle
 Wirksames Einsetzen einer umfassenden Auswahl innovativer Techniken, die
für das prädiktive Data Mining in SDMR zur Verfügung stehen
 Übergabe rechenintensiver Aufgaben an WebSTATISTICA, so dass der lokale
Rechner für andere Aufgaben zur Verfügung steht
5. Durchführung einer automatischen Modellbewertung, um bezüglich der
Perfomance und Komplexität das optimale Modell zu identifizieren
6. Anwendung des Modells auf Neudaten mittels einer effizienten DeploymentEngine
Das folgende Beispiel zeigt, wie schnell und effizient Data-Mining-Projekte mit
STATISTICA Data Miner Recipes abgeschlossen werden können, selbst dann, wenn
sich die beste Lösung des Prognoseproblems erst nach dem (automatischen)
STATISTICA-Handbuch – 87
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Vergleich von verschiedenen hochentwickelten Data-Mining-Algorithmen
abzeichnet.
In diesem Beispiel wird der Nutzen von STATISTICA Data Miner
Recipes für das Kreditscoring aufgezeigt. Diesem Beispiel liegt die Datendatei
CreditScoring.sta zugrunde, die Beobachtungen von 18 Variablen bezüglich der
letzten 1.000 Kreditkunden enthält. Jeder einzelne Kredit wurde entweder als „gut“
(700 Fälle) oder als „schlecht“ (300 Fälle) bewertet. Im Folgenden soll ein
Kreditscoring-Modell entwickelt werden, mit dem das Kreditrisiko neuer Kunden
beurteilt werden kann. Das Modell soll hierbei auf den Werten einer oder mehrerer
Prädiktorvariablen basieren. Die Datendatei enthält zusätzlich eine Variable, mit
welcher der Datensatz für Modellbewertungen in eine Trainings- und TestStichprobe zerlegt wird.
Gehen Sie wie folgt vor, um SDMR für diese Aufgabe zu verwenden:
Öffnen Sie STATISTICA, und wählen Sie im Data Mining-Menü die Option Data
Miner - Recipes, um den Dialog Data miner recipe aufzurufen. Klicken Sie die
Schaltfläche New, um ein neues Projekt zu erstellen.
88 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Die Übersicht der einzelnen Analyseschritte befindet sich im Register Steps. Die
Übersicht enthält vier Hauptknoten: Data preparation, Data for analysis, Data
redundancy und Target variable.
Jedem Knoten (oder Schritt) wird ein Status zugewiesen,
wobei in Abhängigkeit davon, ob der Schritt optional ist, es bis zu drei
unterschiedliche Statusanzeigen gibt. Jeder Status wird durch ein Symbol dargestellt:
Ein rotes zeigt den Status Warten an, d. h., dass ein Schritt nicht gestartet werden
kann, da ein vorangehender Schritt noch nicht abgeschlossen wurde; ein gelbes
bedeutet Status Bereit, d. h., dass mit diesem Schritt gestartet werden kann, da alle
vorangehenden Schritte abgeschlossen wurden; ein grünes symbolisiert einen
vervollständigten Schritt. Um vom Status zum Status zu gelangen, muss die
Schaltfläche Next Step/Run to completion geklickt werden. Der Statuswechsel wird
nur dann vollzogen, wenn der Schritt erfolgreich vervollständigt wurde.
Klicken Sie im Register Data preparation auf die
Schaltfläche Open/Connect data file, und doppelklicken Sie anschließend auf die
Datendatei CreditScoring.sta (diese Datei befindet sich im Ordner Datasets, der
während der STATISTICA-Installation erstellt wurde). Klicken Sie die Schaltfläche
Select variables, und wählen Sie in dem aufgerufenen Dialog Select variables die
folgenden Variablen:
 Variable 1 (Credit Rating) als Target, categorical,
 Variablen 3, 6 und 14 als Continuous predictors
 Variablen 2, 4-5, 7-13 und 15-18 als Categorical predictors und
 Variable 19 (TrainTest) als Testing sample.
STATISTICA-Handbuch – 89
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Klicken Sie anschließend die Schaltfläche OK.
Wählen Sie im Dialog Data miner recipe das Register Advanced, und aktivieren Sie
das Kontrollkästchen Use sample data. Wählen Sie als Methode der
Stichprobenziehung die Option Stratified random sampling, um sicherzustellen, dass
jede einzelne Klasse der abhängigen Variablen Credit Rating mit ungefähr gleicher
Fallanzahl in den Trainings- und Teststichproben vertreten ist. Klicken Sie
anschließend die Schaltfläche More options, um den Dialog Stratified sampling
aufzurufen. Klicken Sie die Schaltfläche Strata variables, und wählen Sie dort
Credit Rating als Schicht-Variable, und klicken Sie anschließend im Dialog zur
Variablenauswahl sowie Stratified sampling jeweils auf OK.
Um den Schritt Data preparation abzuschließen, klicken Sie die Schaltfläche Next
Step/Run to completion, so dass sichergestellt wird, dass dieser Schritt erfolgreich
vervollständigt wurde (in der Übersicht der Analyseschritte wechselt die
Statusanzeige für Data preparation von auf ).
Nachdem der Schritt Data preparation vervollständigt wurde, wird automatisch der
Schritt Data for analysis aufgerufen. Klicken Sie im Register Data for analysis die
Schaltfläche Select testing sample, und wählen Sie anschließend im Dialog Testing
Sample Specifications die Option Variable. Überprüfen Sie, dass die Kategorie (der
Wert) Train in dem Feld Code for training sample und Test in dem Feld Code for
testing sample angezeigt wird.
Klicken Sie anschließend die Schaltfläche OK. Die Modelle werden unter der
Verwendung der Trainingsstichprobe angepasst und anschließend mittels der
Beobachtungen in der Teststichprobe evaluiert. Durch Verwendung von
Beobachtungen, die nicht in den Berechnungen der Modellanpassung eingeflossen
sind, können die Statistiken der Anpassungsgüte (bzw. Prognosewerte), die für die
90 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
verschiedenen Data-Mining-Modelle (bzw. -Algorithmen) ermittelt wurden, für die
Bewertung der Vorhersagekraft der einzelnen Modelle herangezogen werden. Diese
Berechnungen lassen sich demnach dafür verwenden, die einzelnen Modelle zu
vergleichen und eines oder mehrere Modelle für die weitere Analyse auszuwählen.
Dieser Schritt berechnet auch die deskriptiven
Statistiken für alle in dieser Analyse enthaltenen Variablen. Die deskriptiven
Statistiken der einzelnen Variablen bieten nützliche Informationen bezüglich der
Spannweiten und Verteilungen der Daten, die in diesem Projekt enthalten sind.
Klicken Sie die Schaltfläche Next Step/Run to completion, um sicherzustellen, dass
dieser Schritt erfolgreich vervollständigt wurde.
Als Nächstes wird der Schritt Data redundancy aufgerufen. Der Zweck dieses
Schrittes liegt darin, Prädiktoren auszuschließen, die zu einem hohen Grade
redundant sind. Wären im Datensatz beispielsweise zwei Messungen für die Größe
Gewicht vorhanden, eines in Kilogramm und das andere in Pfund gemessen, wäre
eine dieser Variablen redundant.
Wählen Sie im Register Data redundancy die Option Correlation coefficient, und
legen Sie den Wert für Criterion value auf 0,8 fest, um die redundanten Prädiktoren
auszuschließen, für die eine hohe Korrelation vorliegt (r≥0.8). Da in dem Datensatz
für dieses Beispiel keine Redundanzen vorliegen, führt das Klicken der Schaltfläche
Next Step/Run to completion ohne Warnhinweis zum nächsten Analyseschritt. Die
Datenaufbereitung für die Modellbildung ist nun abgeschlossen.
Als Nächstes wird für die Zielvariable dieses Beispiels ein Prognosemodell erstellt.
In der Übersicht der Analyseschritte weist der Knoten der gewählten Zielvariablen
Verzweigungen zu den vier Unter-Knoten Important variables, Model building,
Evaluation und Deployment auf.
STATISTICA-Handbuch – 91
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Der Knoten Important variables ist automatisch
ausgewählt. In diesem Schritt besteht das Ziel darin, die Dimension des
Prognoseproblems zu reduzieren, d. h., eine Teilmenge von Variablen zu wählen,
die am wahrscheinlichsten mit der Zielvariablen (in diesem Beispiel Credit rating)
im Zusammenhang stehen, so dass sich am ehesten akkurate und sinnvolle
Prognosemodelle ergeben. Diese strategische Herangehensweise wird auch als
Feature Selection bezeichnet.
Hierbei sind zwei Strategien verfügbar. Wenn die Option Fast predictor screening
gewählt ist, führt das Programm bezüglich Tausender von Eingabevariablen ein
Screening durch, so dass diejenigen Variablen herausgesiebt werden, die in einem
starken Zusammenhang mit der zu untersuchenden abhängigen Variablen stehen.
Falls die Option Advanced Screening gewählt ist, werden Baummethoden
angewendet, um wichtige Interaktionen unter den Prädiktoren aufzuspüren.
Wählen Sie in diesem Beispiel die Option Advanced Screening, und klicken Sie auf
die entsprechende Schaltfläche, um den Dialog Advanced Screening aufzurufen.
Geben Sie in dem Feld Number of predictors to extract den Wert 12 ein, und wählen
Sie in dem Feld Prior class probabilities die Option Equal.
92 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Klicken Sie in diesem Dialog OK und anschließend die Schaltfläche Next Step/Run
to completion, um diesen Schritt zu vervollständigen. Um eine Übersicht der
bisherigen Analyse zu betrachten, klicken Sie im Register Steps die Schaltfläche
Report, und wählen Sie in dem Menü den Befehl Summary report, um sich die
Arbeitsmappe Results anzeigen zu lassen.
Diese Prädiktoren werden im Folgenden mittels verschiedener hochmoderner DataMining- und Machine-Learning-Algorithmen, die in SDMR verfügbar sind, genauer
untersucht.
Beim Öffnen der Arbeitsmappe Results wurde der Dialog Data
miner recipe minimiert. Klicken Sie in der Analyseleiste auf die Schaltfläche Data
miner recipe, so dass der Dialog wieder angezeigt wird. Momentan ist der Knoten
Model building ausgewählt. In diesem Schritt können für die gewählten Variablen
eine Reihe von Modellen erstellt werden. Im Register Model building sind die
Optionen C&RT, Boosting tree und Neural network voreingestellt, die als Modelle
oder Algorithmen automatisch an den Daten „versucht“ werden.
Die Berechnungen für die Modellbildung können entweder lokal oder auf dem
WebSTATISTICA Server durchgeführt werden. Die letztere Option ist allerdings nur
dann verfügbar, wenn Sie über ein gültiges WebSTATISTICA Server-Konto
STATISTICA-Handbuch – 93
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
verfügen und eine Verbindung zu der Server-Installation besteht. Klicken Sie in
diesem Beispiel die Schaltfläche Build model, um die Berechnungen lokal auf Ihren
Rechner auszuführen. Dies wird einige Zeit in Anspruch nehmen. Klicken Sie nie
Abschluss der Berechnungen die Schaltfläche Next Step/Run to completion, um
diesen Schritt zu vervollständigen.
Der Knoten Evaluation ist nun
ausgewählt. Klicken Sie im Register Evaluation auf die Schaltfläche Evaluate
models, um eine Modellbewertung durchzuführen, mit der man dasjenige Modell
erhält, das bezüglich der Teststichprobe am besten abschneidet. Man beachte, dass
beim Boosting Trees-Modell die minimale Fehlerrate von 35,94 % vorliegt.
Demnach wurden 64,06 % der Fälle der Teststichprobe durch das Modell korrekt
vorhergesagt. Die Ergebnisse Ihrer Analyse können hiervon leicht abweichen, da
bei diesen hochentwickelten Data-Mining-Methoden das Bilden von Teilmengen
aus den Testdaten randomisiert ist, um zuverlässige Schätzungen der Fehlerraten zu
erhalten.
Klicken Sie im Register Steps auf die Schaltfläche Report, und wählen Sie in dem
Menü den Befehl Summary report, um die Arbeitsmappe Results erneut aufzurufen.
Diese Tabelle zeigt die Performance des besten Modells bezüglich des
Testdatensatzes an. Die Spalten repräsentieren die gemäß des Boosting TreesModells geschätzten Klassenhäufigkeiten, und die Zeilen geben die tatsächlichen
bzw. beobachteten Werte innerhalb der Teststichprobe an. In dieser Matrix ist
ersichtlich, dass dieses Modell 65 von 87 „faulen Krediten“ korrekt vorhergesagt
hat, demnach allerdings 22 von ihnen fehlklassifiziert wurden. Dieses Ergebnis ist
94 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
im Allgemeinen sehr viel informativer als die Gesamt-Fehlklassifikationsrate, die
aussagt, dass die Genauigkeit insgesamt bei 64,06 % liegt.
Rufen Sie erneut den Dialog Data miner recipe auf, und klicken Sie die Schaltfläche
Next Step/Run to completion, um diesen Schritt zu vervollständigen.
Der abschließende Schritt Deployment beinhaltet das Anwenden des besten Modells
auf neue Daten, um die Bonität der Kunden einzuschätzen. In diesem Fall wird das
Boosting Trees-Modell angewendet, das im Vergleich mit den anderen Modellen
bezüglich der Teststichprobe die beste Vorhersagegenauigkeit lieferte. Dieser
Schritt bietet auch die Möglichkeit, die Scoring-Information (die berechnete
Klassifikation oder Klassifikationswahrscheinlichkeit usw.) in die ursprüngliche
Datendatei oder Datenbank zurückzuschreiben. Diese Option ist extrem hilfreich,
wenn die Modelle auf sehr große Datensätze angewendet werden (z. B. bei
Anwendung von Scoring-Verfahren auf große Datenbanken).
Klicken Sie im Register Deployment auf die Schaltfläche Data file for Deployment,
und doppelklicken Sie auf die Datendatei CreditScoring.sta (die Datei befindet sich
im Ordner Datasets, der während der STATISTICA-Installation erstellt wird). Es
wird für Demonstrationszwecke also dieselbe Datendatei für das Deployment des
besten Modells verwendet.
Klicken Sie die Schaltfläche Next Step/Run to completion, um diesen Datensatz
mithilfe des ausgewählten Modells auszuwerten. Die ausgewertete Datei Summary
STATISTICA-Handbuch – 95
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
of Deployment mit den Klassifikationen und Klassifikationswahrscheinlichkeiten
befindet sich wie unten aufgeführt im Ordner Deployment der ProjektArbeitsmappe.
Dieses Beispiel dient dazu, die Effizienz des in STATISTICA Data Miner Recipes
implementierten Arbeitsablaufes aufzuzeigen. Mit nur wenigen Mausklicks wird
man von dem Programm durch den gesamten Analyseprozess geführt – von der
Definition der Eingabedaten und des Analyseproblems über die Datenaufbereitung
und Modellbildung bis zur Auswahl und dem Deployment des bevorzugten
Modells.
Selbst wenn die meisten der komplexen Berechnungen der Data-Mining-Analyse
automatisch in STATISTICA Data Miner Recipes ausgeführt werden, was selbst
Einsteigern auf dem Gebiet des Data Mining ermöglicht, von der Problemstellung
bis zur Lösung schnell voranzuschreiten, wird von dem Programm eine große
Anzahl fortgeschrittener Data-Mining-Algorithmen „angewendet und getestet“, um
automatisch den erfolgreichsten Ansatz zu bestimmen.
Die Methodologie und Benutzeroberfläche von STATISTICA Data Miner Recipes
ermöglicht demnach, eine große Auswahl an Data-Mining-Algorithmen in einem
einzelnen Paket wirksam einzusetzen.
96 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
WebSTATISTICA Server erweitert die Einsatzmöglichkeiten der STATISTICAPlattform, indem mehrere Einzelplatzversionen in ein leistungsstarkes
unternehmensweites Informationssystem umgewandelt werden. Eines der
Hauptmerkmale der Client-Server-Architektur von WebSTATISTICA besteht darin,
dass es den Anwendern ermöglicht, die Ressourcen des Servers für mehrere
womöglich zeitaufwendige oder sich periodisch wiederholende Analysen zu nutzen
(das „Hochladen“ von Aufgaben auf den Server), so dass sich der lokale Rechner
anderen Aufgaben zuwenden kann, die sofortige Beachtung erfordern. Dies kann
entweder mittels eines Webbrowsers (Thin Client) oder der STATISTICADesktopversion (Thick Client, WebSTATISTICA-Client) realisiert werden. Während
es die erstgenannte Option ermöglicht, von nahezu jedem beliebigen Computer auf
den WebSTATISTICA Server zuzugreifen, erfordert die zweitgenannte Option auf
dem entsprechenden Rechner eine STATISTICA-Installation. Die enge Integration
von WebSTATISTICA mit der STATISTICA-Anwendung bietet das gewohnte
Arbeitsumfeld für client- und serverseitige Operationen, eine ansprechende
Benutzeroberfläche mit zusätzlichen Optionen und gegebenenfalls weiteren
Komponenten und Werkzeugen der verwendeten STATISTICA-Desktopversion.
Stellen Sie zunächst sicher, dass die
WebSTATISTICA-Integration aktiviert ist. Wählen Sie im Menü Extras den Befehl
Optionen, um den Dialog Optionen aufzurufen, und wählen Sie dort das Register
Server / Web. Aktivieren Sie das Kontrollkästchen WebSTATISTICA ServerIntegration zulassen. Geben Sie den Netzwerkpfad des WebSTATISTICA Servers an
(und gegebenenfalls die Verbindungseinstellungen, wenn sie von den
Standardeinstellungen abweichen). Fragen Sie Ihren Netzwerk-Administrator nach
diesen Werten. Wählen Sie die Option Integrierte Anmeldung zulassen, falls diese
Option vom Server unterstützt wird und aktiviert wurde. Andernfalls ist es bei der
Anmeldung zum WebSTATISTICA Server notwendig, den Benutzernamen und das
Passwort einzugeben.
STATISTICA-Handbuch – 97
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Klicken Sie auf die Schaltfläche OK, nachdem Sie die Optionen in diesem Register
festgelegt haben.
Das Menü Server wurde nun der STATISTCA-Menüleiste hinzugefügt. Wählen Sie
im Menü Server den Befehl Log In, und geben Sie falls erforderlich Ihren
Benutzernamen und Passwort an. Nach der erfolgreichen Anmeldung werden die
weiteren Menübefehle verfügbar.
Die Menübefehle Open, Save und Save As werden dazu verwendet, eine momentan
geöffnete Datei auf den Server hochzuladen oder eine Datei vom Server
herunterzuladen, so dass sie lokal geöffnet werden kann. In den entsprechenden
98 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Ordnern des Servers oder Clients sind diese Befehle auch in expliziter Form
(Upload File to und Download File from) vorhanden.
Hinweis: In der Praxis sind gewöhnlich gerade die Analysen zeitaufwendig oder
ressourcenintensiv, die auf großen Datensätzen basieren und/oder iterative
Algorithmen beinhalten, die STATISTICA-Komponenten voraussetzen, die nicht in
allen STATISTICA-Konfigurationen vorliegen. Im Folgenden wird bewusst ein
Beispiel verwendet, das nicht viel Zeit in Anspruch nimmt. Aber selbst wenn eine
einzelne Analyse schnell und mit wenig Ressourcen abgehandelt werden kann, ist
es eventuell notwendig, eine komplizierte, zeitaufwendige Sequenz von Tasks
wiederholt durchzuführen, die zu bestimmten Zeitpunkten ausgeführt werden
müssen. In diesem Fall besteht die Möglichkeit, die Ablaufplanung von
WebSTATISTICA zu verwenden, sofern ein benutzerdefiniertes Skript erstellt und
hochgeladen wurde, das die erforderten Tasks beinhaltet (beispielsweise durch
Kombination der Makros, die während einer STATISTICA-Sitzung aufgezeichnet
wurden).
Zeichnen Sie ein Analysemakro auf, beispielsweise auf Basis der einzelnen Schritte
in Beispiel 2: ANOVA (Seite 34).
Nachdem Sie die einzelnen Schritte nachvollzogen haben, klicken Sie im Dialog
ANOVA Ergebnisse auf die Schaltfläche Optionen, und wählen Sie aus der
Auswahlliste den Befehl Erzeuge Makro. Übernehmen Sie in dem Dialog Neues
Makro alle Standardeinstellungen, und bestätigen Sie mit OK. Klicken Sie auf das
Makrofenster, so dass es im Vordergrund steht, und führen Sie das Makro aus.
Überprüfen Sie, ob die korrekten Ergebnisse wiedergegeben werden.
Wählen Sie anschließend im Menü Server den Befehl Offload Task, um den Dialog
Offload a task aufzurufen.
STATISTICA-Handbuch – 99
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
In diesem Dialog muss ein Task (ein Skript oder Data Miner-Projekt) und optional
der zu verwendende Datensatz zum Hochladen ausgewählt werden. Die Auswahl
eines Datensatzes ist nicht zwingend erforderlich, da die Daten in Data MinerProjekten eingebettet sein können, Makros die Datensätze explizit laden oder
überhaupt nicht verwenden.
Da ein Datensatz (Adstudy.sta) und ein STATISTICA-Makro geöffnet sind, ist die
Standardeinstellung im Dialog Offload a task, diese Dateien zum Hochladen zu
verwenden. Stattdessen wird sich in diesem Beispiel der Task auf einen serverseitigen
Datensatz beziehen. Diese Option ist nützlich, da sie die Vorteile des zentralen
serverseitigen Speicherns bedient, das besonders im Falle großer (unter Umständen
dynamisch aktualisierter) Datensätze hilfreich ist, die von mehreren Benutzern
gleichzeitig verwendet werden.
Um das Makro auf einen serverseitigen Datensatz anzuwenden, wählen Sie im
Rahmen Data Source die Option Select data file stored on the server, so dass der
Dialog WebSTATISTICA Repository aufgerufen wird.
Die Verzeichnisstruktur in der Baumansicht des Dialoges stellt das
WebSTATISTICA Server Repository dar (in Abhängigkeit der Zugriffsrechte wird
eventuell eine gekürzte Verzeichnisstruktur wiedergegeben). Klicken Sie im Fenster
auf der linken Seite auf den Ordner Datasets, und wählen Sie im Fenster auf der
rechten Seite die Datei Adstudy.sta (alternativ kann der entsprechende Pfad in dem
Eingabefeld angegeben werden).
Klicken Sie in den Dialogen WebSTATISTICA Repository und Offload a task jeweils
auf OK. STATISTICA übermittelt den Task und lädt gegebenenfalls auch Dateien
hoch. Sie können sich nun anderen Aufgaben widmen, wobei Sie im Server-Menü
100 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
in periodischen Abständen den Status des hochgeladenen Tasks mittels des Befehls
Task Status abfragen können. Hierdurch wird der Dialog Task Status aufgerufen,
der in der folgenden Abbildung dargestellt ist.
Der Status der Taskliste kann durch Klicken der Schaltfläche Refresh manuell
aktualisiert werden. Aktivieren Sie das Kontrollkästchen Automatic, falls eine
automatische Aktualisierung gewünscht ist. Tasks durchlaufen die Stufen Pending
und Running und münden entweder in Completed oder Script Error.
Falls Ihr Task fehlschlägt, können Sie mit einem Doppelklick auf dem
entsprechenden Eintrag zusätzliche Information bezüglich des Fehlers aufrufen.
Wenn der Fehler behoben ist (durch Aktualisieren des SVB-Skripts oder Data
Miner-Projekts), können Sie den fehlgeschlagenen Task auswählen und mittels der
Schaltfläche Resubmit erneut hochladen.
Sofern der Task erfolgreich abgeschlossen wurde, können die Ergebnisse abgerufen
werden. Da sich die Ergebnisse auf dem Server befinden, können Sie von jedem
beliebigen STATISTICA-Client aus aufgerufen werden, sofern man dort mit
gleichen Zugriffsrechten angemeldet ist. Wenn im Rahmen Results die
Kontrollkästchen Task und Data aktiviert werden, kann der Client darüber hinaus
die Task-Datei und Datenquelle (falls verfügbar) abrufen. Wird das
Kontrollkästchen In Browser aktiviert, werden die Ergebnisse im Sinne eines Thin
Clients zunächst im Browser dargestellt. Diese Option ist hilfreich, wenn eine große
Datenmenge an Ergebnissen erwartet wird. Wenn die Analyse beispielsweise viele
Datensätze und Grafiken erzeugt, kann man sich zunächst im Browser einen
Überblick verschaffen, und nur bestimmte Ergebnisse zum Herunterladen auf den
STATISTICA-Handbuch – 101
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Desktop auswählen. Das Aktivieren des Kontrollkästchens Trace report liefert einen
Diagnosebericht der Taskausführung.
Da ein Server nicht entscheiden kann, wie lange die Taskergebnisse verfügbar sein
sollen, steht Ihnen die Option zur Verfügung, die Ergebnisse zu löschen. Um
demnach die Speicherkapazitäten des Servers zu schonen, wird jedes Mal nach
Ergebnisabruf die Meldung aufgerufen, die danach fragt, ob die Ergebnisse nun
vom Server gelöscht werden sollen (es sei denn, dass das Kontrollkästchen Delete
task after retrieval deaktiviert wurde).
Rufen Sie nach Abschluss des Tasks die Ergebnisse ab, und schließen Sie den
Dialog Task Status. Unabhängig davon, ob das Skript lokal oder auf dem Server
ausgeführt wird, sind die Ergebnisse äquivalent.
In regulierten Bereichen haben die gemäß GxP-Richtlinien (GxP – Good
Manufacturing Practices, Good Clinical Practices, Good Laboratory Practices)
durchgeführten Analysen den Verbraucherschutz zu berücksichtigen, wie z. B. im
Rahmen klinischer Tests, der Herstellung und Qualitätssicherung. Wenn ein
Unternehmen Analysen nach GxP-Richtlinien durchführt, empfehlen die
Regulierungsbehörden, dass das Unternehmen nachweisen kann, dass für die
Ergebnisse des validierten Analysesystems (z. B. STATISTICA) die Vorgaben der
102 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Verfahrensdokumentation erfüllt sind. STATISTICA bietet mit den Features Audit
Trail und Datentabelle/Bericht sperren die Werkzeuge an, um diese Regulierungen
zu erfüllen.
Um das Kriterium der Rückverfolgbarkeit gemäß GxP-Richtlinien zu erfüllen, sind
zumindest drei Sachverhalte zu berücksichtigen: 1) die Kontrolle über die
Eingabedaten der Analyse (d. h., dass dokumentiert wird: wer – zu welcher Zeit –
aus welchem Grund – Veränderungen vornahm, sowie das Speichern der alten und
neuen Werte), 2) Kontrolle über die Ergebnistabellen und Grafiken (es muss
sichergestellt sein, dass sie nach Erstellung nicht mehr modifiziert wurden) und 3)
die Rückverfolgbarkeit zwischen der Version der Eingabetabelle und
entsprechender Ergebnisausgabe. STATISTICA stellt diese Informationen mittels der
Funktion Audit Trails und GxP-Berichten bereit.
Weitere Details über die Versionsverwaltung/Historie von STATISTICADokumenten innerhalb des STATISTICA Document Management System sind in der
Elektronischen Hilfe zu finden.
Öffnen Sie eine STATISTICA-Tabelle. Wählen Sie in dem Untermenü Extras - Audit
Trail den Befehl Einstellungen, um den Dialog Einstellungen Audit-Trail aufzurufen.
Aktivieren Sie das Kontrollkästchen Audit-Trail aktivieren, um die Protokollierung
für die aktuelle Tabelle zu starten.
Aktivieren Sie das Kontrollkästchen Bei Änderungen Eingabe des Anwenders für
Grund erzwingen, so dass der Anwender bei Änderungen der Tabelle aufgefordert
wird, diese näher zu erläutern.
Die Schaltfläche Protokoll kürzen ist nur dann verfügbar, wenn Audit-Trail bereits
zuvor aktiviert wurde, so dass der Tabelle ein Protokoll Audit-Trail Daten
hinzugefügt wurde. Das Klicken dieser Schaltfläche kürzt das Protokoll und löscht
damit alle vorhandenen Einträge. Es erfolgt ein Warnhinweis, der zur Bestätigung
STATISTICA-Handbuch – 103
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
dieser Aktion auffordert, bevor alle aktuellen Einträge gelöscht werden. Nach dem
Kürzen des Protokolls erscheint dieses Kürzen als erste Aktion in dem neuen
Protokoll.
Klicken Sie im Dialog Einstellungen Audit-Trail auf OK, um die Protokollierung zu
starten. Hiernach wird direkt der Dialog Grund für Änderung eingeben aufgerufen,
der ein Eingabefeld beinhaltet, in dem der Grund für das Aktivieren des Protokolls
eingegeben werden soll. Geben Sie eine Begründung ein, und klicken Sie
anschließend OK. Führen Sie nun auf dem Variablenkopf der letzten Variablen in
der Tabelle einen Rechtsklick aus, und wählen Sie aus dem Kontextmenü den
Befehl Variablen einfügen. Übernehmen Sie in dem Dialog Variablen hinzufügen
alle Standardeinstellungen, und klicken Sie OK. Der Dialog Grund für Änderung
wird aufgerufen, und es muss zunächst eine Begründung eingegeben und mit OK
bestätigt werden, bevor die Änderung in Kraft tritt. Bei aktiviertem Audit-Trail wird
jede Änderung der Tabelle dokumentiert. Wird darüber hinaus das Kontrollkästchen
Bei Änderungen Eingabe des Anwenders für Grund erzwingen aktiviert, werden
auch die Kommentare der Anwender im Protokoll Audit-Trail Daten gespeichert
und angezeigt.
Wählen Sie im Untermenü Extras - Audit Trail den Befehl Protokoll, um das
Protokoll Audit-Trail Daten aufzurufen.
Die Protokollansicht liefert u. a. Informationen zu: Versionsnummer der Tabelle,
Zeit der Änderung, verwendeten Computer, Anwender, Art der Änderung und
Grund der Änderung. Die Spaltenbreiten des Protokollgitters können mit den
üblichen Windows-Konventionen verändert werden. Die Protokolle sind hierbei in
der entsprechenden Tabelle eingebettet, d. h., sie werden mitsamt der Tabelle als
Einheit abgespeichert.
104 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Eine Tabelle kann verschlüsselt werden, so dass
die Datei nur mittels des korrekten Passwortes geöffnet werden kann. Nur
diejenigen Anwender, die das Passwort kennen, können die Tabelle öffnen. Sofern
eine passwortgeschützte Tabelle geöffnet ist, kann sie bearbeitet werden. Als
Alternative bietet sich das teilweise Sperren der Tabelle an, so dass einige oder auch
alle Elemente der Tabelle mit einem Schreibschutz versehen werden. Die Tabelle
kann von jedem beliebigen Anwender geöffnet werden, die schreibgeschützten
Elemente jedoch nicht verändert werden. Das Sperren und Verschlüsseln einer
Tabelle kann auch gleichzeitig miteinander kombiniert werden.
Öffnen Sie eine STATISTICA-Tabelle. Wählen Sie im Menü Datei den Befehl
Eigenschaften, um den Dialog Dokumenteigenschaften aufzurufen. Wählen Sie dort
das Register Passwort.
Geben Sie in dem Feld Passwort für Dokument ein Passwort ein, und klicken Sie
auf OK. Der Dialog Passwort wird aufgerufen, der dazu auffordert, das Passwort zu
bestätigen. Beachten Sie, dass bei Passwörtern zwischen Groß- und
Kleinschreibung unterschieden wird.
STATISTICA-Handbuch – 105
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Klicken Sie im Dialog Passwort auf OK, und schließen Sie die Datendatei. Ein
Dialog wird aufgerufen, in dem Sie wählen können, ob die Änderungen gespeichert
werden sollen. Bestätigen Sie mit Ja, so dass die Verschlüsselung durchgeführt
wird. Beim nächsten Versuch diese Tabelle zu öffnen, wird der Dialog Passwort
aufgerufen, wobei sich die Tabelle dann nur nach Eingabe des korrekten Passwortes
öffnen lässt.
Um Compliance-Anforderungen zu erfüllen, muss die Verlässlichkeit der
Eingabedaten gewährleistet sein. Mit den Optionen zum Sperren von Datentabellen
können Änderungen jeglicher Tabellenelemente unterbunden werden – vom
Erscheinungsbild der Daten (d. h. Schriftart, Formate, Variableneinstellungen) bis
zu den tatsächlichen Daten und Fallauswahlbedingungen oder Fallgewichten, die
für die Tabelle definiert wurden. Wenn Bedarf besteht, an den Daten Änderungen
vorzunehmen (z. B. bei inkorrekter Dateneingabe), kann mit aktiviertem Audit-Trail
jede einzelne Änderung aufgezeichnet werden.
Beim Mehrbenutzersystem STATISTICA Enterprise können nur Anwender mit
Administrator-Rechten die Audit-Trail-Einstellungen modifizieren. Für weitere
Information siehe die Elektronische Hilfe zu STATISTICA Enterprise.
Wählen Sie im Menü Extras den Befehl Sperren, um den Dialog Datentabelle
sperren aufzurufen.
In diesem Dialog kann festgelegt werden, welche Tabellenelemente gesperrt werden
sollen. Wenn Anwender versuchen, ein gesperrtes Element zu ändern, erscheint
eine Meldung, die über die Sperrung der Tabelle informiert.
Aktivieren Sie das Kontrollkästchen Daten, so dass Änderungen der Daten
unterbunden werden. Anwendern ist es somit nicht mehr möglich, die Datenwerte
oder den Missing-Data-Code zu ändern. Darüber hinaus wird jegliches
106 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Datenmanagement verhindert, das Einfluss auf diese Tabelle hat (z. B. Änderung
von Datentypen oder Länge der Textvariablen). Wenn dieses Kontrollkästchen
deaktiviert ist, haben Anwender die Möglichkeit, die Daten zu bearbeiten (z. B.
durch aktualisierende Abfragen, neue Tabellenformeln oder durch das Eintippen
neuer Werte).
Aktivieren Sie das Kontrollkästchen Anzeige (Schriftart, Formate usw.), um das
Ändern der verwendeten Schriftarten und Formate zu unterbinden. Die
Formatierungsoptionen in der Symbolleiste werden hierdurch deaktiviert.
Zusätzlich wird das Anwenden neuer Tabellenlayouts (erreichbar über Menü
Format - Tabelle) unterbunden.
Aktivieren Sie das Kontrollkästchen Fallauswahl und Gewichte, um das Ändern von
Fallauswahlbedingungen und Fallgewichten zu unterbinden. Anwendern ist es
demnach nicht mehr möglich, das Verwenden von Fallauswahlbedingungen einoder auszuschalten oder die aktuell definierten Auswahlbedingungen anderweitig zu
verändern. Die meisten Optionen im Register Auswahlbedingungen des Dialogs
Tabellen-Auswahlbedingungen werden hierdurch deaktiviert, die Optionen in den
anderen Registern dieses Dialogs (z. B. das Erstellen einer Zufallsauswahl oder
Formatänderungen für ausgewählte Fälle) sind jedoch weiterhin verfügbar. Die
Optionen im Dialog Fallgewichte für Tabelle werden durch diese Sperrung
deaktiviert.
Aktivieren Sie das Kontrollkästchen Variableneinstellungen, um Änderungen der
Variablenspezifikationen (z. B. Messwert-Typ, Missing-Data-Code, Anzeigeformat
und Langer Name) zu unterbinden. Anwendern ist es weiterhin möglich, die
einzelnen Dialoge der Variablenspezifikationen (mittels Doppelklick auf
Variablenkopf) und den Variablenspezifikationen-Editor aufzurufen; die Optionen
zum Ändern der Spezifikationen sind jedoch alle deaktiviert.
Änderungen der Audit-Trail-Einstellungen können durch Aktivierung des
Kontrollkästchens Audit-Trail unterbunden werden. Ohne vorherige Aufhebung
dieser Sperrung ist es Anwendern nicht mehr möglich, diese Einstellungen zu
verändern.
Geben Sie ein Kennwort ein, das zum Sperren oder Entsperren der Tabelle
verwendet werden soll, bestätigen Sie das Kennwort (es wird zwischen Groß- und
Kleinschreibung unterschieden), und klicken Sie OK. Obwohl ein Kennwort nicht
zwingend erforderlich ist, wird die Verwendung eines Kennwortes ausdrücklich
empfohlen. Sofern kein Kennwort eingegeben und bestätigt wird, kann jeder
STATISTICA-Handbuch – 107
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
beliebige Anwender die Tabellenelemente entsperren, indem einfach die aktivierten
Kontrollkästchen deaktiviert werden. Sofern allerdings zuvor Sperrungen und
Kennwort definiert wurden, ist die Eingabe des korrekten Kennworts erforderlich,
um die Einstellungen des Dialogs zu ändern.
Versuchen Sie nun, Änderungen in der Tabelle vorzunehmen. Eine Meldung wird
aufgerufen, die darauf hinweist, dass die Operation wegen der Sperrung der Tabelle
nicht ausgeführt werden kann.
Um den Compliance-Anforderungen zu entsprechen, muss sichergestellt sein, dass
die Berichtsergebnisse sicher verwaltet werden. STATISTICA bietet hierbei die
notwendigen Optionen für das Erstellen von GxP-Berichten. Im GxP-Modus
werden alle Ergebnisse an gesperrte Berichtsfenster gesendet, d. h., dass alle
Optionen zum manuellen Entfernen (Ausschneiden, Extrahieren - Original, Löschen
usw.) sowie Hinzufügen (Einfügen, Inhalte einfügen) von Ergebnissen deaktiviert
sind. STATISTICA kann ebenfalls ein Erstellungsdatum des Berichts sowie
Zeitangaben der einzelnen Ergebnisse ausweisen. Die Formate des
Erstellungsdatums und der Zeitangaben sind hierbei frei konfigurierbar und können
darüber hinaus auch Informationen zum Anwender und verwendeten Computer
beinhalten. Im GxP-Modus lässt sich also eindeutig festhalten, welcher Anwender
zu welchem Zeitpunkt die Ergebnisse erstellt hat. Darüber hinaus ist sichergestellt,
dass keine Ergebnisse aus dem Bericht entfernt wurden.
Ein zusätzliches Feature des GxP-Modus ist die Option der Rückverfolgbarkeit. Im
GxP-Modus überprüft STATISTICA automatisch, ob Audit-Trails für die Tabellen
aktiviert wurden. Falls dies der Fall ist, nimmt STATISTICA den Tabellennamen
und die Versionsnummer in den Bericht auf. Wenn keine Versionsnummern
verfügbar sein sollten (zum Beispiel bei deaktiviertem Audit-Trail oder Ergebnissen
aus externen Datenbanken mittels In-place-Database-Processing), führt
STATISTICA für die Nichtverfügbarkeit die entsprechende Erklärung auf.
Wählen Sie im Menü Extras den Befehl Optionen, um den Dialog Optionen
aufzurufen, und wählen Sie in diesem Dialog das Register Ausgabemanager.
Wählen Sie unter Ausgabe Bericht entweder die Option Mehrere Berichte (einen für
108 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
jede Analyse/Grafik) oder Gemeinsamer Bericht (für alle Analysen/Grafiken). Bei
Auswahl einer dieser beiden Optionen werden die Optionen im Rahmen Sperrung
Bericht (GxP) verfügbar.
Aktivieren Sie das Kontrollkästchen Gesperrt, um sicherzustellen, dass keine
Dokumente aus dem Bericht entfernt werden können. Hierbei werden die Befehle
Ausschneiden, Einfügen, Löschen, Umbenennen und das Betrachten der
Eigenschaften in dem Kontextmenü des Berichts deaktiviert. Auch der Befehl
Extrahieren - Original und alle Befehle zum Einfügen sind im Weiteren nicht mehr
verfügbar.
Um in der ersten Zeile der Datei Angaben zur Erstellung einzufügen, können Sie
das Standardformat aus dem Feld Ersteller übernehmen oder ein benutzerdefiniertes
Format eingeben. Die folgenden Codes können in diesem Feld verwendet werden:
&[Date], &[Time], &[User] und &[Computer]. Jeglicher Text in diesem Feld wird
in dem Bericht genauso dargestellt, wie er hier eingegeben wird.
Um über jedes hinzugefügte Objekt im Bericht eine Zeitangabe hinzuzufügen,
können Sie das Standardformat aus dem Feld Datum übernehmen oder ein eigenes
STATISTICA-Handbuch – 109
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Format eingeben. Die folgenden Codes können in diesem Feld verwendet werden:
&[Date], &[Time], &[User] und &[Computer].
Klicken Sie im Dialog Optionen auf OK und führen Sie anschließend eine Analyse
durch; verwenden Sie beispielsweise das Modul Elementare Statistiken, um auf
schnellem Wege eine Ergebnistabelle der Deskriptiven Statistiken zu erstellen. Beim
Klicken der Schaltfläche Zusammenfassung werden die Ergebnisse an einen
gesperrten Bericht übergeben, der für diese Analyse den Ersteller, Datum, Zeit und
verwendeten Computer aufführt.
Die Produktlinie STATISTICA Enterprise erweitert die Funktionen der
STATISTICA-Anwendungen durch das Ermöglichen von Gruppenarbeit, einer
zentralen Administration, einer Anpassung der Systemebenen und anderen
erforderlichen Features, wenn STATISTICA-Anwendungen als Teil eines
unternehmensweiten Computersystems verwendet werden.
110 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
STATISTICA Enterprise Manager ist eine Komponente von STATISTICA
Enterprise, die den Benutzern ermöglicht, verschiedene Aspekte des EnterpriseSystems – einschließlich der Benutzer-Administration, Anpassung der
Systemansicht, Daten-Konfigurationen, Analyse-Konfigurationen und
Datenbankverwaltung – zu konfigurieren. Dieses Beispiel umfasst:
1. Erstellen eines neuen Benutzers
2. Erstellen einer neuen Gruppe
a. Rechte einer Gruppe zuweisen
b. Benutzer (siehe Nr. 1) der Gruppe hinzufügen
3. Erstellen eines Knotens in der Systemansicht
4. Erstellen einer neuen Datenbankverbindung
5. Erstellen einer Daten-Konfiguration
6. Erstellen einer Analyse-Konfiguration
7. Ausführen der Analyse-Konfiguration
Bevor mit diesem Beispiel begonnen wird, sei auf folgenden Sachverhalt
hingewiesen. Im STATISTICA Enterprise Manager bietet das Menü Ansicht die
beiden Optionen Systemansicht oder Objektansicht. In der Systemansicht werden
Objekte, z. B. Daten-Konfigurationen und Analyse-Konfigurationen als NachfolgerKnoten angezeigt. In der Objektansicht werden Objekte als Nachfolger-Knoten
innerhalb der entsprechenden Kategorie angezeigt. In diesem Beispiel wird die
Systemansicht gewählt.
Rufen Sie den Enterprise Manager auf, und loggen Sie sich als Benutzer ein, der
der voreingestellten Administrator-Gruppe angehört. Klicken Sie in der
Baumansicht neben dem Knoten Benutzer-Administration auf das Pluszeichen , so
dass dieser Knoten geöffnet wird, und wählen Sie dann den Ordner Benutzer.
Klicken Sie im Fenster auf der rechten Seite die Schaltfläche Neuer Benutzer, um
die Optionen zur Erstellung eines neuen Benutzers aufzurufen. Geben Sie Test
STATISTICA-Handbuch – 111
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Benutzer 1 im Feld Name ein. Definieren Sie ein Kennwort, und bestätigen Sie es
im darauffolgenden Eingabefeld.
Klicken Sie anschließend in der Symbolleiste die Schaltfläche Änderungen
festlegen
, um die Eingaben durchzuführen.
In den nächsten Schritten wird eine Gruppe erstellt, der Gruppe Rechte zugewiesen
und der neue Benutzer wird der Gruppe hinzugefügt, so dass dem Benutzer
ermöglicht wird, in den Enterprise Manager einzuloggen. Anstatt die Rechte
einzelnen Benutzern zuzuweisen, können mit dieser Methode jegliche Änderungen
der Rechte direkt auf die Gruppe angewendet werden, so dass die
Benutzerverwaltung von STATISTICA Enterprise vereinfacht wird.
Wählen Sie im Knoten Benutzer-Administration den Ordner Gruppen, und klicken
Sie im Fenster auf der rechten Seite die Schaltfläche Neue Gruppe, um die Optionen
aufzurufen, die dem Erstellen einer neuen Gruppe dienen. Geben Sie Test Gruppe 1
im Feld Name ein. Aktivieren Sie im Rahmen Mitglieder das Kontrollkästchen Test
Benutzer1. Dies wird den eben erstellten Benutzer der Gruppe hinzufügen.
112 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Aktivieren Sie im Rahmen Gruppenrechte die Kontrollkästchen Analysis Admin und
Web User. Klicken Sie in der Baumansicht auf das Pluszeichen , das sich neben
dem Knoten Test Gruppe 1 befindet, so dass der Knoten geöffnet wird, und wählen
Sie dort Analysemodule. Klicken Sie die Schaltfläche Alle wählen, um alle Module
in der Liste Verfügbare Analysemodule auszuwählen.
Dies gibt den Benutzern dieser Gruppe die Rechte, in die Web- und DesktopVersion von STATISTICA einzuloggen und alle verfügbaren Analysen und Berichte
auszuführen.
Klicken Sie in der Symbolleiste die Schaltfläche Änderungen festlegen
Eingaben durchzuführen.
, um die
Wir haben nun die notwendigen Benutzer- und Gruppeneinstellungen durchgeführt,
um Analysen und Berichte auszuführen. Wenn in den nächsten Schritten die Daten-,
Analyse- und Berichts-Konfigurationen erstellt werden, wird diese Gruppe den
Objekten zugewiesen, so dass nur die Benutzer dieser Gruppe die Rechte haben, die
Objekte auszuführen.
STATISTICA-Handbuch – 113
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Im Folgenden wird ein Knoten in der Systemansicht erstellt, der die Daten-,
Analyse- und Berichts-Konfigurationen dieses Beispiels enthalten wird. Klicken Sie
in der Baumansicht auf das Pluszeichen , das sich neben dem Knoten
Systemansicht befindet, um diesen Knoten zu öffnen. Führen Sie auf dem Ordner
STATISTICA Enterprise einen Rechtsklick aus, und wählen Sie in dem dadurch
aufgerufenen Kontextmenü die Option Neuer Ordner. Geben Sie Test Beispiel 1 als
Name des neuen Ordners im Feld Ordnername ein.
Klicken Sie in Symbolleiste die Schaltfläche Änderungen festlegen , um die
Eingaben zu bestätigen. Dieser Ordner wird im Folgenden für das Ablegen der
Daten-, Analyse- und Berichts-Konfigurationen verwendet.
114 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Führen Sie in der Baumansicht auf dem Knoten Datenbankverbindungen einen
Rechtsklick aus, und wählen Sie in dem dadurch aufgerufenen Kontextmenü die
Option Neue Datenbankverbindung, um den Dialog
Datenverknüpfungseigenschaften aufzurufen.
Wählen Sie Microsoft Jet 4.0 OLE DB Provider, und klicken Sie die Schaltfläche
Weiter. (Falls der Provider nicht verfügbar sein sollte, besuchen Sie bitte die Seite
http://msdn.microsoft.com/en-us/data/aa937712.aspx#MDAC, um einen
aktualisierten MDAC- oder Jet-Provider zu installieren. Wiederholen Sie
anschließend diesen Schritt, bevor Sie fortfahren.) Klicken Sie im Register
Verbindung auf die Schaltfläche, die sich neben dem Feld Geben Sie den
Datenbanknamen ein, oder wählen Sie einen aus befindet, und rufen Sie dort den
Installationsordner STATISTICA auf (per Voreinstellung C:\Programme\StatSoft\
STATISTICA). Doppelklicken Sie auf die Ordner Examples und anschließend
Database. Wählen Sie die Datei ProcessData.mdb, und klicken Sie die Schaltfläche
Öffnen.
STATISTICA-Handbuch – 115
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Klicken Sie im Register Verbindung auf die Schaltfläche Verbindung testen. Die
Benachrichtigung Das Testen der Verbindung war erfolgreich wird angezeigt (falls
der Test nicht erfolgreich war, überprüfen Sie bitte Ihre Zugriffsrechte auf die Datei
und Ihre MDAC-Installation).
Klicken Sie OK, um die Nachricht zu schließen. Bestätigen Sie die in dem Dialog
Datenverknüpfungseigenschaften vorgenommenen Eingaben mit OK. Geben Sie in
der nachfolgenden Seite den Namen Test Beispiel Verbindung 1 in das Feld Name
ein.
116 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Klicken Sie nun in der Symbolleiste die Schaltfläche Änderungen festlegen.
Für die erstellte Datenbankverbindung zur Datenbank ProcessData wird im
Folgenden eine Daten-Konfiguration erstellt, um die Daten aus der Datenbank zu
extrahieren.
Führen Sie in der Baumansicht auf dem Ordner Test Beispiel 1 einen Rechtsklick
aus, und wählen Sie in dem hierdurch aufgerufenen Kontextmenü die Option Neue
Daten-Konfiguration. Geben Sie in der folgenden Seite den Begriff Test Beispiel 1 in
das Feld Name ein. Klicken Sie auf den Pfeil, der sich neben dem Feld Verknüpfung
befindet, und wählen Sie dann aus der Auswahlliste Test Beispiel Verbindung 1.
STATISTICA-Handbuch – 117
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Klicken Sie in der unteren rechten Ecke dieser Seite auf die Schaltfläche Weiter, so
dass die Optionen für eine neue Abfrage aufgerufen werden.
118 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Klicken Sie die Schaltfläche SQL-Assistent, um den Dialog Neue Abfrage
aufzurufen, der innerhalb von STATISTICA geöffnet wird.
Ziehen Sie die Tabelle RAWMAT aus dem Fenster auf der linken Seite in das
Grafik-Teilfenster (das Fenster auf der rechten oberen Seite), und wählen Sie in der
folgenden Reihenfolge die Felder ID, OPERATOR, LOCATION und HEIGHT.
STATISTICA-Handbuch – 119
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Wählen Sie im Register-Teilfenster (untere rechte Seite) das Register Vorschau
Daten, und klicken Sie in der Symbolleiste die Schaltfläche Vorschau Daten
aktualisieren
(das rote Ausrufezeichen). Dies testet die Abfrage, um
sicherzustellen, dass von der definierten Abfrage Werte abgerufen werden.
Klicken Sie in der Symbolleiste die Schaltfläche Daten an STATISTICA zurückgeben
(grüner Pfeil), um diese Abfrage an die Daten-Konfiguration zurückzusenden.
Wenn eine Nachricht erscheint, ob der SQL-Ausdruck ausgewertet werden soll,
klicken Sie auf die Schaltfläche Ja, so dass die OLE DB-Spalten erstellt werden.
120 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Markieren Sie die Zeile ID, und klicken Sie die Schaltfläche Bearbeiten, um die
Optionen aufzurufen, mit denen die ID-Spalte bearbeitet werden kann. Klicken Sie
auf den Pfeil, der sich neben dem Feld Auto-Update befindet, und wählen Sie aus
der Auswahlliste Erste Update-Spalte. Damit wird ermöglicht, Veränderungen in
der ID-Spalte zu erkennen. Darüber hinaus wird die Spalte sortiert.
Nach dem Klicken der Schaltfläche Weiter kann die OPERATOR-Spalte bearbeitet
werden. Klicken Sie auf die Schaltfläche Filter, um die Filter-Optionen aufzurufen,
und aktivieren Sie das Kontrollkästchen Aktiviert, so dass das Filtern anhand der
OPERATOR-Spalte ermöglicht wird.
STATISTICA-Handbuch – 121
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Klicken Sie die Schaltfläche Weiter, um zu den Bearbeitungsoptionen der
OPERATOR-Spalte zurückzukehren, und klicken Sie dort erneut die Schaltfläche
Weiter, um die LOCATION-Spalte zu bearbeiten. Rufen Sie mittels der Schaltfläche
Filter die Filter-Optionen auf. Aktivieren Sie dort das Kontrollkästchen Aktiviert, um
das Filtern der LOCATION-Spalte zu ermöglichen. Kehren Sie mittels der
Schaltfläche Weiter zu den Optionen der LOCATION-Spalte zurück. Klicken Sie
dort erneut die Schaltfläche Weiter, um die HEIGHT-Spalte zu bearbeiten. Wählen
Sie in der Auswahlliste des Feldes Zieltyp die Option Merkmal Messung. Somit wird
diese Spalte für die Durchführung von gebündelten SPC-Analysen verfügbar (dies
ist die Spalte, die die zu analysierenden Daten enthält).
122 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Als Nächstes klicken Sie die Schaltfläche Weiter, um die Optionen der
Zugriffsrechte für dieses Objekt aufzurufen. Wählen Sie in der Liste Vorhandene
Benutzer und Gruppen die Test Gruppe1, und klicken Sie dann die obere
Schaltfläche , um die Test Gruppe 1 in die Liste Zugriffsrechte zu verschieben.
Hierdurch kann diese Daten-Konfiguration von den Benutzern der Test Gruppe 1
ausgeführt (aber nicht bearbeitet) werden.
Klicken Sie in der Symbolleiste die Schaltfläche Änderungen festlegen, um diese
neue Daten-Konfiguration dem STATISTICA Enterprise Manager dauerhaft
hinzuzufügen.
Nachdem eine Daten-Konfiguration definiert wurde, die dazu dient, Daten aus der
Datenbank ProcessData.mdb zu extrahieren, ist eine Analyse-Konfiguration
notwendig, um diese Daten zu analysieren.
STATISTICA-Handbuch – 123
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Klicken Sie in der Baumansicht mit der rechten Maustaste auf den Ordner Test
Beispiel 1, und wählen Sie in dem Kontextmenü die Option Neue AnalyseKonfiguration, um den Dialog Daten-Konfiguration auswählen aufzurufen. Wählen
Sie das Objekt Test Beispiel 1, und klicken Sie die Schaltfläche OK. Wenn ein
Dialog aufgerufen wird, der den Hinweis „Bei Auswahl dieser Option werden die
Rechte von ‚Analyse’ mit denen aus ‚Daten’ ersetzt“ enthält, bestätigen Sie mit OK.
Klicken Sie die Schaltfläche Weiter, um mit dem Erstellen einer AnalyseKonfiguration fortzufahren (das Übernehmen des voreingestellten Namens, der mit
dem Namen der Daten-Konfiguration identisch ist, erfolgt hier nur aufgrund der
Zweckdienlichkeit). Klicken Sie ein weiteres Mal die Schaltfläche Weiter, um mit
der Bearbeitung der Analyse-Konfiguration fortzufahren.
124 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Ändern Sie dann in der aufgerufenen Seite unter SPC Merkmale - HEIGHT den
Kartentyp auf Einzelwerte & MR (wie in obiger Abbildung).
Da keine weiteren SPC-Optionen konfiguriert werden müssen, wählen Sie in der
Baumansicht den Knoten Ablauf-Optionen, und aktivieren in der aufgerufenen Seite
das Kontrollkästchen Dialog SQL-Kriterien anzeigen.
STATISTICA-Handbuch – 125
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Diese Option legt fest, dass STATISTICA beim Filtern der Spalten, die in der DatenKonfiguration über Filter-Optionen verfügen, einen Hinweis aufruft. (Wenn beim
Definieren der Filter-Optionen das Kontrollkästchen Filter erzwungen aktiviert wird,
ist dieser Schritt nicht erforderlich, da der Filter-Hinweis dann zwangsläufig beim
Ablauf aufgerufen wird – in diesem Beispiel wurde das Kontrollkästchen allerdings
nicht aktiviert.)
Klicken Sie in der Symbolleiste die Schaltfläche Änderungen festlegen, um diese
Analyse-Konfiguration dauerhaft STATISTICA Enterprise hinzuzufügen.
126 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Schließen Sie den Enterprise Manager, und loggen Sie sich in STATISTICA als Test
Benutzer 1 ein, der in Schritt 1 erstellt wurde.
Wählen Sie im Menü Enterprise die Option Analyse/Bericht ausführen, um den
Dialog Analyse oder Bericht starten aufzurufen (je nach Konfiguration kann dieser
Dialog auch automatisch aufgerufen werden). Wählen Sie die Analyse Test Beispiel
1, und klicken Sie die Schaltfläche OK, so dass der Dialog SQL-Kriterien aufgerufen
wird.
Klicken Sie auf den Pfeil, der sich neben dem Feld Spalte befindet, und wählen Sie
in der Auswahlliste die Spalte LOCATION. Klicken Sie anschließend die SuchSchaltfläche , um den Dialog Wert von LOCATION aufzurufen, der eine Liste der
verfügbaren LOCATION-Werte enthält. Wählen Sie Boston, und bestätigen Sie die
Auswahl mit der Schaltfläche OK.
STATISTICA-Handbuch – 127
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
Klicken Sie die Schaltfläche Fertigstellen, um das Filtern abzuschließen, die Daten
zu extrahieren und um eine gebündelte Analyse der Spalte HEIGHT durchzuführen.
Dieses Beispiel illustriert, wie eine Analyse-Konfiguration unter Verwendung der
standardmäßigen STATISTICA-Benutzeroberfläche und Ausgabekomponenten
erstellt und ausgeführt wird.
Eine der wesentlichen Stärken von STATISTICA Enterprise besteht jedoch in dem
Bedienkomfort, angepasste Benutzeroberflächen erstellen zu können (z. B. für
unterschiedliche Gruppen von Anwendern, die nach ihrer Funktion innerhalb des
Unternehmens, ihres Fachwissens oder ihren Datenzugriffsrechten unterteilt
werden).
Es können auf einfachem Wege angepasste Benutzeroberflächen beliebiger
Komplexität erstellt werden; beispielsweise von stark vereinfachten Oberflächen,
die lediglich drei Optionen beinhalten ...
128 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
... bis zu detaillierten Benutzeroberflächen von nahezu unbegrenzter Flexibilität:
Für weitere Details und Beispiele siehe die Hilfe zu STATISTICA Enterprise.
STATISTICA-Handbuch – 129
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
130 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
STATISTICA-Handbuch – 131
Copyright © StatSoft, 2009
KAPITEL 3: WEITERFÜHRENDE BEISPIELE
132 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
Das STATISTICA-System lässt sich auf verschiedene Weise steuern. Die folgenden
Abschnitte fassen die Eigenschaften der wichtigsten Benutzeroberflächen von
STATISTICA zusammen:
1. Interaktive Benutzeroberfläche (siehe Seite 136)
2. STATISTICA Visual Basic (siehe Seite 149)
3. Webbrowser-basierte Oberfläche (siehe Seite 150)
4. Microsoft Office-Integration (siehe Seite 152)
Man sollte dabei Folgendes beachten:

Viele Aspekte dieser Benutzeroberflächen schließen sich nicht gegenseitig aus:
Vielmehr kann man sie abhängig von der speziellen Anwendung und den
Präferenzen miteinander kombinieren.

Mit den gestaltbaren Menüs und Symbolleisten können alternative
Benutzeroberflächen integriert werden, um zum Beispiel schnellen Zugang zu
Makroprogrammen (Visual Basic) oder häufig benutzten Dateien zu bieten.

Nahezu alle Eigenschaften dieser alternativen Benutzeroberflächen können
angepasst werden (und damit das Aussehen und Verhalten von STATISTICA
verändern); üblicherweise empfiehlt es sich, dass Sie Ihr System entsprechend
Ihrer Präferenzen und der Anforderungen der von Ihnen durchzuführenden
STATISTICA-Handbuch – 133
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
Aufgaben anpassen. Damit stellen Sie sicher, dass Sie das Potential von
STATISTICA voll ausschöpfen (siehe Anpassen der interaktiven
Benutzeroberfläche auf Seite 232).
Auch ohne jegliche Anpassungen bieten die Voreinstellungen von STATISTICA
alternative Mittel und Lösungen, dieselben Resultate zu erzielen. Dieses Prinzip des
„alternativen Zugriffs“ ist in der Benutzeroberfläche allgegenwärtig und erlaubt es,
auf unterschiedliche Weise mit STATISTICA zu arbeiten. So kann man auf die
üblicherweise am meisten verwendeten Werkzeuge auf alternativen Wegen
zugreifen:

Über traditionelle Menüs

Über Tastaturkombinationen

Über Symbolleisten und anzuklickende Felder in der Statusleiste

Über angepasste Symbolleisten (benutzerdefinierte Symbolleisten mit
Schaltflächen und speziellen Steuerelementen, die Makros und Befehle
enthalten können)

Über Kontextmenüs, die an bestimmte Objekte gekoppelt sind (Zellen, Teile
von Grafiken, Arbeitsmappensymbole) und nach dem Anklicken des Elementes
mit der rechten Maustaste erscheinen.
Es empfiehlt sich, die alternativen Möglichkeiten der Benutzeroberfläche von
STATISTICA auszuprobieren, bevor man sich auf einen Arbeitsstil festlegt.
Wie erwähnt kann STATISTICA zu einem Zeitpunkt mehrfach geöffnet sein. Dabei
kann jedes Mal derselbe oder ein unterschiedlicher Analysetyp ablaufen
(traditionell „Module“ genannt) wie z. B. Elementare Statistik, Multiple Regression
134 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
oder ANOVA. Darüber hinaus können in einer STATISTICA-Anwendung mehrere
Analysen gleichzeitig geöffnet sein. Sie können gleicher oder unterschiedlicher
Natur sein (z. B. fünf Multiple Regressionen und zwei ANOVAs), und jede von ihnen
kann auf derselben oder verschiedenen Datendatei/en aufbauen (mehrere
Eingabedateien können gleichzeitig geöffnet sein).
Um
diese „Multitasking“-Funktionalität optimal auszunutzen, wird die Arbeit in
STATISTICA in funktionalen Einheiten, so genannten „Analysen“ organisiert. Diese
werden durch Schaltflächen auf der Analyseleiste am unteren Rand des
Anwendungsfensters repräsentiert (oberhalb der Statusleiste, wie im Beispiel unten
dargestellt: Dort laufen Elementare Statistik, Clusteranalyse und Kanonische
Analyse gleichzeitig). Beim Start neuer Analysen werden weitere Schaltflächen
hinzugefügt. Zur Steuerung und Konfigurierung dieser Eigenschaft von
STATISTICA werden viele Optionen angeboten.
Wenn Sie aus einem Ergebnisdialog eine Tabelle oder Grafik auswählen, erscheint
standardmäßig die Ausgabe und der Dialog wird automatisch auf die entsprechende
Analyseschaltfläche am unteren Rand des Bildschirmes minimiert. Ein Klick auf
STATISTICA-Handbuch – 135
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
diese Schaltfläche (oder die Tastaturkombination STRG+R) nimmt die Analyse
wieder auf und zeigt den Dialog an.
Eine Reihe von Optionen zum Analysenmanagement ist über das Kontextmenü
verfügbar (Zugriff über rechten Mausklick auf die Analyseschaltfläche in der
Analyseleiste). Sie beziehen sich auf die entsprechende Analyseschaltfläche (wie
oben gezeigt).
Benutzer mit
großen Bildschirmen können die standardmäßige Minimierung der Analysedialoge
abschalten und so die Tatsache ausnutzen, dass die meisten dieser Dialoge klein
sind: Sie werden damit permanent auf dem Bildschirm gehalten, ohne dass sie das
Betrachten der Analyseergebnisse behindern. Man kann diese Option entweder für
eine bestimmte Analyse anpassen (Befehl Automatisches Minimieren im
Kontextmenü der Analyseschaltfläche abschalten, siehe oben) oder global für das
gesamte Programm (über das Register Analysen/Grafiken im Dialog Optionen,
erreichbar über das Menü Extras - Optionen).
Laufen mehrere Analysen gleichzeitig, so dass das STATISTICA-Fenster mit
Dialogen und Ausgaben überladen wird, kann man alle auf bestimmte Analysen
bezogene Fenster verbergen (oder mit dem Befehl Alle Analysen schließen über das
Kontextmenü für Analyseschaltflächen schließen); ein weiterer einfacher Weg zur
Organisation und Verwaltung der Arbeit besteht darin, die Anwendung
STATISTICA ein weiteres Mal zu starten.
Obwohl die interaktive Benutzeroberfläche nicht die einzige in
STATISTICA verfügbare ist (siehe Kapitel 8 – STATISTICA anpassen, Seite 231 und
Kapitel 9 – STATISTICA Visual Basic, Seite 239), ist sie meistens die einfachste
Alternative und wird wahrscheinlich am häufigsten benutzt werden. Viele
Komponenten dieser Benutzeroberfläche kann man direkt am STATISTICABildschirm erkennen.
136 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
Ähnlich wie bei den meisten Softwareprodukten werden oben im Bildschirm Menüs
und verschiedene Symbolleisten angezeigt. Sie lassen sich anpassen und in der für
Ihre Aufgaben angemessenen Form anzeigen.
Unten im Fenster werden die Analyseleiste (mit den minimierten Dialogen der
Analysen und Grafiken) und die Statusleiste angezeigt. Des Weiteren sind
Kontextmenüs verfügbar, wenn man an entsprechender Stelle auf die rechte
Maustaste drückt.
Datendateien können in Tabellen, Arbeitsmappen, Berichten oder individuellen
Fenstern angezeigt werden, Ergebnistabellen oder Grafiken in Arbeitsmappen,
Berichten oder individuellen Fenstern. Andere Dokumente (z. B. aus Word oder
Bitmapdateien) lassen sich ebenfalls in Tabellen, Arbeitsmappen oder Berichten
anzeigen. STATISTICA Visual Basic-Code schließlich wird in Makrofenstern
angezeigt.
Normalerweise wird man nicht gleichzeitig alle diese Möglichkeiten und
Werkzeuge nutzen. Die Benutzeroberfläche von STATISTICA lässt sich stets so
einfach oder so komplex gestalten, wie Ihre speziellen Bedürfnisse oder
Präferenzen es erfordern (siehe Seite 231). Die verschiedenen Werkzeuge und
Möglichkeiten werden detailliert im Elektronischen Handbuch beschrieben.
Die verschiedenen statistischen und grafischen Prozeduren von
STATISTICA können in derselben STATISTICA-Anwendung durchgeführt werden.
So ist es zum Beispiel möglich, Residualstatistiken mit Hilfe von Optionen im
Modul Multiple Regression zu berechnen und danach den Output sofort in einer
Faktorenanalyse oder einem anderen explorativen Modul zu verwenden, ohne eine
weitere STATISTICA-Anwendung zu starten. Weitere Informationen zur
Verwendung von Ergebnissen als Eingabedaten finden Sie unter Kann man die
Ergebnisse einer Analyse dazu verwenden, eine andere Analyse durchzuführen? im
Elektronischen Handbuch.
Nach der Auswahl einer bestimmten statistischen Prozedur aus den
Menüs Statistik, Data Mining oder Grafik wird ein entsprechendes Start-Menü
angezeigt (siehe folgende Abbildung; im Statistik-Menü wurde Elementare Statistik
gewählt, so dass das Start-Menü Elementare Statistik und Tabellen angezeigt wird).
STATISTICA-Handbuch – 137
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
Jedes Start-Menü enthält eine Liste von Analysetypen, die in dem speziellen Modul
verfügbar sind. Klickt man irgendwo in den Bereich außerhalb des Start-Menüs,
minimiert es sich automatisch zu einer Schaltfläche in der Analyseleiste. Benutzer
mit hochauflösenden Bildschirmen können diese Voreinstellung ändern und die
jeweils aufeinanderfolgenden Dialoge auf dem Bildschirm behalten.
Falls Sie lieber über Symbolleisten als über Menüs statistische
Analysen auswählen möchten, können Sie die Symbolleiste Statistik, die Symbole
für alle Module enthält, aktivieren. Dies geschieht mit einem rechten Mausklick auf
irgendeine Symbolleiste und anschließender Auswahl von Statistik aus dem
Kontextmenü mit der Liste der Symbolleisten. Alternativ kann man Statistik aus
dem Menü Ansicht - Symbolleisten wählen. Es lassen sich auch eigene
Symbolleisten mit Analyseschaltflächen, die häufig benutzt werden, erzeugen
(veranschaulicht auf Seite 147). Weiteres zu Symbolleisten finden Sie unter
Symbolleisten – Überblick im Elektronischen Handbuch.
Nachdem die gewünschte Analyse aus dem Start-Menü
ausgewählt worden ist, wird der Dialog zur Spezifikation der Analyse angezeigt.
Dort wählen Sie die zu analysierenden Variablen sowie weitere Optionen und
Einstellungen für die durchzuführende Aufgabe. Oft enthalten diese Dialoge zur
Verbesserung der Übersichtlichkeit mehrere Register, die die Optionen, Analysen
oder Ergebnisse in logische Kategorien unterteilen.
138 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
In einigen einfachen Analysen (wie Deskriptive Statistiken in obiger Abbildung)
dient der Dialog zur Analysespezifikation gleichzeitig auch als Dialog zur Auswahl
der Ausgabe (z. B. bestimmter Tabellen und Grafiken). Die meisten Analysen haben
jedoch separate Dialoge für die Analysespezifikation und Ergebnisse.
STATISTICA ermöglicht es, in
den Tabellen erweiterte Information bezüglich des Messwert-Typs einer Variablen
und des Fallstatus hinzuzufügen. Diese „Metadaten“ können dazu verwendet
werden, eine umfassendere Beschreibung des Datensatzes zu erstellen. Hiermit wird
bei explorativen Analysen das Durchführen eines Was-wäre-wenn-Szenarios
erleichtert und die Darstellung von Fällen in einer Grafik kann bequem vom
Benutzer angepasst werden.
Einem Fall kann ein sogenannter Fallstatus
zugewiesen werden, so dass in Grafiken die Erscheinung von einzelnen Punkten
angepasst werden kann, womit das Erkennen von einflussreichen und interessanten
Punkten stark vereinfacht wird. Für diese Anpassung ausgewählter Punkte steht
eine weite Auswahl von Symbolen und Farben zur Verfügung. Es ist hierbei nicht
zwingend notwendig, dass der Fallstatus vor dem Erstellen der Grafik zugewiesen
wird, da dies auch in der Grafik mit dem interaktiven Brushing (sofern eine Grafik
geöffnet ist, kann diese Option über Befehl Brushing im Menü Ansicht aufgerufen
werden) realisiert werden kann. Ein in einer Grafik zugewiesener Fallstatus wird
auch in der zugehörigen Tabelle übernommen. Diese Möglichkeit, einen Fallstatus
in einer Tabelle oder einer Grafik zuzuweisen, ist eine weitere Vereinfachung der
visuellen explorativen Datenanalyse.
STATISTICA-Handbuch – 139
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
Der Messwert-Typ (Skalenniveau) einer Variablen kann explizit
festgelegt werden, um anzuzeigen, welche Analysen und Grafiken für diese
Variable angemessen sind. Diese Messwert-Typen werden direkt an nachfolgende
Analysen und Grafiken weitergereicht, so dass die geeigneten Variablen in diesen
Fällen erkannt werden (z. B. werden Variablen des Typs Kategorial in einer
Mehrfaktoriellen ANOVA in der Variablenliste der kategorialen Prädiktoren
aufgeführt).
In allen Dialogen zur Variablenauswahl (wie in der obigen Abbildung) steht die
Option Nur geeignete Variablen anzeigen zur Verfügung, die ermöglicht, dass
anhand des Messwert-Typs (die in den Dialogen Variablenspezifikationen festgelegt
werden, wobei diese Dialoge durch Doppelklick in der Variablenüberschrift
aufgerufen werden) eine Vorauswahl getroffen wird. Wenn der Messwert-Typ auf
Auto gesetzt wird, entscheidet die gewählte Option unter Automatische
Klassifikation der Variablen (die im Register Analyse/Grafik des Dialogs Optionen
festgelegt wird - erreichbar über Optionen im Menü Extras), wie STATISTICA den
Messwert-Typ automatisch festlegen wird.
Das
Filtern (erreichbar über Untermenü Daten - Auto-Filter) ist ein schneller und
einfacher Weg, einen bestimmten Teil der Daten in der Tabelle darzustellen, ohne
die Daten zu sortieren oder einen Teilbereich erzeugen zu müssen. Wenn eine
Variable gefiltert wird, werden nur die Werte in der Tabelle angezeigt, die das
festgelegte Kriterium erfüllen. Fälle, die das Kriterium nicht erfüllen, werden nicht
mehr angezeigt, allerdings nicht aus der Tabelle entfernt (in der folgenden Tabelle
werden beispielsweise nur die Fälle aufgeführt, für die Geschlecht = männlich gilt).
140 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
Obwohl diese Fälle ausgeblendet sind, stehen sie weiterhin für die statistischen und
grafischen Analysen zur Verfügung.
Wie ausführlicher in Kapitel 5 – Fünf Kanäle für die Ausgabe der
Analyse (ab Seite 157) und in Beispiel 1: Korrelationen (Seite 11) und Beispiel 2:
ANOVA (Seite 34) veranschaulicht, werden die aufeinanderfolgenden
Ausgabetabellen und Grafiken per Voreinstellung in Arbeitsmappen ausgegeben.
Zusätzlich kann die gesamte Ausgabe in einen Analysebericht geleitet werden
(siehe Seite 160), der in einer (als Baumstruktur) wohl organisierten, formatierten
und einfach auszudruckenden Form eine spezifische Analyse zusammenfasst. Es ist
dabei auch möglich, die Ergebnisse verschiedener Analysen in einen einzigen
Bericht zu leiten. Alternativ kann die Ausgabe in einzelne Fenster gelenkt werden.
Um die Ausgabeoptionen für eine einzelne Analyse oder Sitzung festzulegen,
klicken Sie im Dialog zur Spezifikation der Analyse die Schaltfläche
, und
wählen Sie im aufgerufenen Menü die Option Ausgabe, so dass der Dialog
Analyse/Grafik Ausgabemanager angezeigt wird.
Globale Ausgabeoptionen sind verfügbar, wenn man Optionen aus dem Menü
Extras wählt und dort auf das Register Ausgabemanager klickt, oder aus dem Menü
Datei die Option Ausgabemanager auswählt. Weitere Informationen erhalten Sie
aus dem Elektronischen Handbuch.
STATISTICA-Handbuch – 141
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
STATISTICA bietet direkten Zugang zu allen statistischen Analysedialogen über die
Menüs Statistik ...
... und Data Mining:
142 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
Der direkte Zugang zu allen Dialogen der grafischen Analyse erfolgt über das Menü
Grafik:
(Alternativ über die entsprechenden Symbolleisten Statistik, Data Mining und
Grafik.) Diese Menüs sind immer aktiv, wenn ein Dokument mit Eingabedaten
geöffnet ist. Die Menüs Statistik und Data Mining bieten Zugang zu allen in
STATISTICA verfügbaren Analysetypen. Über das Menü Grafik hat man direkten
Zugriff auf eine Vielzahl häufig benutzter Grafiktypen (z. B. Scatterplots,
Histogramme, Mittelwerte und Fehlerplots) sowie hierarchischen Zugriff auf alle
Grafiktypen in STATISTICA einschließlich 2D-Grafiken, 3D-sequentielle und XYZGrafiken, Matrixplots, Iconplots, Grafiken in Kategorien, Benutzerdefinierte Grafiken,
Grafiken für Blockdaten und Grafiken für Eingabedaten. Das Menü bietet auch
Zugang zu Layouts für mehrere Grafiken. Eine ausführliche Darstellung der
verschiedenen Typen von Statistiken und Grafiken bietet STATISTICA im Glossar
des Elektronischen Handbuchs. Siehe auch Anhang B: STATISTICA Produktfamilie
(Seite 295) für weitere Informationen zu der umfangreichen Auswahl von
Anwendungen der Datenanalyse innerhalb der STATISTICA Produktfamilie.
Abhängig von den eigenen Präferenzen kann man auswählen, dass alle
Analysedialoge minimiert werden, wenn man ein anderes Fenster von STATISTICA
oder eine andere Anwendung wählt. Per Voreinstellung ist der Befehl
Automatisches Minimieren aktiviert; ist Ihr Bildschirm jedoch groß genug, um
mehrere Fenster darzustellen, ist es sinnvoll, diese Option auszuschalten. Damit
bleibt der Analysedialog auf dem Bildschirm, während die aus diesem Dialog
STATISTICA-Handbuch – 143
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
erzeugte Ausgabe erstellt wird, und kann sowie eine „Symbolleiste“ genutzt
werden, aus der weitere Ausgaben ausgewählt werden können. Seite 136 enthält
weitere Informationen zur Anpassung dieser Option.
Man kann sehr einfach laufende
Analysen und Grafiken fortsetzen (d. h. den aktuellen Dialog der laufenden Analyse
wieder in den Vordergrund stellen). Wählen Sie Weiter aus dem Menü Extras Analyse, drücken Sie STRG+R oder klicken auf die entsprechende Schaltfläche in
der Analyseleiste. Laufen mehrere Analysen, wählt man die gewünschte Analyse
aus dem Menü Extras - Analyse - Analyse/Grafik auswählen aus (siehe folgende
Abbildung).
Zur Organisation der Fenster verschiedener Analysen
können Sie alle Fenster, die zu einer bestimmten Analyse gehören, verbergen,
solange diese Analyse nicht aktiv ist. Hierzu wählen Sie Verbergen bei Abwahl aus
dem Menü Extras - Analyse - Optionen. Per Voreinstellung ist dieser Befehl nicht
aktiviert. Beachten Sie, dass dieser Befehl nur zur Wirkung kommt, wenn
Ergebnisse als Einzelfenster ausgegeben werden; Details zur Verwaltung der
Ausgabe von Analysen finden Sie in der Darstellung des Ausgabemanagers (Seite
157). Des Weiteren gibt es einen Befehl zum Schließen aller Dokumentfenster,
Fenster - Alle schließen (oder STRG+L), und einen Befehl zum Schließen aller
Analysen, Extras - Analyse - Alle Analysen beenden.
144 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
Aktivieren Sie Nach oben bei
im Menü Extras - Analyse - Optionen, um alle zu einer bestimmten
Analyse gehörenden Fenster in den Vordergrund von STATISTICA zu bringen,
sobald diese Analyse ausgewählt wird. Über diesen Befehl lassen sich auch einzelne
Fenster verschiedener Analysen organisieren. Per Voreinstellung ist der Befehl
aktiviert. Beachten Sie, dass dieser Befehl nur zur Wirkung kommt, wenn
Ergebnisse als Einzelfenster ausgegeben werden; Details zur Verwaltung der
Ausgabe von Analysen finden Sie in der Darstellung des Ausgabemanagers (Seite
157).
Auswahl
Per Voreinstellung wird im oberen Bereich bestimmter
Ergebnisdialoge (wie z. B. bei Multiple Regression - Ergebnisse) ein Feld mit
zusammenfassenden Informationen über die Analyse angezeigt. Diese Info-Box
lässt sich im Einzelfall durch einen Klick auf das Symbol in der unteren rechten
Ecke der Box verbergen. Über den Befehl Info-Box verbergen im Menü Extras Analyse - Optionen kann man die Anzeige aller Info-Boxen global unterdrücken.
STATISTICA verwendet sieben unterschiedliche Dokumenttypen:

Arbeitsmappen (siehe die Seiten 158 und 185)

Tabellen (multimediafähig; siehe Seite 189)

Berichte (siehe die Seiten 160 und 194)

Grafiken (siehe die Seiten 196 und 207)

Makros (STATISTICA Visual Basic; siehe die Seiten 197 und 239)

STATISTICA-Projektdateien (siehe Seite 198)

Data Miner-Projektdateien (siehe Seite 201)
Mit diesen sieben Dokumenttypen lassen sich verschiedene Arten von Daten
verwalten, Dateneingaben und -auswertungen durchführen, qualitativ hochwertige
Grafiken erzeugen, eigene Anwendungen beliebiger Komplexität entwickeln und
formatierte Berichte erstellen.
STATISTICA-Handbuch – 145
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
Auf die zuletzt verwendeten Dokumente kann schnell zugegriffen werden: Klicken
Sie auf die STATISTICA Start-Schaltfläche (unten links im Bildschirm) und
wählen Dokumente.
Im Register Allgemein des Dialoges Optionen (zu erreichen über das Menü Extras Optionen) können Sie festlegen, wie viele zuletzt verwendete Dokumente
aufgelistet werden (per Voreinstellung 16). Detaillierte Informationen zu jedem der
Dokumenttypen finden Sie in den Überblicken zu Arbeitsmappen, Tabellen,
Berichten, Grafiken und Makros ab Seite 185 und im Elektronischen Handbuch.
Jeder der oben
genannten fünf Typen von STATISTICA-Dokumenten behandelt Daten
unterschiedlich. Deshalb bieten sie auch unterschiedliche Optionen zur Anpassung
und Verwaltung an. Diese Unterschiedlichkeit spiegelt sich in den Symbolleisten
wider, die jeden Dokumenttyp begleiten. Menübefehle und Symbolleisten für jeden
der Dokumenttypen werden detailliert im Elektronischen Handbuch erläutert.
146 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
Arbeitsmappen haben keine spezielle Symbolleiste (obwohl die Symbolleiste
Standard stets verfügbar ist), weil die jeweils angebotene Symbolleiste vom gerade
angezeigten Dokument in der Arbeitsmappe abhängt. Editieren Sie also eine
Tabelle, eine Grafik, einen Bericht, ein Makro oder ein Fremddokument (z. B. eine
Microsoft Excel-Tabelle) in einer Arbeitsmappe, dann werden die für diesen
Dokumenttyp geeigneten Menüs und Symbolleisten zur Verfügung gestellt.
Wenn Sie in der Baumstruktur der Arbeitsmappe einen „leeren Knoten“ wählen,
wird standardmäßig die Symbolleiste Statistik angezeigt (anstelle einer für einen
Dokumenttyp spezifischen Symbolleiste), um die Größe und Proportionen des
Arbeitsbereichs der Anwendung zu erhalten.
Zusätzlich zu den verschiedenen von
STATISTICA angebotenen Symbolleisten können Sie benutzerdefinierte
Symbolleisten erstellen. Diese können jeden in STATISTICA verfügbaren Befehl
sowie spezielle Steuerelemente (d. h. Schriftart, Schriftgrad, Grafiktyp, etc.)
enthalten. Die Symbolleisten können einen beliebigen Namen erhalten und
abhängig von einem aktiven Dokumenttyp geöffnet werden. Weiterhin können allen
Symbolleisten (einschließlich existierender Symbolleisten) Befehle und bestimmte
Steuerelemente hinzugefügt werden.
Um eine Symbolleiste zu erstellen oder eine existierende zu verändern, wählen Sie
das Register Symbolleisten aus dem Dialog Anpassen, den Sie über das Menü
Extras - Anpassen erreichen. Man verändert eine Symbolleiste, indem man einfach
einen Befehl aus dem Feld Befehle des Registers Befehle/Makros in die
Symbolleiste zieht (siehe folgende Abbildung).
STATISTICA-Handbuch – 147
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
Die Form und Platzierung der Symbolleisten ist leicht zu verändern. Alle
Symbolleisten lassen sich an den Bildschirmrändern verankern oder frei
positionieren. All diese Optionen ermöglichen es, eigene Symbolleisten zu
erzeugen, so dass Sie über eine hoch spezialisierte Benutzeroberfläche verfügen
können. Das Elektronische Handbuch enthält einfach nachzuvollziehende Schrittfür-Schritt-Beispiele, die mit diesen Anpassungen vertraut machen. Weitere
Einzelheiten finden Sie insbesondere unter Neue Symbolleisten erstellen im
Elektronischen Handbuch.
Die Anpassung von Menüs ist genauso einfach
und wird über das Register Menü des oben gezeigten Dialoges Anpassen
durchgeführt (Details finden Sie im Elektronischen Handbuch).
148 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
Die dem Industriestandard folgende Programmiersprache STATISTICA Visual Basic
ist in STATISTICA integriert und stellt eine weitere alternative Benutzeroberfläche
dar, die die gesamte Funktionalität von STATISTICA umfasst. Sie ist weit mehr als
nur eine Programmiersprache zur Erstellung erweiterter Anwendungen.
STATISTICA Visual Basic nutzt die Objektmodell-Architektur von STATISTICA
voll aus, und man kann über sie jeden Aspekt und nahezu jedes Detail der
Funktionalität von STATISTICA per Programmierung steuern. Selbst die
kompliziertesten Analysen und Grafiken lassen sich als Visual Basic Makro
aufzeichnen. Diese Makros kann man später wiederholt ablaufen lassen, sie
editieren oder aus Teilen von ihnen andere Anwendungen zusammensetzen.
STATISTICA Visual Basic fügt der umfassenden Standardsyntax von Microsoft
Visual Basic einen Vorrat von über 13.000 neuen Funktionen hinzu und stellt damit
eine der größten verfügbaren Entwicklungsumgebungen dar. Weitere Informationen
zu STATISTICA Visual Basic finden Sie in Kapitel 9 (Seite 239).
Eine der
Eigenschaften, die die STATISTICA Visual Basic-Umgebung so mächtig machen,
ist die Fähigkeit, verschiedene Anwendungen und deren Umgebungen in einem
einzigen Makro zu integrieren und zu manipulieren. Beispielsweise könnte man ein
STATISTICA Visual Basic-Programm schreiben oder aufzeichnen, das mit dem
Modul STATISTICA Zeitreihenanalyse Vorhersagen berechnet und das Programm
aus einer Excel-Tabelle oder einem Microsoft Word-Dokument heraus starten. Der
Austausch von Informationen zwischen verschiedenen Anwendungen wird erreicht,
indem man Visual Basic-Programmen diese Anwendungen als Objekte zur
Verfügung stellt. Damit kann man zum Beispiel statistische Analysen mit dem
Modul STATISTICA Elementare Statistik aus einem Visual Basic-Programm in
Excel heraus ablaufen lassen, indem man innerhalb des Programms ein Objekt vom
Typ Statistica.Application deklariert.
Nachdem ein Objekt erzeugt wurde, kann das Visual Basic-Programm auf die in
diesem Objekt enthaltenen Eigenschaften und Methoden zugreifen. Eigenschaften
kann man sich meist als Funktionen vorstellen, Methoden hingegen als
STATISTICA-Handbuch – 149
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
Unterprogramme, die innerhalb des Anwendungsobjektes bestimmte Operationen
oder Berechnungen durchführen. STATISTICA-Prozeduren können direkt aus vielen
anderen Anwendungen und Programmiersprachen (z. B. C++ und Java) heraus
aufgerufen werden.
Zusätzlich zu den beiden grundsätzlichen Typen der Benutzeroberfläche, die in den
vorherigen Abschnitten beschrieben wurden, bietet die gesamte STATISTICAProduktfamilie die Option an, eine Webbrowser-basierte Benutzeroberfläche zu
verwenden. Hierbei können alle Interaktionen mit der Anwendung – einschließlich
Datenbankabfragen, Datenmanagement, Datenanalyse oder Data Mining wie auch
das Erstellen von Berichten und Teamarbeit – durchgeführt werden, ohne dass
irgendeine STATISTICA-Anwendung auf dem lokalen Rechner installiert ist. Sofern
eine Internetverbindung besteht, hat man auf diese Weise von nahezu jedem
Computer auf dieser Welt Zugriff auf diese Funktionen. Diese alternative
Benutzeroberfläche erfordert, dass eine Client-Server-Version der entsprechenden
STATISTICA-Anwendung installiert wird.
STATISTICA wird mittels WebSTATISTICA Server die komplette
Webfähigkeit hinzugefügt, einschließlich der Möglichkeit, STATISTICA interaktiv
von einem Webbrowser aus auszuführen. Sofern
eine Internetverbindung besteht, wird von
nahezu jedem Computer auf dieser Welt der
einfache und schnelle Zugriff auf Daten und
mächtige analytische Werkzeuge ermöglicht.
Dieses Produkt wird mit einer Auswahl von
Webbrowser-basierten Benutzeroberflächen (in
der Form von Dialogen, die extrem einfach zu
navigieren und zu verwenden sind) angeboten,
die es ermöglichen, mit einem standardmäßigen
Webbrowser Analysen zu spezifizieren und sich
Ergebnisansichten erstellen zu lassen. Es werden
ebenfalls Tools angeboten, um diese Dialoge anzupassen, um neue,
150 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
benutzerangepasste Oberflächen zu erstellen oder um neue Funktionen
hinzuzufügen. Die Oberfläche in dem Webbrowser kann beispielsweise aus einem
einfachen Dialog bestehen, der lediglich drei Schaltflächen enthält, wobei das
Klicken einer dieser Schaltflächen, eine Serie von Analysen ausführt und
detaillierte Berichte erstellt. WebSTATISTICA Server fügt der gesamten
Produktlinie von STATISTICA, der Datenanalyse, Data Mining und
Qualitätsregelkarten/Six Sigma-Methoden, eine neue Dimension und eine große
Anzahl von neuen Anwendungsmöglichkeiten hinzu.
WebSTATISTICA Server ist ein hoch skalierbares
Anwendungssystem auf Unternehmensebene, das eine webbasierte Datenanalyse
und ein Datenbank-Gateway umfasst. Dieses System basiert auf der Technologie
der verteilten Verarbeitung und unterstützt vollständig Konfigurationen von
mehrstufigen Client-Server-Architekturen. WebSTATISTICA Server bietet die
Analyse-, Abfrage-, Berichts- und Grafikfunktionen von STATISTICA über eine
einfach zu verwendende, interaktive, standardmäßige Weboberfläche an. Sie wird
als eine komplette, zur Installation bereitstehende Anwendung angeboten, die eine
interaktive, Webbrowser-basierte („Point-and-Click“) Benutzeroberfläche umfasst,
die es Anwendern in entfernten Orten ermöglicht, interaktiv Datensätze zu erstellen,
Analysen auszuführen und Analyseergebnisse zu betrachten. Aufgrund seiner
offenen Architektur umfasst WebSTATISTICA Server jedoch ebenfalls
Development Kit Tools (wobei die gesamten Syntaxkonventionen auf
Industriestandards wie VB Script, C++, HTML, XML basieren), die es einer ITAbteilung ermöglichen, alle Hauptkomponenten des Systems anzupassen oder zu
erweitern, indem neue Komponenten und/oder unternehmensspezifische Analyseoder Datenbankfunktionen hinzugefügt werden. Das System ist mit allen
gebräuchlichen Webserver-Plattformen (z. B. UNIX Apache, Microsoft IIS)
kompatibel, funktioniert in Microsoft .NET- als auch Sun/Java-Umgebungen und
erfordert keine Anpassungen von vorhandenen Firewall- und Internet/IntranetSicherheitssystemen.
Für weitere Informationen siehe Anhang C – WebSTATISTICA, Seite 283.
STATISTICA-Handbuch – 151
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
Wenn Microsoft Office auf dem gleichen Rechner wie STATISTICA installiert ist,
können Excel-Tabellen direkt in STATISTICA geöffnet werden und als
Datenquellen für Analysen verwendet werden, und Berichte können direkt als
Word-Dokumente ausgegeben werden (siehe Beispiel auf Seite 57; siehe auch Seite
165).
STATISTICA kann Excel-Dokumente innerhalb der
STATISTICA-Arbeitsfläche direkt über den Standarddialog zur Dateiauswahl
öffnen. Wenn eine Excel-Arbeitsmappe gewählt wird, erscheint ein Dialog, der die
Optionen zur Verfügung stellt, die Daten in eine standardmäßige STATISTICATabelle zu importieren oder das Dokument in Form einer Excel-Datei
beizubehalten, so dass ein Excel-Fenster innerhalb von STATISTICA aufgerufen
wird.
Wenn das Excel-Dokument geöffnet worden ist, hat man den vollen Zugang zu
allen Menüs und Symbolleisten, die von Excel unterstützt werden. Die
Arbeitsvorgänge wie Bearbeitung/Aktualisierung von Formeln, Änderung von
Formaten, Kopieren/Einfügen, Drag&Drop – also alles, was man üblicherweise
innerhalb einer Excel-Anwendung durchführt – können nun direkt in STATISTICA
ausgeführt werden.
Der wichtigste Vorteil der Excel-Integration besteht darin, dass Excel-Dokumente
direkt als Datenquelle für Analysen verwendet werden können. Hierzu muss
lediglich das Excel-Dokumentfenster im Vordergrund stehen, wenn die Analyse
gestartet wird, so dass die Analyse sich automatisch auf die Daten des ExcelDokuments bezieht. Beim Start der Analyse ruft STATISTICA einen Dialog auf, in
dem festgelegt werden kann, welcher Bereich des Excel-Dokuments als Datenquelle
dienen soll und ob eine bestimmte Zeile oder Spalte für die Variablen- oder
Fallnamen verwendet werden soll. Diese Einstellungen werden dem ExcelDokument zugewiesen, so dass sie nur ein einziges Mal festgelegt werden müssen.
STATISTICA kann eine Excel-Datei nicht nur als Datenquelle verwenden, sondern
auch die Funktion automatische Aktualisierung für diese Dateien verwenden. Wenn
aus dem Grafik-Menü eine Grafik mit der Eigenschaft automatischer Aktualisierung
erzeugt wird, führen Datenänderungen in der Excel-Datei, entweder durch Eingabe
neuer Daten oder veränderter Formeln, auch zu einer aktualisierten Grafik.
152 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
Es können ebenfalls Word-Dokumente
innerhalb von STATISTICA geöffnet und bearbeitet werden. Word-Dokumente
können mittels des Standarddialogs zur Dateiauswahl geöffnet werden. Wenn eine
statistische Analyse durchgeführt wird oder eine Grafik erzeugt wird, kann die
Ausgabe in ein Word-Dokument gelenkt werden. Jede beliebige Ausgabe, die in
einen STATISTICA-Bericht gesendet werden kann, kann auch in einem WordDokument ausgegeben werden.
Analog zu dem Excel-Fenster enthält auch das Word-Fenster alle Symbolleisten
und Menüs, die innerhalb der Word-Anwendung aufgerufen werden. Es können
demnach innerhalb von STATISTICA alle Formatierungen und Bearbeitungen des
Word-Dokuments durchgeführt werden, die von Word unterstützt werden.
Wenn eine Tabelle mit Analyseergebnissen an Word gesendet wird, kann
STATISTICA die Vorteile der Microsoft Word-Tools zur Tabellenbearbeitung
nutzen, wobei die Ergebnistabelle in das entsprechende Format konvertiert wird.
Bei mehrseitigen Tabellen kann der Zeilen- bzw. Spaltenumbruch kontrolliert
werden. Spalten, welche die Seitenbreite überschreiten, werden umgebrochen. Für
jedes (zusammenhängende) Spaltenset werden zunächst alle Zeilen vollständig
abgebildet, bevor das (einem Umbruch) folgende Spaltenset dargestellt wird. Diese
Lösung ermöglicht die Präsentation dieser Tabellen in Word (inklusive der
Möglichkeit, die Tabelle dort zu bearbeiten) und zeigt den gesamten Inhalt der
Tabelle korrekt an. Zusätzlich wird eine einwandfreie Druckausgabe sowie
Seitennummerierung gewährleistet.
STATISTICA-Handbuch – 153
Copyright © StatSoft, 2009
KAPITEL 4: BENUTZEROBERFLÄCHE
154 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
Im Verlaufe von Analysen erzeugt STATISTICA Ausgaben in Form von
multimediafähigen Tabellen und Grafiken. Es existieren grundsätzlich fünf Kanäle,
in die alle Ausgaben gelenkt werden können:
1. STATISTICA-Arbeitsmappen (Seite 158)
2. Einzelfenster (Seite 160)
3. Berichte (Seite 162)
4. Microsoft Word (Seite 165)
5. Das Web (Seite 167)
Die vier erstgenannten Ausgabekanäle werden hierbei über den Optionen des
Ausgabemanagers (erreichbar über Ausgabemanager im Menü Datei, siehe Seite 23
für weitere Details zum globalen Ausgabemanager im Dialog Optionen und dem
Dialog Analyse/Grafik Ausgabemanager). Zusätzlich gibt es eine Vielzahl von
Möglichkeiten, die Ausgabe ins Web zu publizieren, abhängig von der verwendeten
STATISTICA-Version.
Die Ausgabekanäle lassen sich in vielen Kombinationen verwenden (z. B. eine
Arbeitsmappe und ein Bericht gleichzeitig) und können auf verschiedene Weisen
angepasst werden. Alle in die einzelnen Kanäle ausgegebenen Objekte (Tabellen
und Grafiken) können wiederum andere eingebettete und verknüpfte Objekte
enthalten, so dass die Ausgabe in STATISTICA hierarchisch organisiert werden
kann. Jeder dieser Ausgabekanäle von STATISTICA hat seine besonderen Vorteile,
die in den folgenden Abschnitten beschrieben werden. Ein noch umfangreicherer
STATISTICA-Handbuch – 157
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Überblick zu den einzelnen Dokumenttypen, die mit den entsprechenden
Ausgabekanälen verbunden sind, folgt in dem nächsten Kapitel (Seite 183).
Alle
STATISTICA-Dokumente (d. h. Eingabetabellen, Arbeitsmappen, Berichte und
Makros), die über einen längeren Zeitraum Ergebnisse Ihrer Analyse ansammeln
(z. B. Dateneingabe, -bearbeitung oder Ausgaben), unterstützen die
Programmeigenschaft Automatisch speichern, die über das Register Allgemein des
Dialogs Optionen konfiguriert werden kann (erreichbar über Optionen im Menü
Extras). Diese Einrichtung speichert den Inhalt Ihrer Analyse automatisch (z. B. alle
10 Minuten) und gibt Ihnen damit die Option, Daten wiederzugewinnen, die
andernfalls bei einem Stromausfall oder Systemfehler verloren gehen könnten.
Arbeitsmappen stellen die Standardform der Ausgabe dar (weitere Information
siehe Seite 185). Jedes Ausgabedokument (z. B. eine STATISTICA-Tabelle oder
Grafik, aber auch ein Dokument aus Microsoft Word oder Excel) wird als ein
Eintrag in der Arbeitsmappe gespeichert.
Dokumente können in Hierarchien von Ordnern oder Dokumentknoten (per
Voreinstellung wird einer für jede neue Analyse erzeugt) organisiert werden. Über
eine Baumansicht lassen sich einzelne Dokumente, Ordner oder ganze Zweige des
Baumes flexibel verwalten.
158 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Beispielsweise können Gruppen von Dokumenten (mit Ziehen-und-Ablegen) in das
Berichtsfenster oder den Arbeitsbereich der Anwendung kopiert oder verschoben
werden. Letzteres bedeutet, dass sie auf dem STATISTICA-„Hintergrund“ in
Einzelfenstern angezeigt werden. Ganze Zweige lassen sich in andere
Arbeitsmappen einfügen, um spezifische Ordnerstrukturen zu generieren.
Technisch gesehen sind Arbeitsmappen Container für ActiveX-Dokumente (siehe
Seite 257 oder das Elektronische Handbuch für Information über die ActiveXTechnologie). Arbeitsmappen sind mit vielen fremden Dateiformaten kompatibel
(z. B. Microsoft Office-Dokumenten), die in Arbeitsmappen eingefügt und von dort
aus editiert werden können.
Arbeitsmappen bieten mächtige Optionen zur effizienten Verwaltung selbst extrem
großer Ausgabemengen und stellen für Anfänger wie auch für erfahrene Anwender
die beste Methode zur Verwaltung der Ausgabe dar. Auf den ersten Blick mag es
nachteilig erscheinen, dass Benutzerkommentare (z. B. Hinweise) und zusätzliche
Informationen nicht transparent in den „Strom“ der Arbeitsmappenausgabe
eingefügt werden können, wie es in Berichten im Textverarbeitungsstil (z. B. einem
STATISTICA-Bericht; siehe übernächsten Abschnitt) möglich ist. Allerdings sollte
man dabei Folgendes berücksichtigen:

Alle STATISTICA-Dokumente können leicht mit Anmerkungen versehen
werden, sowohl a) direkt durch Eingabe von Text in Grafiken, Tabellen und
Berichten, als auch b) indirekt durch Eingabe von Bemerkungen in das Feld
Kommentar im Dialog Dokumenteigenschaften (aufzurufen über das Menü Datei
- Eigenschaften)

Formatierte Dokumente mit Bemerkungen und Hinweisen (z. B. in Form von
Textdateien, STATISTICA-Berichtsdokumenten, WordPad- oder
Textverarbeitungsdokumenten) lassen sich an beliebige Positionen der
hierarchisch organisierten Ausgabe in der Arbeitsmappe platzieren. Zur
Erweiterung der Organisation können Dokumente mit Kommentaren oder
zusammenfassenden Bemerkungen auch als Knoten für Gruppen von
untergeordneten Objekten dienen, auf die sich die Bemerkungen beziehen.
Arbeitsmappen können als
HTML-Dateien gespeichert werden, indem im Menü Datei die Option Speichern
unter gewählt wird und im folgenden Dialog Speichern unter mittels der Option
Webseiten (*.htm; *.html) gespeichert wird. Das Speichern als Webseite erzeugt im
STATISTICA-Handbuch – 159
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
festgelegten Ordner eine HTML-Datei, die mit standardmäßigen Internet-Browsern
(wie z. B. Microsoft Internet Explorer) geöffnet werden kann. Wenn eine
Arbeitsmappe als Webseite gespeichert wird, erzeugt STATISTICA einen
Unterordner, der alle Bilddateien enthält, die in der Webseite verlinkt sind.
Die Ausgabe als Webseite enthält eine HTML-basierte Baumansicht, die
ermöglicht, zwischen den verschiedenen Arbeitsmappen-Bildern zu navigieren.
STATISTICA-Ausgabedokumente können auch direkt in eine Schlange von
Einzelfenstern ausgegeben werden. Die Länge der Fenster-Schlange lässt sich im
Register Ausgabemanager des Dialoges Optionen (im Datei-Menü über
Ausgabemanager erreichbar) einstellen.
160 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Deutlicher Nachteil dieser Ausgabeart ist das Fehlen jeglicher Struktur sowie die
Tendenz, das Anwendungsfenster unübersichtlich zu gestalten (man berücksichtige,
dass einige Prozeduren mit einem einzigen Mausklick Hunderte von Tabellen und
Grafiken erzeugen können).
Einer der Vorteile dieser Ausgabemethode ist, dass man auf bequeme Weise die
Objekte im STATISTICA-Anwendungsfenster individuell anordnen kann (um z. B.
mehrere leicht zu identifizierende „Referenzdokumente“ für den Vergleich mit
neuen Ergebnissen zu erstellen). Um diese Wirkung zu erzielen, muss man jedoch
diese Ausgabeoption nicht im Voraus konfigurieren und eine große Zahl (oft nicht
gewünschter) Einzelfenster, die den Arbeitsplatz unübersichtlich gestalten können,
generieren. Anstelle dessen können einzelne in die anderen beiden Kanäle
(Arbeitsmappen oder Berichte) gelenkte und dort gespeicherte Ausgabeobjekte bei
Bedarf einfach aus ihrer entsprechenden Baumansicht auf den Arbeitsplatz der
Anwendung gezogen werden.
STATISTICA-Handbuch – 161
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Das ultimative Ziel beim Durchführen einer Analyse besteht darin, eine
aussagekräftige Ergebnisausgabe zu erzeugen, die dazu dient, die Daten zu
verstehen. Die Art und Weise, mit der die Ausgabe erzeugt wird, ist von gleicher
Bedeutung. STATISTICA bietet eine Vielzahl von Methoden, Berichte zu erzeugen,
die den diversen Wünschen der Anwender angepasst sind.
Die Berichte in STATISTICA (kurz auf Seite 194 eingeführt) stellen die eher
traditionelle Weise der Verwaltung von Output dar, in der jedes Objekt (z. B. eine
STATISTICA-Tabelle bzw. -Grafik oder eine Microsoft Excel-Tabelle) sequentiell
in einem Dokument in der Art eines Textverarbeitungsprogramms angezeigt wird.
Allerdings bietet die Technologie hinter diesem einfachen Editor viel
Funktionalität. Z. B. ist der STATISTICA-Bericht wie die im Abschnitt oben
beschriebene Arbeitsmappe auch ein ActiveX-Container (Informationen zur
ActiveX-Technologie finden Sie auf Seite 257 und im Elektronischen Handbuch),
in dem jedes Objekt (nicht nur STATISTICA-Tabellen und Grafiken, sondern auch
jedes andere ActiveX-kompatible Dokument wie beispielsweise Excel-Tabellen)
aktiv bleibt und deshalb angepasst und von dort aus editiert werden kann.
Die offensichtlichen Vorteile dieser Art der Ausgabebehandlung sind zum einen die
Möglichkeit, Bemerkungen und Kommentare „zwischen“ den Objekten einzufügen.
Zum anderen kann die Ausgabe auf traditionelle Weise schnell durchblättert und
162 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
betrachtet werden, so wie es viele Benutzer gewohnt sind (der Editor unterstützt
unterschiedliche Geschwindigkeiten beim Durchblättern und andere Eigenschaften
der IntelliMouse). Darüber hinaus beinhaltet nur der Ausgabebericht ein
detailliertes Protokoll über alle spezifizierten Optionen wie z. B. ausgewählte
Variablen, deren Textwerte und Lange Namen. Der Umfang dieses Protokolls lässt
sich hierbei mittels des im Register Ausgabemanager des Dialoges Optionen (im
Datei-Menü über Ausgabemanager erreichbar) gewählten Grad der
Informationstiefe regeln (siehe Seite 24).
Offensichtlicher Nachteil dieser traditionellen Berichte ist jedoch die durch den
Formatstil einer Textverarbeitung auferlegte innewohnende flache Struktur,
wenngleich dies von einigen Nutzern oder Anwendungen bevorzugt werden mag.
Wenn eine STATISTICA-Arbeitsmappe geöffnet wurde, welche die Ergebnisse der
Analyse enthält, besteht wohlmöglich der Wunsch, diese in einen Bericht zu
transferieren.
Die Vorteile für diese Vorgehensweise liegen darin, dass den Objekten Hinweise
und Kommentare beigefügt werden können. Außerdem wird ein schnelles Scrollen
durch die Ergebnisse ermöglicht, an das sich einige Anwender gewöhnt haben
dürften. Darüber hinaus enthält nur der Bericht eine Aufzeichnung der zusätzlichen
Informationen (siehe oben).
Öffnen Sie eine STATISTICA-Arbeitsmappe. Wenn bislang keine Arbeitsmappe
gespeichert wurde, kann eine neue erstellt werden: Überprüfen Sie zunächst, dass
im Ausgabemanager (im Datei-Menü über Ausgabemanager erreichbar) die Option
Arbeitsmappen gewählt ist. Erstellen Sie dann eine Arbeitsmappe anhand Beispiel
1: Korrelationen (Seite 11) oder Beispiel 2: ANOVA (Seite 34).
Wählen Sie hierzu in einer geöffneten Arbeitsmappe alle Dateien aus, d. h., wählen
Sie die erste Datei, drücken Sie die UMSCHALT-Taste auf Ihrer Tastatur, und wählen
Sie dann die letzte Datei aus. Klicken Sie anschließend die Schaltfläche Zum
Bericht, die sich in der Symbolleiste befindet. Alle Dateien der Arbeitsmappe
werden somit in einem STATISTICA-Bericht dupliziert.
STATISTICA-Handbuch – 163
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
RTF (Rich Text Format) ist eine Standardmethode von Microsoft zur Kodierung
von formatiertem Text/Grafik für einen vereinfachten Transfer zwischen
verschiedenen Anwendungen. Wenn Berichte im Rich Text Format (*.rtf)
gespeichert werden, werden alle Dateiformatierungen beibehalten, so dass sie von
anderen RTF-kompatiblen Anwendungen (z. B. Word) gelesen und interpretiert
werden können.
Das Format STATISTICA-Berichtsdateien (*.str) folgt den RTF-Konventionen. Das
Speichern in dem voreingestellten STATISTICA-Berichtsformat stellt jedoch sicher,
dass Berichte mittels STATISTICA geöffnet werden, so dass man den vollen Zugriff
auf den Berichtsbaum erhält.
Um einen STATISTICA-Bericht in einer anderen RTF-kompatiblen Anwendung zu
öffnen, öffnen Sie den Bericht, und wählen Sie Speichern unter aus dem Menü
Datei, um den Dialog Speichern unter aufzurufen. Wählen Sie unter Option Dateityp
das Format Rich Text Files (*.rtf), geben Sie in dem Feld Dateiname den
gewünschten Namen ein, und klicken Sie die Schaltfläche Speichern. Diese Datei
kann in jeder beliebigen RTF-kompatiblen Anwendung geöffnet werden.
PDF ist die Abkürzung für das Portable Document Format. Dieses Format ist der
Industriestandard zum Speichern von Text- und Grafikdaten. PDF bietet eine
reichhaltige grafische Aufmachung und Struktur, die dieses Format besonders für
den Zweck einer Präsentation ideal erscheinen lässt. Darüber hinaus können PDFDokumente im Bild- und Textmodus angeschaut werden, d. h., dass man wählen
kann, ob Daten als formatiertes Bild oder als regulärer Text erscheinen sollen.
PDF ist unabhängig von der Plattform und die meisten Betriebssysteme bieten frei
verfügbare Anwendungen zur Ansicht von PDF-Dateien (z. B. Adobe Acrobat
Reader für Windows und Ghostscript für Linux).
PDF wird als akzeptables Speicherformat im Zusammenhang mit Regulierungen
wie der Richtlinie FDA 21 CFR Part 11 angesehen.
Um einen STATISTICA-Bericht als PDF-Datei zu speichern, öffnen Sie den Bericht
und wählen anschließend im Menü Datei den Befehl Speichern als PDF. Der Dialog
Ausgabeoptionen wird aufgerufen, in dem festgelegt werden kann, ob Tabellen als
164 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Objekte (wobei die Objektgröße der im Berichtsfenster entspricht) oder Ganzseitige
Tabellen (auf separaten Seiten) ausgegeben werden sollen. Wenn die Tabellen stets
in gleicher Weise ausgegeben werden sollen, aktivieren Sie das Kontrollkästchen
Aktuelle Einstellungen verwenden und diesen Dialog nicht wieder anzeigen . Klicken
Sie die Schaltfläche OK, um den Dialog Ausgabeoptionen zu schließen, so dass der
Dialog Speicher Bericht als PDF erscheint. Verwenden Sie das Feld Speichern in,
um den passenden Zielordner für das zu speichernde Dokument zu wählen. Geben
Sie in dem Feld Dateiname einen Namen ein, und klicken Sie die Schaltfläche
Speichern. STATISTICA-Berichte, Tabellen und Grafiken können alle als PDFDatei gespeichert werden.
Es ist zu beachten, dass dies keine vereinfachten PDF-Dateien (mit komprimierten
Bitmaps der entsprechenden Dokumentseiten-Bilder) sind, sondern PDF-Dateien,
die alle Funktionalitäten unterstützen, wie z. B. das selektive Kopieren von Text.
STATISTICA ermöglicht ebenfalls die direkte Ausgabe als Word-Dokument, die
mittels der Office-Integration realisiert wird. Wenn Word innerhalb STATISTICA
geöffnet wird, werden Word-Symbolleisten und -Menüs aufgerufen, was mittels der
standardmäßigen Schnittstellentechnologie für ActiveX-Dokumente realisiert wird.
In STATISTICA können somit alle Formatierungen und Bearbeitungen der Datei
durchgeführt werden, die von Word unterstützt werden.
Wenn eine Tabelle mit Analyseergebnissen an Word gesendet wird, kann
STATISTICA die Vorteile der Microsoft Word-Tools zur Tabellenbearbeitung
nutzen, wobei die Ergebnistabelle in das entsprechende Format konvertiert wird.
Bei mehrseitigen Tabellen kann der Zeilen- bzw. Spaltenumbruch kontrolliert
werden. Spalten, welche die Seitenbreite überschreiten, werden umgebrochen. Für
jedes (zusammenhängende) Spaltenset werden zunächst alle Zeilen vollständig
abgebildet, bevor das (einem Umbruch) folgende Spaltenset dargestellt wird. Diese
Lösung ermöglicht die Präsentation dieser Tabellen in Word (inklusive der
Möglichkeit, die Tabelle dort zu bearbeiten) und zeigt den gesamten Inhalt der
Tabelle korrekt an. Zusätzlich wird eine einwandfreie Druckausgabe sowie
Seitennummerierung gewährleistet.
STATISTICA-Handbuch – 165
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Wie bei standardmäßigen STATISTICA-Berichten (siehe Seite 162) können WordDokumente die zusätzliche Information (z. B. Variablenauswahl, lange
Variablennamen usw.) speichern.
Um die Ausgabe an ein Word-Dokument zu senden, verwenden Sie die Optionen
im Ausgabemanager (aufrufbar über Ausgabemanager im Menü Datei oder über
Optionen im Menü Extras, indem dann das Register Ausgabemanager des Dialogs
Optionen gewählt wird). In dem Feld Microsoft Word Ausgabe stehen folgende
Optionen zur Verfügung: Mehrere Word-Dokumente (für jede Analyse/Grafik),
Gemeinsames Word-Dokument (für alle Analysen/Grafiken) oder [Datei auswählen],
um ein bereits bestehendes Word-Dokument auszuwählen.
Obwohl Word-Dokumente nicht die Baumansicht einer STATISTICA-Arbeitsmappe
oder eines STATISTICA-Berichts zur Verfügung stellen, bietet die Ausgabe in
Word-Dokumente viele Vorteile. Durch das Senden der Ergebnisse in ein WordDokument erhält man Zugriff auf alle Funktionalitäten von Word, das Dokument
weiterzubearbeiten. Zum Beispiel können Vorlagen verwendet werden, um
benutzerangepasste Dokumente zu erstellen; eine Inhaltsangabe oder ein
Inhaltsverzeichnis können hinzugefügt werden, die Option „Änderungen verfolgen“
kann verwendet werden usw.
Wenn eine große Tabelle in ein Word-Dokument eingefügt werden soll, erkennt
STATISTICA automatisch, wie viele Variablen auf die einzelnen Seiten passen, so
dass die Tabelle in mehrere Word-Tabellen unterteilt wird. Wenn die Tabelle
Fallnamen verwendet, werden diese Namen jeweils in der ersten Spalte der
jeweiligen Tabelle aufgeführt.
Das Senden der Ergebnisse in ein Word-Dokument bietet zusätzliche Vorteile wie
z. B. die zusätzliche Druckoptionen (Ausgabe in Datei und Manuell duplex) und die
Möglichkeit, die Ergebnisse als Webseiten abzuspeichern.
Es mag nützlich erscheinen, einen STATISTICA-Bericht oder eine Arbeitsmappe im
Internet zu publizieren, so dass die Ergebnisse begutachtet werden können. Mit
STATISTICA ist es nun möglich, Berichte und Arbeitsmappen im HTML-Format
abzuspeichern. HTML ist die Abkürzung für Hypertext Markup Language. HTML
verwendet Tags zur Kennzeichnung der verschiedenen Elemente eines Dokuments,
wie z. B. Text oder Grafiken.
166 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Wählen Sie nach dem Öffnen eines Berichts oder einer Arbeitsmappe aus dem
Menü Datei den Befehl Speichern unter, um den Dialog Speichern unter aufzurufen.
Wählen Sie in der Liste Dateityp den Eintrag HTML-Dateien (*.html; *.htm), um die
Datei im HTM-Format abzuspeichern.
Alle Grafiken des Berichts oder der Arbeitsmappe werden in dem Ordner der HTMDatei als *.png-Dateien abgespeichert, wobei folgende Bezeichnungen verwendet
werden: reportname_pict0001.png, reportname_pict0002.png usw. Alternativ
können die Grafiken als JPG-Dateien abgespeichert werden. Um dies zu
bewerkstelligen, muss im Menü Extras der Eintrag Optionen gewählt werden, so
dass der Dialog Optionen aufgerufen wird. Wählen Sie das Register Berichte bzw.
Arbeitsmappen, abhängig davon welches Dokument Sie als .htm-Dokument
speichern möchten. Wählen Sie dort im Rahmen Grafiken in HTML als die Option
JPEG-Format und anschließend die Schaltfläche OK.
WebSTATISTICA bietet mit dem Knowledge Portal eine weitere Möglichkeit,
Berichte zu publizieren. Das Knowledge Portal ermöglicht die Publikation von
STATISTICA-Dokumenten (Tabellen, Grafiken, Berichte oder Arbeitsmappen) über
das Internet. Anwender mit beschränkten Knowledge-Portal-Rechten können dann
diese Dokumente betrachten. Mit den Standardwerkzeugen des WebSTATISTICA
Repository lassen sich dann die Rechte für Dokumente und Verzeichnisse setzen, so
dass kontrolliert werden kann, wer Zugriff auf die Dokumente erhält.
Um Inhalte im Knowledge Portal zu veröffentlichen, muss zunächst im
WebSTATISTICA Repository ein Verzeichnis im Ordner Portal angelegt werden.
Melden Sie sich in WebSTATISTICA als Benutzer mit Administratorrechten an, und
wählen Sie im Menü Datei den Befehl My Directory Operations, um den Dialog
WebSTATISTICA My Directory aufzurufen. Die Verzeichnisstruktur dieses Dialoges
wird der der folgenden Abbildung ähneln.
STATISTICA-Handbuch – 167
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Um einen Ordner im Verzeichnis Portal zu erstellen, der die Berichte beinhalten
soll, wählen Sie den Ordner Portal, und klicken dann die Schaltfläche Create, um
den Dialog Explorer User Prompt aufzurufen. Geben Sie in dem Eingabefeld den
Verzeichnisnamen Sample Portal Folder ein, und bestätigen Sie mit OK. Ein Dialog
wird aufgerufen, der bestätigt, dass das Verzeichnis /Portal/Sample Portal Folder
erstellt wurde. Klicken Sie die Schaltfläche Show My Directory, so dass Sie zum
Dialog My Directory zurückkehren. Aktivieren Sie das Kontrollkästchen Show
Empty Directories, und klicken Sie anschließend die Schaltfläche Refresh. Öffnen
Sie das Verzeichnis Portal, indem Sie auf das angrenzende Pluszeichen klicken,
so dass der neue Ordner Sample Portal Folder in der Übersicht angezeigt wird.
168 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Die Lese- und Schreibrechte des Ordners lassen sich verwalten, indem in der
Übersicht der Ordner Sample Portal Folder markiert wird und dann die
Schaltfläche Security gewählt wird. Ihnen stehen dann die WebSTATISTICAOptionen zur Verfügung, die angemessenen Benutzer- und Gruppenrechte zu
definieren.
Nachdem der Ordner nun erstellt wurde, können Sie dort Analyseergebnisse
einfügen, so dass diese für Portal-Anwender mittels WebSTATISTICA oder
STATISTICA einsehbar sind.
Starten Sie in WebSTATISTICA eine gewöhnliche Analyse. Wählen Sie im
WebSTATISTICA-Menü File den Befehl Open Data Spreadsheet. Wählen Sie dann
im Dialog Select Data Source in dem Fenster auf der linken Seite den Ordner
Datasets und im Fenster auf der rechten Seite die Datei Adstudy.sta, und bestätigen
Sie mit OK.
Schließen Sie das dadurch aufgerufene Fenster des WebSTATISTICA Spreadsheet
Editor (da es in diesem Beispiel nicht benötigt wird), so dass lediglich das
Browserfenster geöffnet bleibt, das die Information zur Active Data source der
Datei Adstudy.sta darstellt.
STATISTICA-Handbuch – 169
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Wählen Sie aus dem WebSTATISTICA-Untermenü Statistics - Basic Statistics and
Tables den Befehl Descriptive Statistics, um den Dialog Descriptive Statistics und
den Dialog zur Variablenauswahl aufzurufen. Wählen Sie im Dialog zur
Variablenauswahl unter Continuous variables die Variablen MEASURE01 und
MEASURE02. Wählen Sie im Dialog Descriptive Statistics unter Detail of computed
results reported die Option All results.
170 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Klicken Sie OK, um die Ergebnisse dieser Analyse aufzurufen, die aus mehreren
Tabellen und Grafiken bestehen.
Bevor Sie diese Seite über das Knowledge Portal publizieren, möchten Sie eventuell
die Objekte neu anordnen oder mit Kommentaren versehen. Klicken Sie hierzu die
Schaltfläche Edit Page, die sich am oberen Rand dieser Seite befindet. Dies öffnet
den Knowledge Portal Interactive Results Editor.
STATISTICA-Handbuch – 171
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
In dem Fenster auf der linken Seite des Editors sind die Objekte aufgelistet, die in
der Ergebnisseite aufgeführt werden. In diesem Fall sind es drei Tabellen und vier
Grafiken. In dem Fenster auf der rechten Seite wird der Inhalt der Ergebnisseite
dargestellt. Das Anfangsobjekt in diesem Fenster ist die Fläche Remaining Items
Place Holder. Dies bedeutet, dass alle Elemente, denen kein eindeutiger Platz
zugewiesen wurde, hier aufgelistet werden. Da dies momentan das einzige Objekt
in diesem Fenster ist, bedeutet dies, dass die drei Tabellen und vier Grafiken in der
Ausgabe exakt wie in der ursprünglichen Ergebnisseite dargestellt werden.
In diesem Beispiel sollen lediglich Graph2 und Spreadsheet 3, genau in dieser
Reihenfolge, in den Ergebnissen aufgeführt werden. Wählen Sie in dem Fenster auf
der rechten Seite zunächst das Objekt Remaining Items Place Holder, und entfernen
Sie es, so dass diese Seite kein einziges Objekt mehr enthält. Wählen Sie in der
Liste auf der linken Seite das Objekt Graph2, und klicken Sie die Schaltfläche Insert
Item, um die Grafik auf der Seite einzufügen. Um als Nächstes die Tabelle zu
platzieren, müssen Sie unterhalb der Grafik klicken, so dass das nächste Element an
diesem Markierungspunkt eingefügt wird. Wählen Sie nun in der Liste das Objekt
Spreadsheet3, und klicken Sie auf die Schaltfläche Insert Item. Hierdurch wird die
Tabelle unterhalb der Grafik platziert. Beachten Sie hierbei, dass die Elemente, die
in der Ergebnisseite aufgenommen werden, in der Objektliste entsprechend markiert
werden.
172 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Fügen Sie als Nächstes ein Kommentar zwischen den beiden Objekten ein.
Platzieren Sie hierzu den Cursor in der Seitenansicht zwischen den beiden
Objekten, und tippen Sie folgenden Text ein: This is Frequency Table results of
MEASURE02 from. Um Schriftart und Schriftgrad zu ändern, markieren Sie den
Text, den Sie gerade eingegeben haben, und klicken in der Symbolleiste die
Schaltfläche A. Wählen Sie Schriftschnitt Bold und einen Schriftgrad von 24, und
bestätigen Sie mit OK.
STATISTICA-Handbuch – 173
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Zusätzlich kann man vordefinierte Tags für diese Analyse einfügen. Dies umfasst
alle Parameter des Parameterdialogs sowie Tags für das aktuelle Datum, die
aktuelle Uhrzeit, den aktuellen Benutzer und den Namen der Datenquelle. Klicken
Sie in der Symbolleiste des Knowledge Portal Interactive Results Editor auf die
Schaltfläche Variables, um auf die Tags zuzugreifen. In der darunterliegenden Liste
werden dann die Tags aufgelistet, die eingefügt werden können. Platzieren Sie den
Cursor am Ende des Textes, den Sie gerade eingegeben haben. Wählen Sie das Tag
SWS_DataSource, und klicken Sie die Schaltfläche Insert Variable. Somit wird an
der momentanen Cursorposition der Name der Datenquelle eingefügt.
174 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Das Tag ist eine spezielle Markierung, die nicht den tatsächlichen Namen der
Datenquelle im Editor wiedergibt, der Name der Datenquelle wird allerdings
außerhalb des Editor angezeigt. Um eine Vorschau der Seite zu erhalten, können Sie
die Schaltfläche Preview wählen. Klicken Sie die Schaltfläche Save, um die
modifizierte Seite abzuspeichern. Die Mitteilung Save Succeeded wird angezeigt.
Schließen Sie diese Nachricht mit OK und anschließend den Knowledge Portal
Interactive Results Editor. Die ursprüngliche Seite wurde aktualisiert, so dass sie die
gerade durchgeführten Änderungen beinhaltet.
STATISTICA-Handbuch – 175
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Um die Seite nun zu veröffentlichen, so dass andere Anwender sie über das
Knowledge Portal betrachten können, muss die Schaltfläche Publish gewählt
werden, die sich in der oberen rechten Ecke des Fensters befindet. Nach dem
Klicken der Schaltfläche erscheint der Dialog Publish Destination. Wählen Sie hier
den Ordner Sample Portal Folder, der zuvor erstellt wurde. Darüber hinaus können
Sie auch die Zugriffsrechte auf diese Seite separat festlegen, indem Sie das
Kontrollkästchen I want to define who can access this output page aktivieren.
Lassen Sie für dieses Beispiel das Kontrollkästchen deaktiviert, so dass die
176 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Zugriffsrechte des Ordners Sample Portal Folder für dieses Dokument
übernommen werden.
Klicken Sie die Schaltfläche Next, so dass diese Seite in dem gewählten Zielordner
abgespeichert wird.
Wenn sich nun Anwender in das Knowledge Portal einloggen, wird der neue
Ordner Sample Portal Folder in deren Browser dargestellt, über den Sie die neu
hinzugefügte Seite Descriptive Statistics aufrufen können.
STATISTICA-Handbuch – 177
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Mit der Integration von WebSTATISTICA innerhalb der STATISTICADesktopversion können STATISTICA-Dokumente (Tabellen, Grafiken, Berichte und
Arbeitsmappen) auch direkt aus STATISTICA in das Knowledge Portal publiziert
werden.
Der erste Schritt besteht hierin in der Aktivierung der WebSTATISTICA-Integration.
Wählen Sie im STATISTICA-Menü Extras den Befehl Optionen, um den Dialog
Optionen aufzurufen. Wählen Sie das Register Server / Web, in dem die URL des
WebSTATISTICA-Servers festgelegt wird (optional auch benutzerdefinierte
Konfigurationseinstellungen, die während der WebSTATISTICA-Installation vom
Systemadministrator festgelegt wurden). In der folgenden Abbildung wurde
WebSTATISTICA auf serverx23 installiert. Abhängig davon, wo WebSTATISTICA
in Ihrem Netzwerk installiert wurde, wird die Information in Ihrem Dialog von der
Abbildung abweichen.
178 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Nachdem der Dialog Optionen mittels der Schaltfläche OK geschlossen wurde,
erscheint in der STATISTICA-Menüleiste das Menü Server. Wählen Sie im Menü
Server den anfangs einzig verfügbaren Befehl Log In. Falls Sie die integrierte
Anmeldung aktiviert haben (und Ihr Windows-Benutzerkonto für WebSTATISTICA
aktiviert wurde), werden Sie automatisch eingeloggt. Andernfalls erscheint ein
Dialog, in dem der WebSTATISTICA-Benutzername und das Passwort abgefragt
werden. Nachdem Sie eingeloggt sind, werden die anderen Befehle im Server-Menü
verfügbar.
Im Folgenden wird eine Analyse durchgeführt, und die Ergebnisse werden
anschließend in das Knowledge Portal hochgeladen. Öffnen Sie die Datei
Adstudy.sta, indem Sie im Menü Datei den Befehl Beispieldateien öffnen wählen.
Führen Sie hierzu im Dialog STATISTICA-Daten öffnen auf dem Ordner Datasets und
auf der Datei Adstudy.sta jeweils einen Doppelklick aus. Wählen Sie im Menü
Statistik den Befehl Elementare Statistik, um das Startmenü Elementare Statistik und
Tabellen aufzurufen, und wählen Sie dort Deskriptive Statistik.
Klicken Sie OK, um den Dialog Deskriptive Statistik aufzurufen.
STATISTICA-Handbuch – 179
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Um sicherzustellen, dass alle Ergebnisse dieser Analyse in einer Arbeitsmappe
ausgegeben werden, klicken Sie auf der rechten Seite des Dialoges die Schaltfläche
Optionen und in der dadurch aufgerufenen Liste den Befehl Ausgabe. Stellen Sie
sicher, dass im Analyse/Grafik Ausgabemanager innerhalb des Rahmens Alle
Ergebnisse (Tabellen, Grafiken) in: die Option Arbeitsmappen gewählt ist. Klicken
Sie dann OK, um zum Dialog Deskriptive Statistik zurückzukehren.
Klicken Sie die Schaltfläche Variablen, um den Standarddialog zur
Variablenauswahl aufzurufen, und wählen Sie dort die Variablen MEASURE01 und
MEASURE02. Klicken Sie anschließend OK, um zum Dialog Deskriptive Statistik
zurückzukehren, und wählen Sie im Register Standard die Schaltfläche Zusf.:
Statistiken, so dass die Ergebnisse in einer Arbeitsmappe ausgegeben werden. Der
Dialog Deskriptive Statistik wird minimiert, so dass die Ergebnisse im Vordergrund
stehen. Rufen Sie den Dialog erneut auf, indem Sie in der Analyseleiste auf die
Schaltfläche Deskriptive Statistik klicken. Wählen Sie nun die Schaltfläche
Histogramme, um für jede einzelne der gewählten Variablen Histogramme zu
erstellen. Der Analysedialog wird hierbei erneut minimiert, und die Arbeitsmappe
sollte wie folgt aussehen.
180 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
Dies ist das Dokument, dass im Knowledge Portal veröffentlicht werden soll.
Wählen Sie im Menü Server den Befehl Save As. Der Dialog WebSTATISTICA
Repository wird aufgerufen, der eine Liste von Ordnern enthält, auf die Sie von
WebSTATISTICA aus verweisen können. Öffnen Sie den Ordner Portal und den
Unterordner Sample Portal Directory, und klicken Sie die Schaltfläche OK. Dies
lädt die Arbeitsmappe in das Verzeichnis des Knowledge Portal hoch.
Sie können das Dokument von STATISTICA aus betrachten, indem Sie innerhalb
des STATISTICA-Fensters den Browser öffnen. Wählen Sie im Menü Server den
Befehl Open In Browser, so dass ein neues Browserfenster geöffnet wird. Loggen
Sie in WebSTATISTICA ein, und wählen Sie im WebSTATISTICA-Menü Datei den
Befehl My Directory Operations. Unter My Directory können Sie zum Sample Portal
Directory navigieren, und die Datei Workbook1.stw betrachten, die soeben
hochgeladen wurde. Wählen Sie diese Datei, und klicken Sie die Schaltfläche View,
so dass die Arbeitsmappe innerhalb des Browsers geöffnet wird.
STATISTICA-Handbuch – 181
Copyright © StatSoft, 2009
KAPITEL 5: AUSGABE VON ERGEBNISSEN
182 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
184 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
Arbeitsmappen (ab Seite 158 kurz erläutert) sind der voreingestellte Weg zur
Handhabung der Ausgabe. Sie legen für jedes Ausgabedokument (z. B. ein
STATISTICA-Datenblatt und eine Grafik oder ein Dokument von Microsoft Word
oder Excel) ein Register an.
Technisch gesehen sind STATISTICA-Arbeitsmappen optimierte ActiveX-Container
(siehe Seite 257), die in effizienter Weise eine große Anzahl von Dokumenten
handhaben können. Die Dokumente lassen sich in hierarchischen Ordnern oder
Dokumentenknoten (per Voreinstellung wird für jede neue Analyse ein Knoten
erstellt) als Baum organisieren, in dem individuelle Dokumente, Ordner oder ganze
Zweige flexibel gehandhabt werden können.
STATISTICA-Handbuch – 185
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
Eine Auswahl von Dokumenten lässt sich beispielsweise in das Berichtsfenster
(z. B. durch Ziehen-und-Ablegen oder Verschieben) oder in den
Anwendungsbereich (d. h. in den Anwendungshintergrund von STATISTICA, wo sie
dann als Einzelfenster erscheinen) extrahieren. Ganze Baumabschnitte lassen sich
auf verschiedene Weisen in andere Arbeitsmappen verschieben, um eine spezielle
Ordnergliederung zu erstellen.
Jede Arbeitsmappe enthält zwei Felder: einen Navigationsbaum im Explorer-Stil
auf der linken Seite und einen Dokumentbetrachter auf der rechten Seite. Der
Navigationsbaum (Arbeitsmappenbaum) lässt sich in viele Knoten untergliedern,
die Dateien in logische Gruppen organisieren (z. B. alle Analyseausgaben oder alle
für ein Projekt generierten Makros). Mit Registern am Rand des
Dokumentbetrachters (Arbeitsmappenbetrachters) können die Dokumente unter
einem ausgewählten Knoten leicht durchsucht werden. Durch Anklicken eines
Registers und Wahl eines anderen Ortes im Kontextmenü lassen sich die Register
der Arbeitsmappe einfach nach oben, rechts oder links versetzen. Ein Vorteil der
Seitenplatzierung der Register liegt im Bereitstellen von mehreren Reihen anstelle
einer langen (wie nachstehend gezeigt). Dadurch wird die Auswahl des gesuchten
Registers erleichtert.
Die Anzeige von Registern kann auch zur Platzersparnis unterdrückt werden.
Anders als bei vielen Navigations- und Organisationsanwendungen im Explorer-Stil
erlaubt die STATISTICA-Arbeitsmappe Töchter für jedes Baumelement. Sie können
beispielsweise ein Datenblatt in der Arbeitsmappe anfügen und danach alle auf
diese Daten bezogenen Grafiken dem Datenblatt als Töchter zuordnen. Eine
Vielzahl von Funktionen für Ziehen-und-Ablegen und die Zwischenablage
unterstützen Sie bei der Gestaltung des Arbeitsmappenbaums.
186 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
Die Arbeitsmappe kann alle mit STATISTICA generierten Dokumente enthalten,
einschließlich Tabellen, Grafiken, Berichte und Makros. Sie kann auch andere
Typen von ActiveX-Dokumenten handhaben, einschließlich Excel-Datenblätter und
Word-Dokumente. Diese Dokumente können über den Arbeitsmappenbetrachter
bearbeitet werden. Um ein Word-Dokument zu bearbeiten, müssen Sie das Objekt
im Baum der Arbeitsmappe anklicken. Das Word-Dokument öffnet sich dann im
Anzeigefenster, und die Menüleiste der Arbeitsmappe verbindet sich mit der
Menüleiste von Microsoft Word, um Ihnen alle erforderlichen
Bearbeitungsfunktionen zugänglich zu machen. Arbeitsmappen lassen sich auch
zum Ablegen aller Ausgaben einer bestimmten Analyse nutzen.
Der Arbeitsmappenbaum stellt die Gliederung der Dateien und Ordner in der
Arbeitsmappe dar. Die Dateien und Ordner werden in einem Format nach ExplorerStil gezeigt. Ein Plus-Zeichen neben Elementen weist auf Ordner oder Dateien mit
zugehörigen Töchtern hin. Zum Aufklappen des Baums für einen bestimmten
Ordner oder eine Datei muss das Plus-Zeichen angeklickt werden. Die
Arbeitsmappe unterstützt eine unbegrenzte Anzahl von Ebenen, und sowohl
individuelle Elemente der Baumansicht als auch ganze Zweige lassen sich flexibel
(interaktiv) handhaben (z. B. Ziehen mit der rechten Maustaste zum Kopieren oder
Verschieben zwischen Arbeitsmappen oder Berichten, wie in der nachstehenden
Abbildung rechts gezeigt).
Um ein Element der Arbeitsmappe zur Anzeige oder Bearbeitung auszuwählen,
führen Sie im Arbeitsmappenbaum einen Doppelklick auf das zugehörige Symbol
STATISTICA-Handbuch – 187
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
aus. Das Dokument wird sich dann im Feld des Arbeitsmappenbetrachters öffnen.
Mit den Steuerungsregistern am Rand des Arbeitsmappenbetrachters können Sie
auch durch die Elemente des ausgewählten Knotens navigieren. Wie bereits
erwähnt, lassen sich diese Steuerungsregister durch Anklicken eines Registers und
Wahl eines anderen Ortes im Kontextmenü einfach nach oben, rechts oder links
versetzen. Register am Kopf oder Fuß des Anzeigers rollen seitlich, während
mehrere Registerreihen beim Platzieren am linken oder rechten Rand erscheinen.
Baumelemente werden durch das angrenzende Symbol identifiziert. Das Symbol
repräsentiert einen Ordner, der mehrere Dokumente und Unterordner enthalten
kann. Das Ordnersymbol
mit einem roten Pfeil zeigt an, dass das Skript, das die
Ergebnisse erzeugt hat, dem Ordner hinzugefügt wurde. Dies ermöglicht
STATISTICA, die Analyse zu wiederholen oder fortzusetzen (für weitere Details
siehe Kapitel 9 – STATISTICA Visual Basic). Die Symbole für
Tabelle,
Bericht,
Makro und
Grafik repräsentieren jeweils STATISTICA Tabellen-,
Berichts-, Makro- und Grafik-Dokumente. Das Symbol Data Miner repräsentiert
ein Data Miner-Projekt.
Alle Nicht-STATISTICA-Dokumente werden durch ihre jeweiligen
Dokumentensymbole repräsentiert. Word-Dokumente beispielsweise werden durch
das
Word-Symbol repräsentiert, und Excel-Tabellen durch das
ExcelTabellen-Symbol.
Der Arbeitsmappenbaum lässt sich mit Ziehen-und-Ablegen oder über die
Menüleiste organisieren und modifizieren (siehe Arbeitsmappe Ziehen-und-Ablegen
und Arbeitsmappe Menüfunktionen im Elektronischen Handbuch). Befehle zum
Einfügen, Extrahieren, Umbenennen und Verschieben von Elementen des
Arbeitsmappenbaums werden im Kontextmenü angeboten (über die rechte
Maustaste überall im Baum aufrufbar).
Diese Befehle werden auch im Menü Arbeitsmappe angeboten.
188 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
STATISTICA-Tabellen (auch Datenblätter genannt) basieren auf der StatSofteigenen Technologie für Multimedia-Tabellen und werden zur Handhabung von
Eingabedaten sowie der numerischen Ausgabe oder Textausgabe (und optional
anderer Ausgabetypen) eingesetzt. Die Grundform des Datenblatts ist eine einfache
zweidimensionale Tabelle, die eine nahezu unbegrenzte Anzahl von Fällen (Zeilen)
und Variablen (Spalten) verwalten kann, wobei jede Zelle eine nahezu unbegrenzte
Anzahl von Zeichen enthalten kann. Klänge, Videos, Grafiken, Animationen,
Berichte mit eingebetteten Objekten oder ActiveX-kompatible Dokumente lassen
sich ebenfalls einfügen.
Da STATISTICA-Tabellen auch Makros und benutzerdefinierte Schnittstellen
enthalten können, lassen sich diese Multimedia-Tabellen als Rahmen für angepasste
Anwendungen nutzen (z. B. mit einem Listenfeld von Optionen oder einer Serie von
Schaltflächen in der oberen linken Ecke), selbstablaufenden Präsentationen,
Animationen, Simulationen, usw.
STATISTICA-Handbuch – 189
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
STATISTICA-Dateien sind in Fällen und
Variablen angeordnet. Wenn Sie mit dieser Bezeichnung nicht vertraut sind, können
Sie Fälle als das Äquivalent von Sätzen in einem Datenbankmanagementprogramm
(oder Zeilen eines Datenblatts) auffassen, und Variablen als Äquivalent von Feldern
(oder Spalten eines Datenblatts). Jeder Fall besteht aus einer Anzahl von
Variablenwerten, und die erste Spalte der Datei enthält (optional) die Fallnamen.
Das Tabellenfenster besteht aus verschiedenen Komponenten:
Die Kopfleiste zeigt den Namen der Tabelle gefolgt von der
Extension (.sta) an. Wenn es sich um eine Eingabetabelle handelt, dann gibt die
190 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
Kopfzeile auch die Anzahl von Variablen und Fällen an (z. B. 25V * 51F). In obiger
Abbildung enthält die Kopfleiste den Text Daten: adstudy.sta (25V * 51F).
Wählen Sie die gesamte Tabelle durch Anklicken des Info-Felds in der
oberen linken Ecke (Mauszeiger ist der übliche Pfeil) des Tabellenfensters aus. Um
das Info-Feld selbst (zur Formatierung) anzuwählen, muss einmal in die obere linke
Ecke des Info-Felds geklickt werden (Mauszeiger ist ein verbreitertes Pluszeichen
). Per Doppelklick in das Info-Feld lässt sich dort Text bearbeiten oder eingeben
(z. B. zusätzliche Einzelheiten zur Tabelle). In obiger Abbildung enthält das InfoFeld den Text Antworten.
Unmittelbar über den Variablenköpfen oben im Fenster lässt sich über
Doppelklick im Kopfbereich Text bearbeiten oder eingeben. Um nur den Titel
anzuwählen (zum Formatieren), klicken Sie einmal in die obere linke Ecke
(Mauszeiger ist ein verbreitertes Pluszeichen ). Drücken Sie STRG+EINGABE oder
ALT+EINGABE, um eine neue Zeile einzugeben (die Höhe des Feldes muss hierbei
erweitert werden, damit die hinzugefügten Zeilen sichtbar werden). In obiger
Abbildung enthält der Titel den Text Studie zur Effektivität von Werbung.
Diese Zellen auf der linken Seite des Fensters enthalten
Informationen für jeden Fall. Per Doppelklick auf einen beliebigen Fallnamen lässt
sich dort Text bearbeiten oder eingeben. Um Fallnamen nur zur Formatierung
anzuwählen, muss einmal in die linke Seite des Fallnamen geklickt werden
(Mauszeiger ist ein verbreitertes Pluszeichen ). Um die gesamte Zeile eines Falls
zur Bearbeitung anzuwählen, muss einmal auf die mittlere oder rechte Seite des
Fallnamens geklickt werden (Mauszeiger ist ein verbreitertes Pluszeichen mit einem
Pfeil
). Um einen Block von Fallnamen (ohne die jeweiligen Zeilen)
auszuwählen, klicken Sie auf der linken Seite eines Fallnamens und ziehen
anschließend den Mauszeiger, so dass alle gewünschten Fallnamen markiert sind.
Zur Veränderung der Feldbreite der Fallnamen führen Sie einen Doppelklick auf die
äußere rechte Seite irgendeines Fallnamen aus (Mauszeiger ist ein Kreuz mit einem
Doppelpfeil ). In obiger Abbildung enthalten die Zellen als Fallnamen
abgekürzte Vornamen sowie die Nachnamen der befragten Personen in der Studie.
Fallnamen sind optional und man kann Sie ausblenden (deaktivieren Sie Fallnamen
anzeigen im Menü Ansicht). Wenn Sie nicht angezeigt werden, erscheinen die
Fallnummern.
Diese Zellen am Spaltenkopf enthalten Informationen für
jede Variable. Zur Anzeige von Details zu einer einzelnen Variablen führen Sie
einen Doppelklick auf die Zelle der Variablennamen aus. Um die Variablennamen
STATISTICA-Handbuch – 191
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
selbst (zur Formatierung) anzuwählen, muss einmal im oberen Bereich der
Variablennamen geklickt werden (Mauszeiger ist ein verbreitertes Pluszeichen ).
Um die gesamte Variablenspalte (zur Bearbeitung) anzuwählen, muss einmal in den
unteren Bereich des Variablennamen geklickt werden (Mauszeiger ist ein
verbreitertes Pluszeichen mit einem Pfeil ). Zur Veränderung der Feldbreite der
Variablennamen doppelklicken Sie auf die äußere rechte Seite des Variablennamens
(Mauszeiger ist ein Kreuz mit einem Doppelpfeil ). In obiger Abbildung
enthalten die ersten beiden Zellen der Variablennamen den Text Geschlecht und
Produkt. Sie haben die Möglichkeit, die Form der Informationsanzeige der
Variablennamen zu verändern, so dass diese die zugehörige Spaltennummer
zusammen mit dem langen Variablennamen und/oder einer Abkürzung des Typs der
Variablen in der Tabelle anzeigt. Jede dieser Optionen ist im Menü Ansicht Variablenüberschrift abrufbar.
Der übrige Bereich der
Tabelle enthält Daten, die zu Fällen und Variablen und optional angefügten oder
verknüpften Objekten (Multimediaobjekte, Makros, angepasste Benutzeroberfläche)
gehören. Texte in Zellen können von nahezu unbegrenzter Länge sein (in den
meisten STATISTICA-Konfigurationen sind sie auf 1.000 Zeichen beschränkt, um
ein unbeabsichtigtes Kopieren von unerwünscht großen Datenmengen in eine Zelle
zu vermeiden). Texte in Zellen lassen sich in vielfacher Weise formatieren,
einschließlich der Schriftarten und Schriftattribute.
STATISTICA erlaubt das Öffnen und den Gebrauch von mehreren Tabellen zur
gleichen Zeit, so dass mit mehreren Eingabetabellen simultan gearbeitet werden
kann. Zusätzlich zum Ablegen von Daten benutzt STATISTICA Tabellen zur
Darstellung der numerischen Ausgabe für die Analysen. Da STATISTICA nicht
zwischen den Funktionen der Eingabetabelle (aus der STATISTICA die Daten
entnimmt) und einer Ausgabetabelle (in der die Analyseergebnisse angezeigt
werden) unterscheidet, lassen sich die Resultate einer Analyse leicht als
Eingabedaten für weitere Analysen verwenden.
Jede neu geöffnete Tabelle wird automatisch als Eingabetabelle behandelt, und eine
beliebige Anzahl von Eingabetabellen kann gleichzeitig geöffnet sein. Eine
Ausgabetabelle (mit den Analyseergebnissen) wird dagegen nicht automatisch
Eingabetabelle. Sie muss vor dem Gebrauch für weitere Analysen zuerst als
192 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
Eingabetabelle gekennzeichnet werden. Außerdem zeigen Eingabetabellen in der
Kopfleiste die Anzahl von Variablen und Fällen für das Datenblatt an. Die Datei
Exp.sta (88V * 48F) ist beispielsweise eine Eingabetabelle, die Datei Exp.sta
dagegen nicht.
Um eine Ausgabetabelle als Eingabetabelle zu erklären, aktivieren Sie das
Datenblatt und wählen Sie im Menü Daten die Option Eingabetabelle. Nun können
Sie mit einer Analyse beginnen, und STATISTICA wird dafür die Daten aus der
speziellen Eingabetabelle entnehmen. Zu beachten ist, dass beim Umschalten auf
ein vorher bereits als Eingabetabelle bezeichnetes Datenblatt jenes ebenfalls weiter
für Analysen benutzt werden kann.
In einer Arbeitsmappe kann nur eine Tabelle zurzeit für Analysen eingesetzt
werden, selbst wenn die Arbeitsmappe mehrere Eingabetabellen enthält. Diese
Tabelle wird als aktive Eingabetabelle bezeichnet, und sein Symbol (im
Arbeitsmappenbaum) ist rot umrahmt. Falls eine Ausgabetabelle als Eingabetabelle
gekennzeichnet wurde, wählt STATISTICA sie automatisch als aktive
Eingabetabelle. Um eine andere Eingabetabelle für die aktive Eingabe auszuwählen,
wird diese mit Als aktive Eingabedatei verwenden im Menü Arbeitsmappe oder im
Kontextmenü des Arbeitsmappenbaums ausgewählt.
Es ist ebenfalls möglich, eine aus einer Arbeitsmappe extrahierte Tabelle geöffnet
zu lassen, sie jedoch nicht zur Analyse freizugeben. Wählen Sie dafür das
Datenblatt aus und deaktivieren Sie den Befehl Eingabetabelle im Menü Daten. Jetzt
wird STATISTICA automatisch die zuletzt gewählte Eingabetabelle für die Analyse
STATISTICA-Handbuch – 193
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
wählen und dabei die nicht als Eingabetabelle gekennzeichneten Tabellen
ignorieren.
Die Berichte in STATISTICA (kurz auf Seite 160 eingeführt) stellen die eher
traditionelle Weise der Verwaltung der Ausgabe dar, in der jedes Objekt (z. B. eine
STATISTICA-Tabelle oder Grafik, oder eine Microsoft Excel-Tabelle) sequentiell in
einem Dokument in der Art eines Textverarbeitungsprogramms angezeigt wird.
Allerdings bietet die Technologie hinter diesem einfachen Editor viel
Funktionalität. Z. B. ist der STATISTICA-Bericht wie die im Abschnitt oben
beschriebene Arbeitsmappe auch ein ActiveX-Container (siehe Seite 257), in dem
jedes Objekt (nicht nur STATISTICA-Tabellen und Grafiken, sondern auch jedes
andere ActiveX-kompatible Dokument wie Microsoft Word-Dokumente und
Bitmap-Abbildungen) aktiv bleibt und deshalb angepasst und von dort aus editiert
werden kann. Berichte werden im Dateiformat STR abgelegt. Dies ist eine
Erweiterung des Microsoft RTF (Rich Text Format, *.rtf) durch StatSoft. STRDateien beinhalten die RTF-Formatinformationen und zusätzlich die Information
für die Baumansicht (die nicht in RTF-Standarddateien gespeichert werden kann).
194 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
Daher werden Berichtsdateien als Standard mit der Extension *.str gespeichert,
lassen sich aber auch als RTF-Datei ablegen (wobei die Bauminformation nicht
erhalten bleibt).
Die offensichtlichen Vorteile dieser Art der Ausgabebehandlung sind zum einen die
Möglichkeit, Bemerkungen und Kommentare „zwischen“ den Objekten einzufügen.
Zum anderen kann die Ausgabe auf traditionelle Weise schnell durchblättert und
betrachtet werden, so wie es viele Benutzer gewohnt sind. Auch beinhaltet nur der
Ausgabebericht die zusätzlichen Informationen, die ein detailliertes Protokoll aller
für die Analyse spezifizierten Optionen wie z. B. ausgewählte Variablen, ihre
Textwerte und Langen Namen liefern [abhängig von dem im Register
Ausgabemanager des Dialoges Optionen (erreichbar über das Menü Datei Ausgabemanager) gewählten Grad der Informationstiefe; siehe Seite 24].
Offensichtlicher Nachteil dieser traditionellen Berichte ist jedoch die durch den
Formatstil einer Textverarbeitung auferlegte innewohnende flache Struktur,
wenngleich dies von einigen Nutzern oder Anwendungen bevorzugt werden mag.
Der Berichtsbaum zeigt die Organisation von Dateien im Bericht. Die Dateien
werden in einem Format im Explorer-Stil dargestellt. Anders als Arbeitsmappen,
die eine beliebige Anzahl von Ebenen unterstützen, umfasst der Bericht allerdings
nur eine Dateiebene.
Sie können jeden Dokumenttyp von STATISTICA in einen Bericht einbetten,
einschließlich Tabellen, Grafiken und Analysen. Zusätzlich zu Dokumenttypen von
STATISTICA lassen sich andere Typen von ActiveX-Dokumenten einbetten, z. B.
Excel-Datenblätter, Word-Dokumente und Bitmapgrafiken. Diese eingebetteten
Dokumente können Sie über Doppelklick bearbeiten. Die Datei öffnet sich dann im
Betrachtungsfenster, und die Menüleiste des Berichts verbindet sich mit der
Menüleiste der ursprünglichen Anwendung der eingebetteten Datei, um Ihnen alle
erforderlichen Bearbeitungsfunktionen zugänglich zu machen.
Baumelemente werden durch das angrenzende Symbol identifiziert. Die Symbole
Tabelle,
Makro und
Grafik repräsentieren jeweils Tabellen-, Makro- und
Grafikdokumente von STATISTICA. Das Symbol Data Miner repräsentiert ein
Data Miner-Projekt. Alle Nicht-STATISTICA-Dokumente werden durch ihre
STATISTICA-Handbuch – 195
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
Dokumentsymbole repräsentiert. Word-Dokumente beispielsweise werden durch
das Symbol
Word und Excel-Tabellen durch das Symbol
Excel repräsentiert.
Der Berichtsbaum lässt sich mit Ziehen-und-Ablegen oder über die Menüleiste
organisieren und modifizieren.
Befehle zum Einfügen, Extrahieren, Umbenennen und Ausschneiden von
Elementen des Berichtsbaums werden im Kontextmenü angeboten (über die rechte
Maustaste überall im Baum aufrufbar, wie oben dargestellt).
Grafikdokumente repräsentieren einen anderen Dokumenttyp von STATISTICA mit
einer reichen Funktionalität in Bezug auf die Art der Grafikerstellung und die
Auswahl von Anpassungswerkzeugen.
STATISTICA-Grafiken sind ebenso wie andere Dokumente ActiveX-Container
(siehe Seite 257) und können daher ein breites Spektrum von eingebetteten oder
verknüpften Dokumenten beinhalten (z. B. Visio-Zeichnungen, AdobeIllustrationen, Excel-Tabellen). Da STATISTICA-Grafiken ActiveX-Objekte sind,
lassen sie sich leicht mit anderen kompatiblen Dokumenten verknüpfen oder in
diese einbetten (z. B. in Word-Dokumente). Dort können sie unmittelbar per
Doppelklick editiert werden.
Grafiken werden detailliert in Kapitel 7 – Grafiken beschrieben.
196 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
Die dem Industriestandard folgende Programmiersprache STATISTICA Visual Basic
ist in STATISTICA integriert und stellt eine weitere alternative Benutzeroberfläche
dar, die die gesamte Funktionalität von STATISTICA umfasst.
STATISTICA-Makros lassen sich in mehreren Formaten speichern, je nach
Anwendungsabsicht (siehe STATISTICA Visual Basic Primer und Elektronisches
Handbuch für weitere Informationen). Man kann sie auch als Dokumente über die
Zwischenablage in andere Programme kopieren.
STATISTICA Visual Basic wird ausführlicher in Kapitel 9 (Seite 239) beschrieben.
STATISTICA-Handbuch – 197
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
Bei Durchführung statistischer Analysen und dem Bearbeiten von STATISTICADokumenten tritt häufig die Situation auf, dass viele verschiedene Fenster geöffnet
sind und dass sich die verschiedenen Analysen in einem unterschiedlichen Stadium
befinden. STATISTICA stellt ein Mittel zur Verfügung, die Arbeitsfläche –
einschließlich laufender Analysen – zu speichern. STATISTICA kann während einer
Analyse zu jedem beliebigen Zeitpunkt geschlossen werden, öffnet man die
Projektdatei wieder, kann die laufende Analyse genau an der Stelle wieder
aufgenommen werden, wo sie abgespeichert wurde.
Um ein STATISTICA-Projekt zu speichern, wählen Sie im Menü Datei den Befehl
Projekt speichern unter, so dass der Dialog STATISTICA-Projekt speichern
aufgerufen wird.
In diesem Dialog kann der Pfad- und Dateiname der STATISTICA-Projektdatei (mit der
Dateiendung .spf) festlegt werden. Es kann ebenfalls festgelegt werden, welche
Elemente in das Projekt aufgenommen werden sollen. Alle STATISTICADokumenttypen können ausgewählt werden (Tabellen, Grafiken, Arbeitsmappen,
Makros, Berichte, Data Miner-Projekte, In-Place Database-Projekte, Analysen und
198 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
Analyseergebnisse). Für bereits auf Festplatte gespeicherte STATISTICA-Dokumente
kann man entweder eine Verknüpfung zur Dokument-Datei erstellen oder eine Kopie des
Dokuments innerhalb der STATISTICA-Projektdatei speichern (Dokument in Projekt
einfügen).
In Projektdateien werden zusätzlich zu den STATISTICA-Dokumenten auch alle
laufenden Analysen abgespeichert. Die Projektdatei speichert das aufgezeichnete
Skript, das automatisch beim Ausführen der einzelnen Analysen erstellt wird. Wenn
das Projekt erneut geöffnet wird, werden die Skripts der Analysen erneut an den
Originaldaten ausgeführt. Die Analysedialoge erscheinen am Bildschirm wieder
exakt in der gleichen Position, als die Projektdatei gespeichert wurde.
Projektdateien stellen einen bequemen Weg dar, laufende Analysen und Ergebnisse
zwischen Anwendern zu transferieren, sofern für gespeicherte Dokumente die
Option Dokument in Projekt einfügen gewählt wird. Ein Anwender kann die
Analysen bis zu einem bestimmten Punkt ausführen, die Projektdatei dann
speichern und einem anderen Anwender senden, der die Projektdatei dann öffnen
kann und exakt an dem Punkt die Analysen fortsetzen kann, wo der erste Anwender
die Analysen stoppte.
Sofern die Standardeinstellungen nicht anderweitig konfiguriert werden, ruft
STATISTICA beim Schließen des Programms automatisch einen Dialog auf, der die
Frage enthält, ob eine Projektdatei gespeichert werden soll, die automatisch beim
Start der nächsten STATISTICA-Sitzung aufgerufen wird. STATISTICA erleichtert
es demnach, die Analyse am Ende eines Arbeitstages zu beenden, da man beim
nächsten Programmaufruf exakt zu diesem Zeitpunkt der Analyse zurückkehrt.
Es ist zu beachten, dass einem Projekt der Rang eines STATISTICA-Prozesses
zugewiesen wird. Projekte unterscheiden sich demnach von anderen Dokumenten,
da nicht mehr als ein Projekt in einem einzelnen STATISTICA-Prozess geöffnet
werden kann. Ein weiteres (zweites) Projekt kann allerdings gleichzeitig in einem
zweiten STATISTICA-Prozess geöffnet werden.
Data Miner Recipe bietet eine Lösung, die die Schritte des Data-Mining-Prozesses
in eine ergebnisorientierte Benutzeroberfläche umsetzt. Mittels Data Miner Recipe
wird der Anwender von der Datenaufbereitung bis zur Modellvalidierung durch die
Analyse geführt, so dass man auf schnellem Wege verwertbare Ergebnisse und
STATISTICA-Handbuch – 199
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
Antworten erhält. STATISTICA Data Miner Recipe wendet die umfassendste
Sammlung von Data-Mining-Algorithmen simultan in einem einzelnen Paket an,
ohne von dem Anwender zu verlangen, dass er die Details dieser Algorithmen
kennt.
STATISTICA Data Miner stellt hierbei die größte Bibliothek an Data-MiningMethoden und -Algorithmen zur Verfügung. Allgemein gesprochen fassen diese
Algorithmen die Einsichten und Methodologien aus verschiedenen Bereichen wie
der Statistik, den Ingenieurwissenschaften, dem Forschungsbereich Künstliche
Intelligenz, der Kognitionswissenschaft usw. zusammen, um aus den Daten das
Erkennen von Mustern zu „erlernen“, die für Vorhersagen verwendet werden
können (über das Versicherungs- oder Kreditrisiko, Prozess- oder Produktqualität,
Gerätefehler, medizinische Diagnosen und so weiter). Das Elektronische Handbuch
sowie das online verfügbare Elektronische Statistik-Lehrbuch bieten detaillierte
Einleitungen zu den verschiedenen Methoden und Techniken, die üblicherweise
unter dem Begriff „Data Mining“ zusammengefasst werden.
In der Praxis hat sich ergeben, dass unterschiedliche Anwendungsgebiete bzw.
Datentypen am besten mittels speziell darauf ausgerichteter Methoden und
Algorithmen analysiert werden. Beispielsweise unterscheiden sich die Data-MiningTechniken, die am besten für die Modellierung von Versicherungsschäden geeignet
sind, von den Techniken, die für die Prognose von Kraftwerksemissionen
vorzuziehen sind. Es gibt jedoch einen typischen Arbeitsablauf – von der Definition
der Daten und des Analyseproblems bis zur Stichprobenziehung, Modellbildung und
-bewertung – der auf alle Data-Mining-Prognosen anwendbar ist.
Die Benutzeroberfläche des Data Miner Recipe ermöglicht selbst Anwendern ohne
umfangreiche Erfahrung im Umgang mit Data-Mining-Tools, sehr schnell von der
Definition eines Problems zu konkreten verwertbaren Ergebnissen
voranzuschreiten.
200 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
In diesem Ansatz folgt man einfach der Benutzeroberfläche, die in ihrer Gestaltung
einem „Kochrezept“ ähnelt, um die für die Lösungsfindung notwendigen Schritte zu
vervollständigen. Tatsächlich sind hierbei die meisten dieser Schritte vollständig
automatisiert, so dass lediglich die Daten und Variablen der Analyse festgelegt
werden müssen, während das Programm automatisch die sonstigen Aufgaben
erledigt – Festlegen der Lern- und Teststichproben, Durchführung von Feature
Selection und verschiedenen Data-Mining-Algorithmen sowie die automatische
Evaluierung der Ergebnisse für die Auswahl des besten Data-Mining-Modells.
Diese Berechnungen und Analysen können entweder mit der Desktop-Lösung
STATISTICA Data Miner oder – falls verfügbar – auf dem WebSTATISTICA Data
Miner-Server durchgeführt werden.
Es werden stets zwei separate Dateien erstellt, wenn ein Data Miner-Projekt (Data
Miner Recipe) gespeichert wird:
 Eine Data Miner Recipe-Datei mit der Dateinamenserweiterung .dmrproj
 Eine STATISTICA Arbeitsmappen-Datei mit selbem Namen, allerdings mit der
Dateinamenserweiterung .stw, die Ergebnisse und detaillierte Informationen zu
den einzelnen Schritten des Projekts enthält
STATISTICA-Handbuch – 201
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
Es ist hierbei wichtig, dass beide Dateien in demselben Ordner abgelegt sind. Wenn
also beispielsweise ein Data Miner Recipe-Projekt namens DataMinerProjekt in
einen neuen Ordner kopiert, zu einem Kollegen gesendet oder in das STATISTICA
Document Management System integriert werden soll, müssen beide Dateien –
DataMinerProjekt.dmrproj und DataMinerProjekt.stw – an die neue Zieladresse
übermittelt werden.
Es folgen einige zusätzliche Details bezüglich dieser beiden Dateien.
Diese Datei ist ein XML-Dokument
(XML – Extensible Markup Language). Sie enthält alle Informationen zu den
Einstellungen, die von dem Anwender (oder von dem Programm automatisch)
ausgewählt wurden. Dies umfasst:
 Informationen zur Datendatei (oder Datenbankverknüpfung)
 Variablenauswahl und -Metadaten (sind beispielsweise stetige oder kategoriale
Prädiktoren definiert worden)
 Einstellungen zu den einzelnen Schritten der Datenvorverarbeitung (z. B. die
Handhabung von Missing Data, das Filtern von Dubletten,
Datentransformationen usw.)
 Abschließende Variablenauswahl basierend auf Algorithmen zur Vorauswahl
von Einflussfaktoren
 Ergebnisse der Modellbildung und die abschließende Bewertung und Auswahl
von Modellen
 Alle notwendigen Informationen zur Anwendung der Modelle für die Vorhersage
neuer Fälle (z. B. die Anwendung von Scoring-Verfahren auf Datenbanken und
die Berechnung von Faktorwerten, Krankheitsrisiken oder Ausfallwahrscheinlichkeiten usw.)
Werden demnach Data Miner Recipes in STATISTICA Enterprise angewendet, um
automatisch Vorhersagewerte (z. B. das Automatisieren von Kreditscoring,
multivariaten Regelkarten und der Fehleranalyse usw.), Klassifikationen oder
Klassifikationswahrscheinlichkeiten (z. B. Ausfallwahrscheinlichkeiten) berechnen
zu lassen, ist die gesamte dazu notwendige Information innerhalb dieser XMLDokumente gespeichert.
202 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
Diese Dateien
enthalten ausführliche Informationen zu den Ergebnissen der einzelnen Schritte.
Die Ergebnisse in dieser Arbeitsmappe stellen eine komplette Dokumentation der
Berechnungen und Analysen dar, die während des Data Miner-Projektes
durchgeführt wurden. Wenn Data-Mining-Analysen in validierten Umgebungen
durchgeführt werden (z. B. gemäß FDA, ISO usw.) oder kritischer Bestandteil des
Unternehmensauftrags sind, der unter der Einhaltung bestimmter Standard
Operating Procedures (SOPs) erfolgen muss, ist es demnach empfehlenswert, dass
diese Datei mitsamt der Data Miner Recipe-Projektdatei (.dmrproj) im STATISTICA
Document Management System gespeichert wird.
STATISTICA-Handbuch – 203
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
204 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
STATISTICA-Handbuch – 205
Copyright © StatSoft, 2009
KAPITEL 6: STATISTICA-DOKUMENTE
206 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
Die gebräuchlichste Anwendung von Grafiken besteht in der effizienten Darstellung
und Übermittlung von Informationen (üblicherweise von numerischen Daten).
Grafische Verfahren liefern allerdings auch mächtige analytische Werkzeuge zur
Exploration von Daten und Verifikation von Hypothesen.
STATISTICA bietet eine
umfassende Auswahl von grafischen Methoden zur Datenanalyse und zur
Präsentation von Ergebnissen. Alle Grafiken in STATISTICA beinhalten ein breites
Spektrum von interaktiven analytischen Verfahren und Anpassungswerkzeugen, die
Ihnen eine benutzergerechte Gestaltung aller Darstellungsaspekte ermöglichen.
Darüber hinaus sind flexible Möglichkeiten zur Handhabung von Grafiken
verfügbar, mit denen sich diverse grafische Darstellungen integrieren und
dynamische Verknüpfungen zwischen Anwendungen herstellen lassen (z. B. über
OLE - Object Linking and Embedding).
Die grafischen Optionen von STATISTICA sind auch über
Programmierung zugänglich (mittels der eingebauten STATISTICA Visual Basic
oder anderer kompatibler Sprachen), was nahezu unbegrenzte Möglichkeiten zum
Erstellen hoch angepasster grafischer Darstellungen eröffnet. Diese
benutzerdefinierten Grafiken lassen sich später dauerhaft in die Benutzeroberfläche
von STATISTICA einbinden (z. B. durch Hinzufügen einer Schaltfläche in die
Symbolleiste oder Eintrag im Menü).
STATISTICA-Handbuch – 207
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
STATISTICA bietet ein Spektrum
von Methoden an, mit denen Grafiken aufgerufen oder definiert werden können.
Diese Methoden (Grafikkategorien für Rohdaten, Blockdaten und spezialisierte
Formen) werden unter Allgemeine Kategorien von Grafiken auf Seite 214 erläutert;
sie ergänzen sich gegenseitig, liefern ein hohes Integrationsniveau zwischen Zahlen
(wie Rohdaten, Zwischen- oder Endergebnisse) und grafischer Darstellung.
Spezialisierte Grafiken lassen sich beispielsweise als Teil der automatischen
Ausgabe von statistischen Verfahren aufrufen, aber auch über integrierte
Werkzeuge zur Visualisierung beliebiger Zahlenkombinationen (und/oder Labels),
die von STATISTICA erstellt oder gezeigt werden.
Die Anpassungsoptionen von STATISTICAGrafiken beinhalten Hunderte von Funktionen und Werkzeugen zum Modifizieren
eines jeden Darstellungsdetails und der zugehörigen Datenaufbereitung. Diese
Optionen sind hierarchisch angeordnet, so dass die meistverwendeten direkt per
Doppelklick oder Klicken der rechte Maustaste auf das jeweilige Grafikelement
zugänglich sind.
Die
Voreinstellungen für diese Funktionen lassen sich leicht anpassen, so dass das
voreingestellte Erscheinungsbild und das Verhalten von STATISTICA-Grafiken
Ihren speziellen Bedürfnissen entsprechen und nur wenige Eingriffe Ihrerseits
erfordern. Es gibt mindestens vier verschiedene Wege, um Anpassungen
vorzunehmen:
Standardeinstellungen von Grafiken lassen sich
unmittelbar über die Register Grafik 1 und Grafik 2 des Dialogs Optionen (über
das Menü Extras - Optionen zugänglich) anpassen. Die am häufigsten
verwendeten Einstellungen lassen sich hier leicht ändern und werden
automatisch als voreingestellter Grafikstil (siehe Punkt 2 unten) in der
Konfigurationsdatei von STATISTICA gespeichert (verschiedene
Voreinstellungen lassen sich beispielsweise für unterschiedliche Projekte
nutzen). Zu weiteren Einzelheiten siehe das Elektronische Handbuch zum
Register Konfigurations-Manager im Dialog Optionen.
208 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
Alle Eigenschaften, die das Erscheinungsbild
der Grafik beeinflussen (von elementaren Eigenschaften wie Schriftfarbe der
Fußnote bis zu allgemeinen wie globale Funktionen des Grafikdokuments),
können als individuelle „Stile“ gespeichert werden. Diese Stile lassen sich mit
benutzerdefinierten Namen versehen und später über einfache Shortcuts (wie
spezifische Tastenkombinationen oder Schaltflächen der angepassten
Symbolleiste) anwenden. Ein intelligentes System verwaltet diese Tausende von
Stilen und deren Kombinationen innerhalb von STATISTICA und minimiert den
Anpassungsaufwand. Alle benutzerdefinierten oder modifizierten Stile werden
automatisch in der Konfigurationsdatei von STATISTICA gespeichert.
Neue Grafiktypen lassen sich auf
verschiedene Weise definieren und den Menüs, Dialogen oder Symbolleisten
hinzufügen. Wenn eine benutzerdefinierte Grafik für den häufigen Gebrauch
nicht von Grund auf neu erstellt wurde (z. B. mit einfachen Grafikmitteln
gezeichnet wurde), sondern auf einer Grafik aus dem Grafikmenü basiert und
mit einer Kombination vorhandener Anpassungsoptionen erstellt wurde, dann
lässt sie sich einfach durch Anklicken von Als Benutzergrafik dem Menü
hinzufügen im Register Optionen 2 aller Dialoge für Grafikdefinitionen dem
Menü Grafiken als neuer Grafiktyp hinzufügen. Alle benutzerdefinierten
Grafikspezifikationen werden automatisch in der Konfigurationsdatei von
STATISTICA gespeichert.
Es gibt letztendlich keine Grenzen in der
Anpassungstiefe von STATISTICA-Benutzergrafiken, da sich mit STATISTICA
Visual Basic (mit seinen mächtigen Zeichenwerkzeugen und der STATISTICABibliothek von Grafikverfahren) nahezu alle Grafiken oder MultimediaAusgaben erzeugen lassen, die gegenwärtig von Computer-Hardware unterstützt
werden. Solche selbst entwickelten Bilder oder Multimedia-Ausgaben lassen
sich den Symbolleisten, Menüs oder Dialogen von STATISTICA hinzufügen und
werden so ein dauerhafter Teil Ihrer STATISTICA-Anwendung.
Siehe das Elektronische Handbuch zu weiteren Einzelheiten dieser Methoden der
Grafikanpassung.
Das Elektronische Handbuch enthält auch Themen, die sich den bestimmten
Kategorien an Grafiken widmen; dies umschließt konzeptionelle Überblicke und
Beispiele typischer Anwendungen. Hierbei werden auch die unterschiedlichen
Eigenschaften der entsprechenden Grafiktypen diskutiert.
STATISTICA-Handbuch – 209
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
Die Standardeinstellungen für die meisten in STATISTICA bereitgestellten
statistischen Grafiken folgen festen Konventionen, die entweder explizit in der
Literatur zu statistischen und technischen Grafiken beschrieben werden oder die den
von großen wissenschaftlichen Fachzeitschriften (z. B. SCIENCE) allgemein
akzeptierten Standards entsprechen. Nahezu alle Standardeinstellungen von
STATISTICA lassen sich anpassen, um den speziellen Anforderungen besonderer
Anwendungen gerecht zu werden (siehe Seite 208). Die Grafikfunktionen von
STATISTICA sind als flexible „Werkzeuge“ konzipiert, mit denen Effekte jenseits
der wohlbekannten Muster und Vorlagen erzeugt werden können. Darüber hinaus
lassen sich diese Werkzeuge anpassen, neue Werkzeuge erstellen und beides zur
häufigen Verwendung der Symbolleiste oder den Menüs hinzufügen (siehe
Seite 208).
Zusätzlich zu der umfassenden Auswahl von statistischen und technischen
Standardgrafiken enthält STATISTICA zahlreiche Sondertypen an Grafiken und
grafischen Anpassungsfunktionen. Da die Statistiker von StatSoft die meisten davon
entwickelt haben, sei hier darauf hingewiesen, dass unsere Anwender dabei eine
wichtige Rolle gespielt haben. Das vorliegende Spektrum der Grafikoptionen in
STATISTICA ist das Resultat von Bemerkungen und „Wunschlisten“, die Tausende
von Anwendern an StatSoft weitergaben. Viele Sonderfunktionen von
STATISTICA-Grafiken (z. B. Auswahl multipler Teilmengen, dialoggesteuerte
Kategorisierung) wurden als Antwort auf Ideen und Fragen von Anwendern
eingeführt. StatSoft ist für diesen Beitrag der Anwender sehr dankbar.
Wie bereits ausgeführt (und detailliert auf Seite 214 erörtert), gibt es verschiedene
Methoden zum Anfordern von STATISTICA-Grafiken. Diese Methoden stellen
unterschiedliche Arten von „Schnittstellen“ zwischen Zahlen und Grafiken dar.
Die in eine Tortengrafik umgesetzten Zahlen können beispielsweise einfach
aufeinanderfolgende Werte aus einer Spalte im Datenblatt darstellen (z. B. die
Variable Verkaufszahlen), die mit den Fallnamen Jahr 2002, Jahr 2003, Jahr 2004
usw. versehen sind. Die Zahlen in einer ähnlichen Tortengrafik können dagegen
auch Rechenergebnisse repräsentieren. Die Tortensegmente könnten beispielsweise
relative Häufigkeiten von Beobachtungsfällen einer bestimmten Kategorie abbilden,
die von einem Verfahren der Häufigkeitsklassierung ermittelt wurde (z. B. Anzahl
von Jahren mit Verkaufszahlen unter 10 Millionen €, zwischen 10 und 20 Millionen
€, und über 20 Millionen €).
Ungeachtet der beim Erstellen einer Grafik jeweils eingesetzten Methode (d. h.
unabhängig davon, ob die Zahlen in der Grafik aus der Tabelle entnommen oder
210 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
erst berechnet wurden) lassen sich alle Funktionen zur Anpassung von
STATISTICA-Grafiken und Handhabung multipler Grafiken bei der Modifikation
von Grafiken oder bei deren Einbindung in Dokumente nutzen.
Außerdem sind alle integrierten analytischen Funktionen (wie Anpassungsfunktion,
Glättung, Rotation, Brushing, analytisches Zoomen) aus einer Grafik heraus in
STATISTICA zugänglich und lassen sich unabhängig davon, welche Quelle oder
Methode auch immer den jeweiligen Zahlen in der Grafik zugrunde liegt, auf die
Grafik anwenden.
STATISTICA-Handbuch – 211
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
Die in STATISTICA angebotenen grafischen Editierfunktionen ermöglichen nicht
nur das Erstellen von publikationsfähigen, hoch angepassten wissenschaftlichen und
technischen Abbildungen ...
... und präzisen Zeichnungen, ...
212 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
... sondern auch von präsentationsreifen Illustrationen, Postern,
Geschäftsdiagrammen und anderen Abbildungen, ...
... die auf effiziente und ansprechende Weise der Informationsübermittlung dienen.
Als Datei gespeicherte oder temporär aus STATISTICA entnommene Grafiken (z. B.
in die Zwischenablage kopiert oder mit einem Dokument einer anderen Anwendung
verknüpft) sind vollständige „Objekte“ (technisch ausgedrückt, ActiveX-Objekte,
siehe Seite 257), die nicht nur alle Anpassungsfunktionen und andere eingebettete
Objekte enthalten, sondern auch alle erforderlichen Daten zur weiteren Editierung
von Darstellungsaspekten oder zur Analyse seines Inhalts (Anpassung, Glättung,
usw.).
Da STATISTICA-Grafiken ActiveX-Objekte sind, lassen sie sich leicht mit anderen
kompatiblen Dokumenten verknüpfen oder in diese einbetten (z. B. in Excel- oder
Word-Dokumente). Dort können sie unmittelbar per Doppelklick editiert werden.
STATISTICA-Grafiken sind auch ActiveX-Container und können daher ein breites
Spektrum von eingebetteten oder verknüpften Dokumenten beinhalten, wie VisioZeichnungen, Adobe-Illustrationen, Excel-Tabellen oder Word-Dokumente.
Darüber hinaus unterstützt STATISTICA Hierarchien von eingebetteten Objekten
STATISTICA-Handbuch – 213
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
auf bis zu vier Ebenen, kann also Dokumente mit darin enthaltenen Dokumenten
mit wiederum darin enthaltenen Dokumenten handhaben.
Zusätzlich zu den spezialisierten statistischen Grafiken, die in den Ausgabedialogen
aller statistischen Verfahren angeboten werden (siehe Seite 226), gibt es zwei
allgemeine Kategorien oder Klassen an Grafiken. Diese lassen sich über Menü
Grafik, Symbolleiste Grafik, Kontextmenüs und das STATISTICA-Startmenü
aufrufen:

Grafiken für Eingabedaten
(siehe Seite 215 und Menü Grafik, siehe Seite 220)
und

Grafiken für Blockdaten
(siehe Seite 218).
Der wichtigste Unterschied zwischen diesen beiden Kategorien besteht in den der
Grafik jeweils zugrundeliegenden Daten:
Grafiken für Eingabedaten und deren erweiterte
Version im Menü Grafik erstellen statistische Zusammenfassungen oder andere
Repräsentationen der Rohdaten im aktuellen Eingabedatenblatt (üblicherweise für
die gesamte Variable oder deren Untermenge bei aktivierter Fallauswahl).
STATISTICA greift beim Erzeugen einer solchen Grafik über ein Kontextmenü aus
einer Ergebnistabelle, in der die aktuellen Daten nicht enthalten sind, stets auf die
zugehörigen Eingabedaten (Rohdaten) zurück. Wird beispielsweise das
Kontextmenü aus einer Zeile einer Korrelationsmatrix heraus geöffnet, lässt sich ein
Scatterplot zu den beiden an dieser Korrelation beteiligten Variablen erstellen.
Grafiken für Blockdaten sind
indessen völlig
unabhängig vom Prinzip der „Eingabedaten“ oder der „Datendatei“. Sie liefern ein
allgemeines Werkzeug zur Visualisierung von Zahlenwerten im aktuell
ausgewählten Block einer Tabelle. Diese Zahlenblocks können benutzerdefinierte
Untermengen der numerischen Ausgabe oder der Rohdaten enthalten.
Beide Hauptkategorien an Grafiken bieten die gleichen Optionen und die gleiche
Typenauswahl an Grafiken. Sie können beispielsweise die gleiche spezielle
214 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
kategorisierte ternäre Grafik aus Rohdaten oder aus einem benutzerdefinierten
Block von Werten generieren, der das Resultat eines bestimmten Tests darstellt.
Die beiden Hauptkategorien an Grafiken werden in den nachfolgenden zwei
Abschnitten kurz erörtert. Danach folgt ein Abschnitt zum Menü Grafik, das eine
breite Auswahl von Grafiken der ersten Kategorie enthält (Grafiken für
Eingabedaten, auch als Grafiken des Grafik-Menüs bezeichnet), aber auch den
Zugriff auf Grafiken für Blockdaten und andere Optionen anbietet.
Der Befehl Grafiken für Eingabedaten wird in den Kontextmenüs aller Tabellen
angeboten und bietet schnellen Zugang zu den für Eingabedaten häufig benutzten
Grafiktypen.
Alle diese Grafiken lassen sich auch über das Grafik-Menü, das STATISTICAStartmenü
auf der Statusleiste oder über die Schaltfläche Grafikgalerie
in
einem beliebigen Dialog zur Grafikspezifikation aufrufen. Grafiken für
Eingabedaten bieten nicht so viele Optionen wie die zugehörigen Grafiken des
Grafik-Menüs. Grafiken für Eingabedaten sind allerdings schneller zugänglich, da sie
im Gegensatz zu den Grafiken des Grafik-Menüs:

unmittelbar aus dem Kontextmenü eines Datenblatts aufgerufen werden können,
STATISTICA-Handbuch – 215
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN

keine Auswahl von Variablen erfordern (die Variablenauswahl wird durch die
aktuelle Cursorposition im Datenblatt festgelegt) und

keine Optionsauswahl in zwischengeschalteten Dialogen erfordern (die
jeweiligen Grafiken werden im Standardformat erzeugt).
verarbeiten unmittelbar die Daten aus der aktuellen
Eingabedatendatei und beziehen sich stets auf die Variable der aktuellen
Cursorposition (bei jeder Tabellenform).
Grafiken für Eingabedaten
Wenn Sie beispielsweise einen Korrelationskoeffizienten in einer Ergebnistabelle
anklicken und eine Grafik Scatterplot mit… generieren, erzeugt STATISTICA einen
2D-Scatterplot aus den Rohdaten der beiden an der Korrelation beteiligten
Variablen (siehe Einführungsbeispiel auf Seite 11 zu weiteren Einzelheiten dazu).
Obwohl der bequemste Weg zur Auswahl von Grafiken für Eingabedaten über das
Kontextmenü des Datenblatts verläuft, können Sie diese ebenfalls aus dem GrafikMenü oder dem Startmenü von STATISTICA
aufrufen. Jede Methode wird ein
Untermenü erzeugen, aus dem eine auf die aktuelle Variable anwendbare
statistische Grafik ausgewählt werden kann (d. h. auf die Variable der aktuellen
Cursorposition im Datenblatt).
Wenn das Datenblatt ein Matrixformat besitzt oder ein Format, bei dem die
Cursorposition auf zwei Variablen statt einer zeigt (wie in der Korrelationsmatrix
der nachstehenden Illustration), dann ist die vordefinierte bivariate Grafik für das
spezifizierte Variablenpaar direkt im Menü Grafiken für Eingabedaten abrufbar.
216 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
Falls dagegen die aktuelle Cursorposition nur auf eine Variable verweist (wie in der
folgenden Abbildung), und Sie eine der bivariaten Grafiken im Menü anwählen,
wird STATISTICA zur Auswahl der zweiten Variablen auffordern. Wenn Sie
beispielsweise wie in der nachstehenden Illustration einen Scatterplot mit
auswählen, wird STATISTICA die Variablenauswahl aufrufen, wo festgelegt werden
kann, nach welcher Variablen Messung05 geplottet werden soll.
STATISTICA-Handbuch – 217
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
Wenn mehr als eine Variable im markierten Bereich liegt (d. h., falls ein Block
ausgewählt wurde), dann bezieht sich das Menü Grafiken für Eingabedaten auf die
erste der gewählten Variablen.
Beim Erzeugen von Grafiken für Eingabedaten berücksichtigt STATISTICA die
Fallauswahl und Gewichtungsbedingungen für die zu plottenden Variablen im
aktuellen Datenblatt (diese lassen sich über die Menübefehle Extras Auswahlbedingungen - Bearbeiten und Extras - Gewichtung spezifizieren). Zu
weiteren Informationen über spezifische Typen von Grafiken für Eingabedaten siehe
das Elektronische Handbuch.
Anders als bei den Grafiken für Eingabedaten greifen die Grafiken für Blockdaten
bei der Spezifikation von Daten für die Grafik auf den ausgewählten
(geschlossenen) Datenblock der aktiven Tabelle zu.
Diese Grafiken sind völlig unabhängig vom Prinzip der „Eingabedaten“. Sie
verarbeiten Zahlenwerte je nach Blockauswahl ungeachtet ihrer „Bedeutung“ (die
Daten können beispielsweise Rohdaten oder Korrelationskoeffizienten sein). Diese
Grafiken dienen in effektiver Weise der Visualisierung, Erkundung und
218 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
Zusammenfassung numerischer Ausgaben der in Ergebnistabellen dargestellten
Analysen (z. B. Histogramme von Monte-Carlo-Ausgabewerten im Modul SEPATH,
oder ein Boxplot von Randmittelwerten in einer Ergebnistabelle im Modul ANOVA).
Obwohl der bequemste Weg zur Auswahl von Grafiken für Blockdaten über das mit
dem markierten Block im Datenblatt verbundene Kontextmenü verläuft, lassen sich
diese ebenfalls aus dem Grafik-Menü oder dem Startmenü von STATISTICA
aufrufen. Wenn Sie Grafiken für Blockdaten erzeugen, können Sie aus
Standardgrafiken auswählen (z. B. Histogramm: Blockspalten oder Linienplot:
Blockzeile) oder Ihre Benutzergrafik für die ausgewählten oder alle Zellen (d. h.
über die markierten Werte im Block hinausgehend) erstellen.
Unter Verwendung der Standardgrafiken (die ersten sechs
Befehle im Menü Grafiken für Blockdaten, siehe obige Illustration) können spezielle
Grafiken durch einen einzelnen Mausklick erstellt werden. Weitere Informationen
zu Standardgrafiken finden sich im Elektronischen Handbuch.
Über einen der vier Befehle Nutzergrafik wird der Dialog
aufgerufen, der viele Optionen zum Erzeugen von angepassten
Grafiken anbietet.
Grafik auswählen
Weitere Informationen zu Nutzergrafiken finden sich im Elektronischen Handbuch.
Wie bei den meisten Funktionen von STATISTICA
sind Grafiken für Blockdaten voll anpassungsfähig. Wählen Sie Liste anpassen aus
dem Menü Grafiken für Blockdaten, um den Dialog Liste der Nutzergrafiken
aufzurufen, der Optionen zum Löschen, Umbenennen oder Bearbeiten der aktuellen
Grafikliste ebenso wie das Hinzufügen neuer (benutzerdefinierter) Grafiken zum
Menü Grafiken für Blockdaten anbietet.
Wenn Sie beispielsweise eine Gaußkurve über das mit Histogramm: Block-Spalten
erzeugte Histogramm legen wollen, wählen Sie Histogramm: Block-Spalten im
STATISTICA-Handbuch – 219
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
Dialog Liste der Nutzergrafiken, klicken Sie auf Bearbeiten und schalten bei GrafikUntertyp auf mit Normalverteilung um. Alle nachfolgend erzeugten Plots
Histogramm: Block-Spalten werden eine Gaußkurve als Anpassung zeigen.
Die im Menü Grafik bereitgestellten Optionen stellen eine vollständige Auswahl der
in STATISTICA verfügbaren statistischen Grafiken und Anpassungsmöglichkeiten
dar. Sie sind nicht nur über das Menü Grafiken zugänglich, sondern auch über das
Startmenü STATISTICA
und bieten Hunderte von Typen grafischer Darstellung
und analytischer Zusammenfassung von Daten an.
Anders als bei den Grafiken für Blockdaten (die auch in diesem Menü enthalten
sind, damit ein vollständiger Satz grafischer Optionen über einen einzigen Befehl
erreichbar ist), sind alle anderen Grafiktypen des Grafik-Menüs nicht auf die Werte
in der aktuellen Ausgabetabelle beschränkt. Sie verarbeiten unmittelbar Daten aus
dem aktuellen Eingabedatenblatt in gleicher Weise wie die (bereits oben
behandelten) Grafiken für Eingabedaten. Sie repräsentieren entweder
Standardmethoden zur grafischen Zusammenfassung von Rohdaten (z. B. diverse
Scatterplots, Histogramme oder Plots der zentralen Tendenz wie den Median) oder
standardisierte grafische Analyseverfahren (z. B. kategorisierte
Wahrscheinlichkeitsnetze, trendbereinigte Normalverteilungsplots oder Plots mit
Konfidenzintervallen für Regressionslinien). Beim Erzeugen dieser Grafiken
berücksichtigt STATISTICA die aktuelle Fallauswahl und Gewichtungsbedingungen
der für den Plot ausgewählten Variablen.
220 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
Grafiken des Grafik-Menüs beinhalten 2D-Grafiken, Sequentielle 3D-Grafiken, 3D
XYZ-Grafiken, Matrixplots, Iconplots, Grafiken in Kategorien und Benutzerdefinierte
Grafiken. Der Kopfbereich des Menüs führt die am häufigsten verwendeten
Grafiktypen (Histogramme, Scatterplots, Mittelwerte und Fehlerplots, Flächenplots)
auf, während der untere Bereich eine Liste aller Grafiktypen enthält. Wie alle
Menüs in STATISTICA lässt es sich leicht anpassen (über das Register Menü im
Dialog Bearbeiten, zugänglich im Menü Extras - Anpassen), um die am häufigsten
verwendeten Optionen an die bevorzugte Stelle zu positionieren. Siehe hierzu auch
Grafiktypen des Grafikmenüs im Elektronischen Handbuch.
STATISTICA-Handbuch – 221
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
Die Grafiken, die aus dem Grafik-Menü heraus erstellt wurden, sind zu einem hohen
Grade mit der zugrundeliegenden Tabelle interaktiv. Man kann Punkte in der Grafik
auswählen und kennzeichnen, hierbei festlegen, dass sie in der Tabelle, die als
Datenquelle dient, hervorgehoben werden – und umgekehrt. Zusätzlich zur
Auswahl von Punkten in Grafiken und Tabellen, können in einer Tabelle die
Eigenschaften eines Falles festgelegt werden, die bei der Erstellung der Grafik aus
den Daten verwendet werden. Diese Eigenschaften umfassen den Stil der
Punktmarkierung, die Farbe und ob der Punkt von der Grafik und/oder der
Anpassungsrechnung ausgeschlossen werden soll.
Um innerhalb einer Grafik mit dem Brushing zu beginnen, klicken
Sie in der Symbolleiste auf das Symbol . Alternativ kann man auf
dem Hintergrund der Grafik einen Rechtsklick ausführen und im
Kontextmenü den Befehl Brushing anzeigen wählen, so dass der
Dialog Brushing (siehe Abbildung) aufgerufen wird.
Mit der Standardeinstellung Einfach (unter Brushing-Cursor) kann in
der Grafik ein Rechteck gezeichnet werden, um die Punkte innerhalb
dieses Rechtecks auszuwählen. Die folgende Abbildung illustriert
dies für den Beispieldatensatz Adstudy.sta, wobei ein 2D-Scatterplot
der Variablen MESSUNG01 vs. MESSUNG02 erstellt wurde. Die drei
Punkte in der linken oberen Ecke wurden mittels Brushing
ausgewählt, so dass die Punkte in der Grafik sowie die
zugrundeliegenden Fälle in der Tabelle, aus der diese Grafik erstellt
wurde, hervorgehoben werden.
222 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
Anstatt über die Brushing-Funktion können Fälle alternativ in der Tabelle gewählt
werden (durch Klicken auf der linken Seite eines Fallnamens) und die zugehörigen
Punkte werden in der Grafik markiert. Siehe die folgende Abbildung, bei der die
ersten fünf Fälle in der Tabelle Adstudy.sta ausgewählt wurden.
STATISTICA-Handbuch – 223
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
Der Tabellen-Fallstatus kann entweder von einer Tabelle oder von einer Grafik aus
festgelegt werden. In einer STATISTICA-Tabelle kann mittels eines Rechtsklicks
auf einen Fallnamen das Kontextmenü aufgerufen werden, das unter anderem die
Befehle Aus, Label, Markierte Punkte und Fallstatus enthält. Entsprechende Befehle
sind auch in dem Kontextmenü enthalten, das durch einen Rechtsklick auf Punkte in
einer Grafik aufgerufen wird. Die Grafik wird diese Optionen verwenden, wenn sie
Punkte enthält, die diese Fälle repräsentieren. Wird beispielsweise der Befehl Label
gewählt, werden die entsprechenden Punkte mit einem Label versehen (siehe
folgende Abbildung). Innerhalb der Tabelle werden die Fälle mit einem FallstatusSymbol versehen, womit angezeigt wird, dass diese Fälle in der Grafik mit Label
aufgeführt sind:
224 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
Mittels Rechtsklick auf einem Fallnamen und anschließender Auswahl des Befehls
Fallstatus bearbeiten (aus dem Fallstatus-Untermenü) können die Eigenschaften
Punkt und/oder Farbe des Falles bearbeitet werden.
Man beachte, dass eine Auswahl von Punkten auch für andere Grafiktypen als einen
Scatterplot möglich ist. In Histogrammen führt das Brushing durch Anklicken eines
Histogrammbalkens zur Auswahl der entsprechenden Fälle in der Tabelle.
Entsprechendes gilt für die Boxen innerhalb eines Boxplots.
Das Verwenden der Werkzeuge Fallstatus und Brushing bzw. die Auswahl von
Punkten ist im Zusammenhang mit der Fallstatus-Option Aus besonders nützlich.
Wählen Sie im Menü Daten - Fälle - Fallstatus den Befehl Aus, so wird dieser Fall
ausgeschlossen, d. h., dass der Fall nicht mehr in den Berechnungen verwendet und
auch nicht in den Grafiken angezeigt wird. Der Fallstatus Aus funktioniert auch in
Verbindung mit Tabellen-Fallauswahlbedingungen. Jeder Fall mit Fallstatus Aus
wird so interpretiert, als dass er durch Fallauswahlbedingungen ausgeschlossen
STATISTICA-Handbuch – 225
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
wurde. Das Verwenden der Werkzeuge Brushing und Fallstatus ist demnach eine
bequeme Möglichkeit, auf interaktive Weise Ausreißer zu entfernen, um dann die
Analyse mit den ausgeschlossenen Punkten zu wiederholen.
Zusätzlich zur Standardauswahl der Grafiken für Eingabedaten, Grafiken für
Blockdaten und Grafiken des Grafik-Menüs (siehe oben) sind andere spezialisierte
statistische Grafiken, die sich auf bestimmte Analysetypen beziehen (z. B.
Ergebnisse nichtlinearer Regression), unmittelbar aus den jeweiligen
Ergebnisdialogen aufrufbar (d. h. Dialoge mit Ausgabeoptionen für die aktuelle
Analyse).
Die spezialisierten Grafiken werden im Zusammenhang mit den jeweiligen
Analysen behandelt, aus denen heraus sie erzeugt werden können; daher finden sich
weitere Informationen in den entsprechenden Abschnitten des Elektronischen
Handbuchs.
226 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
Die Grafikoptionen von STATISTICA sind auch über das integrierte STATISTICA
Visual Basic oder andere kompatible Programmiersprachen zugänglich. Eine in
STATISTICA Visual Basic geschriebene Anwendung kann auf drei verschiedene
Arten mit Grafiken operieren:

Eine neue Grafik erzeugen und dann modifizieren, drucken oder speichern

In ein vorhandenes Grafikfenster gehen und es dann modifizieren

Eine Grafikdatei öffnen und dann modifizieren, drucken oder speichern
Jede in STATISTICA verfügbare Grafik lässt sich über STATISTICA Visual Basic
erzeugen und dann mit STATISTICA-Verfahren oder allgemeinen Optionen
anpassen, die in dieser umfassenden Sprache angeboten werden.
Funktionen zum Aufrufen der Grafikbibliothek von STATISTICA lassen sich - wie
alle anderen Funktionen von STATISTICA Visual Basic - über einen hierarchisch
gegliederten Funktions-Browser leicht in STATISTICA Visual Basic-Programme
STATISTICA-Handbuch – 227
Copyright © StatSoft, 2009
KAPITEL 7: GRAFIKEN
einbinden. Er enthält Kurzbeschreibungen aller Funktionen und Optionen für die
direkte Einbindung in den Quellcode eigener Programme (d. h. in den STATISTICA
Visual Basic-Editor, siehe Seite 243).
Weitere Information zum Aufruf der Grafikbibliothek von STATISTICA über die
Programmiersprache STATISTICA Visual Basic finden sich im Elektronischen
Handbuch.
228 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
STATISTICA bietet eine flexible, voll anpassungsfähige Benutzeroberfläche und
unterstützt die notwendige Ausrichtung der standardisierten Benutzeroberfläche auf
Ihre speziellen Bedürfnisse. Tatsächlich „erahnt“ STATISTICA Ihre Bedürfnisse
insofern, als es sich an diverse Ihrer Entscheidungen bei der Auswahl von Optionen
„erinnert“ und damit im Verlauf Ihrer Arbeiten „lernt“. Wenn Sie beispielsweise eine
Analyse aus dem Register Details im Dialog zur Spezifikation von Analysen aufrufen,
dann wird auch beim nächsten Öffnen dieses Dialogs das Register Details für Sie
gewählt (statt Register Standard).
Nahezu alle Aspekte der Benutzeroberfläche lassen sich anpassen, angefangen von
grundlegenden Steuerelementen wie Menüs, Symbolleisten und Tastatur. Der
Anpassungsprozess für diese Bildschirmkomponenten ist schnell und direkt (siehe
beispielsweise die Beschreibung für die Anpassung der Symbolleiste auf Seite 147).
Sie können sowohl globale als auch lokale Anpassungen von Grafiken, Datenblättern,
Arbeitsmappen, Berichten usw. vornehmen und unterschiedliche Konfigurationen von
STATISTICA einrichten (für Einzelanwender wie für Netzwerke). Außerdem lassen
sich völlig neue Benutzeroberflächen erzeugen (siehe Seiten 147 und 149).
STATISTICA-Handbuch – 231
Copyright © StatSoft, 2009
KAPITEL 8: ANPASSEN VON STATISTICA
Wie bereits ausgeführt, bietet STATISTICA Funktionen zum Erzeugen völlig neuer
Benutzeroberflächen an (siehe Seite 147), einschließlich der auf dem InternetBrowser basierenden Benutzeroberflächen (siehe Seite 150). Darüber hinaus lassen
sich jedoch auch nahezu alle Aspekte der voreingestellten Benutzeroberfläche auf
verschiedene Arten anpassen. Sie können beispielsweise die Standardoptionen
ergänzen, vereinfachen oder nach Bedarf fortlaufend verändern. Je nach
Anforderungen oder persönlichem „Arbeitsstil“ (und ästhetischer Wahl) lassen sich
Symbole, Symbolleisten, Statusbalken, Hauptmenüs, Arbeitsmappen, Ziehen-undAblegen (drag-and-drop), dynamische (automatische) Verknüpfungen zwischen
Grafiken und Daten, sowie 3D-Effekte in Tabellen und Dialogboxen unterdrücken.
Aufs Wesentliche reduzierte, sequentielle Ausgaben mit einfachen, papierweißen
Tabellen und einfarbigen Grafiken können angefordert werden. Das System gibt bei
Bedarf jeweils nicht mehr als einen einfachen Bericht zurzeit heraus (siehe linkes
Fenster in nachstehender Abbildung).
232 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 8: ANPASSEN VON STATISTICA
Alternativ lassen sich sorgfältig ausgearbeitete lokale und globale Symbolleisten
definieren. Sie können Farbe, Schriftart und Markierungsbereich des
Ausgabefensters gestalten, den Standardstil und die Ausgabeform von Grafiken
anpassen und die Ergebnisse in separaten, hierarchisch gegliederten Arbeitsmappen
ablegen. Damit schaffen Sie eine „vielschichtige“ Umgebung für Datenanalysen,
die eine Erkundung komplexer Datendateien erleichtern und einen Vergleich
unterschiedlicher Ausgabeaspekte ermöglichen (siehe rechtes Fenster in der
Abbildung oben).
Es gibt eine Reihe von spezialisierten Werkzeugen zur Anpassung des Layouts und
der Handhabung von STATISTICA-Dokumenten (siehe Kapitel 6 – STATISTICADokumente, Seite 183). STATISTICA besitzt ein sehr umfassendes System zur
Bearbeitung von Voreinstellungen für jeden Aspekt einer Grafik und zur Bündelung
von Anpassungselementen in hierarchisch gegliederte „Stile“. In gleicher Weise
lassen sich benutzerdefinierte Layouts und Formate für Datenblätter (MultimediaTabellen) und benutzerdefinierte Ereignisse (z. B. welche Reaktion beim Doppelklick
auf eine Tabelle erfolgt) gestalten. Siehe das Elektronische Handbuch zu weiteren
Einzelheiten.
Viele Aspekte des Erscheinungsbilds von STATISTICA lassen sich sowohl im Menü
Ansicht wie im Menü Extras anpassen. Beide Methoden funktionieren
unterschiedlich:
Die im Menü Ansicht vorgenommenen Veränderungen wirken
sich auf das aktuelle Erscheinungsbild von STATISTICA (z. B. Verbergen der
Symbolleiste) oder auf das aktuelle Dokumentenfenster (z. B. veränderter Schrifttyp
im Datenblatt) aus.
STATISTICA-Handbuch – 233
Copyright © StatSoft, 2009
KAPITEL 8: ANPASSEN VON STATISTICA
Die über das Menü Extras - Optionen erreichbaren Optionen (im
nachfolgenden Abschnitt ausführlich behandelt) werden zum Anpassen der
permanenten Voreinstellungen des Programms eingesetzt. Die globalen Optionen
für bestimmte Dokumentarten (z. B. eine Grafik oder eine Tabelle) bewirken keine
Veränderung im aktuellen Dokument. Sie werden indessen als
Standardeinstellungen des Programms gespeichert, die sich auf die Erzeugung des
nächsten (d. h. neuen) Dokuments des jeweiligen Typs auswirken.
Wenn Sie beispielsweise das Standard Layout für Datentabellen im Register
Tabellen des Dialogs Optionen verändern (im Menü Extras - Optionen verfügbar),
werden Sie das neue Datentabellen-Layout erst nach Erzeugung einer neuen
Datentabelle sehen können. Diese Standards werden sich hingegen auf keine von
der Festplatte geöffneten Dateien auswirken, da diese Tabellen in dem spezifischen
Aussehen angezeigt werden, in dem sie vorher gespeichert wurden (benutzen Sie
das Menü Ansicht zur Anpassung bestehender Objekte).
Die allgemeinen
Standardeinstellungen von STATISTICA lassen sich mittels der Optionen in den
Registern des Dialogs Optionen (über das Menü Extras - Optionen zugänglich)
anpassen. Die Standardeinstellungen steuern:
 das allgemeine Verhalten von STATISTICA (wie das Maximieren von
STATISTICA beim Start, Eigenschaften von Arbeitsmappe und Bericht,
Dateiablage oder Benutzerlisten, usw.),
 die Art der Ausgabenerstellung (z. B. Arbeitsmappen, Berichte usw.),
 das allgemeine Erscheinungsbild des Anwendungsfensters (Symbole,
Symbolleisten, usw.) und
 das Aussehen von Dokumentenfenstern.
Die folgende Abbildung zeigt das Register Allgemein des Dialogs Optionen.
234 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 8: ANPASSEN VON STATISTICA
Diese und andere allgemeinen Einstellungen sind unabhängig vom Typ des aktiven
Dokumentenfensters (z. B. Tabelle oder Grafik) zugänglich. Zu weiteren
Informationen über einzelne Register des Optionen-Dialogs siehe das Elektronische
Handbuch.
Im Register Konfigurations-Manager des Dialogs Optionen werden
Optionen zur Handhabung von „Bibliotheken“ von Einstellungen angeboten,
zwischen denen für verschiedene Projekte (oder Benutzer) umgeschaltet werden
kann. Zu weiteren Einzelheiten siehe das Register Konfigurations-Manager auf Seite
236 und das Elektronische Handbuch.
Die Anpassungsoptionen von STATISTICAGrafiken beinhalten Hunderte von Funktionen und Werkzeugen zum Modifizieren
eines jeden Darstellungsdetails und der zugehörigen Datenaufbereitung. Diese
Optionen sind in einer hierarchischen Reihenfolge angeordnet, so dass die
STATISTICA-Handbuch – 235
Copyright © StatSoft, 2009
KAPITEL 8: ANPASSEN VON STATISTICA
meistverwendeten direkt über Shortcuts per Doppelklick oder rechte Maustaste auf
das jeweilige Grafikelement zugänglich sind.
Die
Voreinstellungen für diese Grafik-Funktionen lassen sich leicht anpassen, so dass
das Standard-Erscheinungsbild und das Verhalten von STATISTICA-Grafiken Ihren
speziellen Bedürfnissen entsprechen und nur wenige Eingriffe erfordern. Viele
Aspekte von STATISTICA-Grafiken lassen sich durch den Einsatz folgender Mittel
anpassen:
1. den Dialog Optionen (über das Menü Extras - Optionen zugänglich),
2. das umfassende System von Grafikstilen,
3. benutzerdefinierte Grafiken und
4. STATISTICA Visual Basic.
Sie werden kurz in Kapitel 7 – Grafiken (Seite 208). beschrieben. Zu weiteren
Informationen siehe das Elektronische Handbuch.
STATISTICA speichert alle Programmeinstellungen beim Verlassen von
STATISTICA und ruft sie beim Neustart wieder auf. Sie können unterschiedliche
Konfigurationen dieser Einstellungen mittels der Optionen im Register
Konfigurations-Manager des Dialogs Optionen (über das Menü Extras - Optionen
zugänglich) erstellen. Mit dem Konfigurations-Manager lässt sich der aktuelle
Status des Programms als neue oder existierende Konfiguration speichern oder
STATISTICA mit unterschiedlichen Konfigurationen neu starten. Andere Optionen
beinhalten Import- und Exportfunktionen für Konfigurationen als separate Datei, so
dass diese von verschiedenen STATISTICA-Installationen gemeinsam genutzt
werden können.
236 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 8: ANPASSEN VON STATISTICA
Das gleiche Prinzip wie im vorangegangenen Abschnitt ist auch auf
Netzwerkinstallationen von STATISTICA anwendbar. Im Netzwerk wird
STATISTICA üblicherweise nur auf dem Server installiert, aber jeder Anwender
kann STATISTICA trotzdem unterschiedlich konfigurieren, weil die zugehörigen
Einstellungen lokal gespeichert werden. Zu beachten ist, dass im STATISTICA
Setup-Programm stets Netzwerk-Installation gewählt werden muss, damit es
ordnungsgemäß auf einem nicht-lokalen Laufwerk (Netzwerk-Server) eingerichtet
wird. Eine Netzwerkversion von STATISTICA ist erforderlich, um zuverlässiges
Arbeiten bei gleichzeitigem Zugriff von mehr als einem Anwender oder auch nur
einem Anwender zu gewährleisten, wenn STATISTICA nicht auf einem lokalen
System installiert wird.
STATISTICA-Handbuch – 237
Copyright © StatSoft, 2009
KAPITEL 8: ANPASSEN VON STATISTICA
238 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
Die dem Industriestandard folgende Programmiersprache STATISTICA Visual Basic
(SVB) ist in STATISTICA integriert und stellt eine weitere alternative
Benutzeroberfläche dar, die die gesamte Funktionalität von STATISTICA umfasst.
Sie ist weit mehr als nur eine Programmiersprache zur Erstellung erweiterter
Anwendungen.
SVB nutzt die Objektmodell-Architektur von STATISTICA voll aus und kann jeden
Aspekt und nahezu jedes Detail der Funktionalität von STATISTICA steuern. Selbst
die kompliziertesten Analysen und Grafiken lassen sich als Visual Basic Makro
aufzeichnen. Diese Makros kann man später wiederholt ablaufen lassen, editieren
oder aus Teilen von ihnen andere Anwendungen zusammensetzen. SVB fügt der
reichen Standardsyntax von Visual Basic einen Vorrat von über 13.000 neuen
Funktionen hinzu und stellt damit eine der umfangreichsten verfügbaren
Entwicklungsumgebungen dar.
Das
Spektrum der Anwendungen für STATISTICA Visual Basic-Programme reicht von
Makroaufzeichnungen zur Automatisierung häufig auszuführender Arbeitsschritte
bis zur Entwicklung komplexer Analysesysteme, die optimierte Prozeduren von
STATISTICA mit eigenen Erweiterungen unter einer selbst erstellten
Benutzeroberfläche verbinden. Mit entsprechender Lizenzierung können erstellte
Analyseskripts in Systemumgebungen integriert werden, um aus
unternehmenseigenen Softwareanwendungen heraus oder über Internet/IntranetPortale ausgeführt zu werden.
STATISTICA-Handbuch – 241
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
Darüber hinaus können SVB-Programme nahezu allen wichtigen „Ereignissen“ in
einer STATISTICA-Analyse beigefügt werden, wie unter anderem dem Öffnen oder
Schließen von Dateien, dem Klicken auf Zellen einer Tabelle usw. Auf diese Weise
kann die Benutzeroberfläche von STATISTICA für bestimmte Anwendungen (z. B.
Dateneingabe usw.) bis ins Detail angepasst werden.
STATISTICA bietet eine umfassende Auswahl an Möglichkeiten für das
Aufzeichnen von Makros bzw. SVB-Programmen, um sich periodisch
wiederholende Arbeitsschritte zu automatisieren oder um automatisch Programme
zu erstellen, die für folgende Aufgaben bearbeitet und modifiziert werden können.
Die Makros, die auf diesem Wege aufgezeichnet werden, können exakt so
ausgeführt werden, wie sie gespeichert wurden, oder als Bausteine für komplexere
und hoch angepasste Visual Basic-Programme dienen. Analyse-Makros und
Master-Makros folgen der identischen Syntax und können beide später modifiziert
werden. Doch aufgrund der unterschiedlichen Aufzeichnungswege dieser Makros
bieten sie für eine bestimmte Anwendung sich unterscheidende Vor- und Nachteile.
Analyse-Makros zeichnen automatisch die Einstellungen und
gewählten Optionen einer bestimmten Analyse auf. Der Begriff „Analyse“
bezeichnet hierbei einen Task, der aus den Menüs Statistik, Data Mining oder Grafik
aufgerufen wurde. Dieser Task kann sehr klein und einfach sein (z. B. ein
Scatterplot aus dem Menü Grafik), allerdings auch sehr komplex (z. B. ein
Strukturgleichungsmodell aus dem Menü Statistik, das Hunderte von
Ausgabedokumenten umfassen kann). Nach der Auswahl eines Befehls aus den
Menüs Statistik, Data Mining oder Grafik werden alle Aktionen, wie z. B.
Variablenauswahl, gewählten Optionen usw., im Hintergrund aufgezeichnet. Diese
Aufzeichnung (d. h. der Visual Basic-Code für dieses Makro) kann hierbei zu jedem
beliebigen Zeitpunkt in dem Visual Basic-Editor dargestellt werden. Der hierzu
notwendige Befehl Erzeuge Makro ist in jedem Analysedialog nach Klicken der
Schaltfläche Optionen verfügbar. Sofern ein Analysedialog minimiert wurde und in
242 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
der Analyseleiste aufgeführt wird, kann der Befehl auch in dem entsprechenden
Kontextmenü aufgerufen werden (Zugriff über rechten Mausklick auf die
Analyseschaltfläche in der Analyseleiste).
Mit einem Master-Makro können Sie eine
gesamte Sitzung aufzeichnen, die aus einer oder mehreren Analysen besteht. Diese
Aufzeichnung verbindet die verschiedenen Analysen aus den Menüs Statistik, Data
Mining oder Grafik mit ihren jeweils unterschiedlichen Analyseoptionen. Darüber
hinaus kann die Aufzeichnung eines Master-Makros im Gegensatz zu der
Aufzeichnung des Analyse-Makros auch an- und ausgeschaltet werden. Die
Aufzeichnung des Master-Makros beginnt, indem im Untermenü Extras - Makro der
Befehl Protokollaufzeichnung der Analyse starten (Master-Makro) gewählt wird, und
endet, wenn im selben Untermenü der Befehl Aufzeichnung beenden gewählt wird.
Zwischen diesen beiden Aktionen werden neben den Analysen und der gewählten
Reihenfolge dieser Analysen auch Auswahlen von Dateien und Datenoperationen
aufgezeichnet.
Diese Form der Makroaufzeichnung speichert die eingegebene
Tastaturabfolge. Durch Auswahl des Befehls Tastatur-Makro aufzeichnen aus dem
Untermenü Extras - Makro wird STATISTICA den tatsächlichen Tastenanschlag, der
über die Tastatur eingeben wurde, aufzeichnen. Nach dem Beenden dieser
Aufzeichnung öffnet sich ein Fenster des SVB-Editors, das ein einfaches Programm
enthält. Dieses Programm besteht lediglich aus einem einzelnen SendKeys-Befehl, das
Symbole beinhaltet, die all die unterschiedlichen Tastenanschläge repräsentieren. Diese
Form des Makros ist in dem Sinne recht einfach strukturiert, als dass jeglicher Kontext,
in dem die Tasten gedrückt wurden, ignoriert wird (d. h. die Befehle, die hierdurch
ausgeführt wurden). Allerdings sind solche Makros für die automatische Eingabe von
Texten, wie Kommentare, Titel oder Auswahlbedingungen sinnvoll.
In der
professionellen STATISTICA Visual Basic-Entwicklungsumgebung können
Programme auch völlig neu aufgebaut werden. Hierfür stehen ein komfortabler
Programmeditor mit einem mächtigen Debugger (u. a. mit Haltepunkten) und viele
andere Tools für den effizienten Aufbau von Code zur Verfügung. Diese Tools
werden detailliert im STATISTICA Elektronischen Handbuch beschrieben.
Wenn ein Makro bearbeitet wird, indem Visual Basic-Befehle oder SVBProgrammbefehle eingegeben werden, ist eine automatische Worterkennung zur
automatischen Vervollständigung dieser Befehle aktiviert. Darüber hinaus wird eine
Kurzinfo eingeblendet, die die korrekte Syntax des Befehls angibt. Eine Hilfe zu
STATISTICA-Handbuch – 243
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
den Mitgliedern und Funktionen jeder einzelnen Klasse kann ebenfalls aufgerufen
werden.
In dem Programm können Haltepunkte gesetzt werden, so dass beim Ausführen des
Programms Zeile für Zeile beobachtet werden kann, wie sich die Variablenwerte
während des Programmablaufs ändern.
Darüber hinaus wird ein interaktiver Dialogeditor zur Verfügung gestellt, mit dem
das Erstellen neuer Dialoge auf einfachem Wege zu realisieren ist.
244 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
Zusammenfassend lässt sich sagen, dass STATISTICA Visual Basic nicht nur eine
mächtige Programmiersprache ist, sondern eine sehr leistungsstarke, professionelle
Entwicklungsumgebung, die sich vorzüglich für das Erstellen einfacher Makros als
auch komplexer benutzerangepasster Anwendungen eignet.
SVB-Programme können
auch Bestandteil von Visual Basic-Programmen sein, die innerhalb anderer
Anwendungen (z. B. Excel) erstellt wurden, indem hierzu die entsprechenden
STATISTICA-Funktionen und Prozeduren aufgerufen werden.
STATISTICA-Handbuch – 245
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
STATISTICA Visual Basic-Programme können zum einen innerhalb von
STATISTICA ausgeführt werden. Da SVB aber zum Industriestandard kompatibel
ist, können Programme auch aus jeder anderen kompatiblen Umgebung heraus
ausgeführt werden (z. B. Excel, Word oder einer reinen Visual Basic-Sprache). In
der Praxis bedeutet dies, dass Sie STATISTICA-Funktionen aus Visual Basic in
einer anderen Applikation aufrufen können. Zu beachten ist dabei, dass (anders als
bei Funktionen aus MS Visual Basic) für den Start eines SVB-Programms oder den
Versuch, STATISTICA-Funktionen aus anderen Anwendungen heraus aufzurufen,
die STATISTICA-Bibliotheken auf den ausführenden Computern vorhanden sein
müssen, damit die Funktionen ausgeführt werden können. Das bedeutet, dass der
Benutzer des Programms ein lizenzierter Anwender der STATISTICA-Bibliotheken
für die Prozeduren sein muss. Weiterhin sei darauf hingewiesen, dass diese riesige
STATISTICA-Funktionsbibliothek nicht nur dem Zugriff durch Visual Basic offen
steht, sondern auch Aufrufen von jeder anderen kompatiblen Programmiersprache
oder Umgebung wie z. B. C/C++, C# oder Delphi.
Die offensichtlichen Vorteile von Visual Basic (im Vergleich zu anderen Sprachen)
liegen in der einfachen Bedienbarkeit sowie der Bekanntheit bei einer großen
Anzahl von PC-Anwendern. Möglicher Nachteil von Visual Basic-Programmen ist,
dass die Verarbeitungsgeschwindigkeit geringer ist als bei Anwendungen, die in
einer Lower-Level-Programmiersprache (wie C) entwickelt wurden. Dieses
potentielle Problem besteht normalerweise aber nicht bei SVB-Anwendungen, vor
allem wenn sie hauptsächlich aus Aufrufen von Analysen, Grafiken und
Datenmanipulationen von STATISTICA bestehen. Diese Prozeduren setzen die
Technologie von STATISTICA voll um, um ähnlich schnell ablaufen zu können, als
wenn die entsprechenden Prozeduren direkt in STATISTICA durchgeführt würden.
STATISTICA Visual
Basic besteht aus zwei Komponenten: 1) Die allgemeine Visual BasicEntwicklungsumgebung mit Tools und Erweiterungen zur Entwicklung von
Benutzeroberflächen (Dialogen) und 2) die STATISTICA-Bibliotheken mit
Tausenden von Funktionen, die den Zugriff auf praktisch alle Funktionalitäten von
STATISTICA ermöglichen.
246 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
Die Visual Basic-Entwicklungsumgebung folgt grundsätzlich den
Syntaxkonventionen von Microsoft Visual Basic. Kleinere Unterschiede bestehen
hauptsächlich in der Art, wie Dialoge erstellt werden (Details siehe unter Custom
Dialogs und Custom User Interfaces im STATISTICA Elektronischen Handbuch),
um Programmierern/Entwicklern bei der Erstellung von Benutzeroberflächen
innerhalb komplexer Programme mehr Flexibilität zu bieten. In der SVBEntwicklungsumgebung können Dialoge komplett innerhalb separater Subroutinen
verarbeitet werden, die flexibel zu größeren Programmen mit mehreren Dialogen
kombiniert werden können, wohingegen unter MS Visual Basic die Dialoge und
alle Ereignisse innerhalb dieser Dialoge in separaten Programmeinheiten verarbeitet
werden.
Nach dem Speichern eines SVB-Programmes kann es einer benutzerdefinierten
Symbolleiste oder einem Menü hinzugefügt werden. Dies ermöglicht den
Anwendern auf bequemem Wege, die Bedienung und Oberfläche von STATISTICA
mit den eigenen Makros anzupassen und zu erweitern. Speichern Sie hierzu
zunächst das Makro mit dem Befehl Als globales Makro speichern aus dem Menü
Datei. Wählen Sie anschließend im Menü Extras den Befehl Anpassen, um den
Dialog Anpassen aufzurufen. Rufen Sie in diesem Dialog das Register
Befehle/Makros auf, und wählen Sie in der Liste Kategorien den Eintrag Makros.
Daraufhin werden alle globalen Makros in der Liste Befehle dieses Registers
aufgeführt. In der folgenden Abbildung wurde zuvor Makro Test1 als globales
Makro abgespeichert.
STATISTICA-Handbuch – 247
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
Wählen Sie in dieser Liste Befehle dann das gewünschte Element aus, so dass Sie es
mittels Drag and Drop in jedes beliebige Menü bzw. jede Symbolleiste ziehen
können. Wenn Sie hierbei mit dem Mauszeiger über ein Menü fahren, wird das
entsprechende Menü aufgerufen, so dass Sie die Möglichkeit haben, das Element
auch in jedes beliebige Untermenü zu platzieren. Nachdem Sie das Makro platziert
haben, können Sie, sofern der Dialog Anpassen geöffnet ist, über das Kontextmenü
der neuen Schaltfläche den Dialog Schaltfläche bearbeiten aufrufen. In diesem
Dialog können Sie den Text der Schaltfläche ändern sowie ein Symbol hinzufügen.
Sie können SVB-Programme
mit STATISTICA auch über die Befehlszeile ausführen, indem der
Befehlszeilenparameter /RunMacro= verwendet wird. Die Syntax lautet:
statist.exe /RunMacro=makroname
wobei Makroname der Dateiname des Makros ist. Wenn nicht der komplette Pfad
spezifiziert wird, wird versucht, das Makro aus dem von STATISTICA zuletzt
gewählten Verzeichnis zu starten (Windows-Standard).
Falls das Makro keine Anwendung oder Dokument auf den Bildschirm aufruft
(mittels Application.Visible = True oder ähnlicher Zeile), wird STATISTICA
nach dem Ausführen des Makros automatisch geschlossen. Falls die Anwendung
auf dem Bildschirm sichtbar ist, bleibt die Anwendung nach der Ausführung des
Makros sichtbar, so dass das Programm manuell geschlossen werden muss.
Dieses Beispiel illustriert, wie eine Analyse in einem Skript aufgezeichnet wird, das
dazu verwendet werden kann, die Analyse zu wiederholen. Das Skript wird
anschließend bearbeitet und mit einem anderen Skript kombiniert, um ein
benutzerangepasstes Skript zu erstellen, das nach Ausführung direkt alle
gewünschten Analysen ausgibt. Zusätzlich wird in diesem Beispiel gezeigt, wie
man die in den Arbeitsmappen beigefügten Skripts verwenden kann, um Analysen
zu wiederholen bzw. automatisch zu aktualisieren.
Öffnen Sie zunächst den Beispieldatensatz Adstudy. Wählen Sie hierzu im Menü
Datei den Befehl Beispieldatei öffnen, um den Dialog STATISTICA-Daten öffnen
aufzurufen. Doppelklicken Sie auf den Ordner Datasets, und öffnen Sie dort den
STATISTICA-Datensatz Adstudy.sta.
248 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
Wählen Sie im Menü Statistik den Befehl Elementare Statistik und anschließend im
Dialog Elementare Statistik und Tabellen die Option Deskriptive Statistik.
Klicken Sie OK, so dass der Dialog Deskriptive Statistik aufgerufen wird.
Klicken Sie die Schaltfläche Variablen, um den Standarddialog zur Variablenauswahl aufzurufen. Wählen Sie die Variablen Messung01 bis Messung23, indem
STATISTICA-Handbuch – 249
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
Sie auf Messung01 klicken und den Mauszeiger auf Messung23 ziehen, und
bestätigen Sie die Auswahl mit OK. Wählen Sie im Dialog Deskriptive Statistik das
Register Details, in dem zahlreiche Optionen zur Verfügung stehen.
Übernehmen Sie in diesem Beispiel alle Standardeinstellungen. Klicken Sie die
Schaltfläche Zusammenfassung, um sich für die ausgewählten Variablen die
deskriptiven Statistiken anzeigen zu lassen.
In dem Moment, in dem die Ergebnisse in der Arbeitsmappe ausgegeben werden,
wird der Dialog Deskriptive Statistik automatisch minimiert, so dass sich die
Ergebnisse im Vordergrund befinden. Klicken Sie daher in der Analysenleiste auf
die Schaltfläche Deskriptive Statistik, um den Dialog erneut aufzurufen.
Während der Durchführung einer Analyse zeichnet STATISTICA automatisch alle
Analyseschritte im Hintergrund auf. Diese Aufzeichnung in Form eines SVBMakros kann dazu verwendet werden, die Analyse zu reproduzieren. Klicken Sie
hierzu im Dialog Deskriptive Statistik auf die Schaltfläche
, und wählen
Sie die Option Erzeuge Makro. Der Dialog Neues Makro wird aufgerufen, der Ihnen
250 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
unter anderem die Möglichkeit bietet, einen Namen und eine Beschreibung des
Makros einzugeben. Übernehmen Sie alle voreingestellten Eingaben, und bestätigen
Sie mit OK. Hierdurch wird die Aufzeichnung der Analyse Deskriptive Statistik im
Editorfenster als SVB-Makro ausgegeben.
Wählen Sie im Menü Ausführen den Befehl Makro ausführen, oder drücken Sie die
Taste F5, um dieses Makro auszuführen. Hierdurch werden exakt dieselben
Ergebnisse der ursprünglichen Analyse reproduziert.
Im Folgenden werden einige Befehle des SVB-Makros genauer erläutert. Eine der
ersten Zeilen lautet:
Set newanalysis = Analysis (scBasicStatistics, ActiveDataSet)
Diese Zeile sagt aus, dass das Makro die Analyse Elementare Statistik ausführen
wird und dass dabei der „aktive“ Datensatz verwendet wird. Dies ist gerade die
zuletzt gewählte Tabelle, bevor das Makro ausgeführt wird.
Einige Zeilen weiter unten beginnt ein Abschnitt mit ...
Set oAD2 = newanalysis.Dialog
..., und unter dieser Zeile sind Eigenschaften wie z. B.:
oAD2.Mean = True
STATISTICA-Handbuch – 251
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
Diese Eigenschaften stellen alle verfügbaren Optionen dar, die in den verschiedenen
Registern des Dialogs Deskriptive Statistik enthalten sind. Hierbei wird jede
einzelne Option des Dialoges durch eine eigene Zeile repräsentiert, und alle
aktuellen Einstellungen wurden aufgezeichnet. Falls Sie entscheiden, den Median
und die Summe der einzelnen Variablen hinzuzufügen, ist dies mithilfe des SVBMakros bequem zu realisieren. Ändern Sie die beiden Zeilen ...
oAD2.Median = False
... und ...
oAD2.Sum = False
... einfach in ...
oAD2.Median = True
... bzw. ...
oAD2.Sum = True
... um. Führen Sie das Makro erneut aus, indem Sie die Funktionstaste F5 drücken.
Der Arbeitsmappe wird eine neue Ergebnistabelle hinzugefügt, die dieses Mal die
beiden Spalten Median und Summe beinhaltet:
Lassen Sie das Makro-Fenster geöffnet, und starten Sie unter Verwendung
desselben Datensatzes eine neue Analyse. Klicken Sie also auf die Tabelle Adstudy,
so dass sie wieder im Vordergrund steht, und wählen Sie dann im Menü Grafik - 2DGrafiken den Befehl Normalverteilungsplots, um den Dialog Normalverteilungsplots
aufzurufen.
252 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
Klicken Sie die Schaltfläche Variablen, und wählen Sie im Dialog Variablenauswahl
für Probability-Plot die Variablen Messung01 bis Messung03. Bestätigen Sie in
diesem Dialog und im Dialog Normalverteilungsplots jeweils mit OK. Hierdurch
wird der Arbeitsmappe für jede der drei gewählten Variablen jeweils ein
Normalverteilungsplot hinzugefügt.
Die einzelnen Schritte zum Erstellen der Grafiken wurden hierbei genauso
aufgezeichnet wie bei der Analyse der Deskriptiven Statistiken. Rufen Sie mittels
entsprechender Schaltfläche in der Analysenleiste wiederum den Dialog
Normalverteilungsplots auf, um ein neues Makro mit diesen Schritten zu erstellen.
Wählen Sie in diesem Dialog via Schaltfläche
den Befehl Erzeuge
STATISTICA-Handbuch – 253
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
Makro.
Klicken Sie im Dialog Neues Makro auf OK, so dass ein neues SVBMakrofenster geöffnet wird, das das aufgezeichnete Normalverteilungsplot-Skript
beinhaltet.
Analog zu den Deskriptiven Statistiken werden in diesem Makro alle gewählten
Optionen des Dialoges Normalverteilungsplots als Eigenschaften dargestellt. Um
beispielsweise den Normalverteilungsplot in einen Einseitigen
Normalverteilungsplot zu ändern, müssen Sie die Zeile ...
oGD1.GraphType = scProbNormal
... in folgenden Ausdruck umändern:
ogD1.GraphType = scProbHalfNormal
Möchten Sie darüber hinaus auch die Variable Messung04 in einem
Normalverteilungsplot darstellen, kann dies in folgender Zeile realisiert werden:
ogD1.Variables = "3-5"
Diese Zeile zeigt die für die Plots ausgewählten Variablen an. Diese Zeile ergibt
sich, da die Variablen Messung01 bis Messung03 gewählt wurden und diesen
Variablen die Variablennummern 3 bis 5 zugewiesen wurden. Ändern Sie die Zeile
wie folgt, um Variable Messung04 (Variablennummer 6) hinzuzufügen:
254 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
ogD1.Variables = 3-6
Führen Sie das Makro erneut mittels F5 aus. Vier neue Einseitige Normalverteilungsplots werden für die Variablen Messung01 bis Messung04 erstellt.
Dieses Beispiel zeigt, wie man ein Makro anhand einer durchgeführten Analyse
erstellt, dieses anschließend modifiziert und dann erneut ausführt. Darüber hinaus
können diese Makros kombiniert werden, um komplexere Makros zu erstellen. Sie
stellen also die Bausteine dar, um mittels der SVB-Sprache eigene leistungsstarke,
benutzerangepasste Analysen zu erstellen.
Im vorigen Beispiel wurde gezeigt, dass STATISTICA bei allen Analysen die
einzelnen Schritte aufzeichnet. Diese Aufzeichnung kann anschließend in einem
Makro geladen werden, das sich modifizieren und erneut ausführen lässt. Wenn die
Analyseergebnisse in einer Arbeitsmappe ausgegeben werden, assoziiert
STATISTICA automatisch das aufgezeichnete Skript mit dem Arbeitsmappenordner,
der die zugehörigen Ergebnisse enthält. Somit wird ermöglicht, eine Analyse zu
wiederholen oder fortzusetzen.
In dem Beispiel des vorigen Abschnitts wurden die Analysen Deskriptive Statistik
und Normalverteilungsplots mehrfach ausgeführt. Die Arbeitsmappe ähnelt daher
folgender Abbildung.
Man beachte, dass jedem dieser Arbeitsmappenordner ein roter Pfeil hinzugefügt
wurde. Dies zeigt an, dass dem Ordner das Skript der zugehörigen Resultate
hinzugefügt wurde. In diesem Fall wird es STATISTICA ermöglicht, diese Analysen
zu wiederholen oder fortzusetzen.
STATISTICA-Handbuch – 255
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
Um eine Analyse zu wiederholen, führen Sie auf einem der Ordner namens
Deskriptive Statistiken einen Rechtsklick aus, und wählen Sie aus dem
Kontextmenü Analyse wiederholen. Der Dialog Analyse wiederholen wird
aufgerufen.
Im Rahmen Eingabe-Daten haben Sie hier die Wahl zwischen den Optionen
Ursprüngliche Datenquelle verwenden und Neue Datenquelle verwenden. Die
letztere Option gibt Ihnen die Möglichkeit, die vorige Analyse als „Schablone“ zu
verwenden, die auf neue Datenquellen angewendet werden kann. Darüber hinaus
kann bezüglich der Ausgabe zwischen den Optionen Aktuellen Ordnerinhalt
ersetzen und Ausgabe in neuen Ordner gewählt werden. Übernehmen Sie in diesem
Beispiel die Standardeinstellungen und bestätigen Sie mit OK. Hierdurch wird der
bisherige Inhalt des Ordners entfernt und kurze Zeit später durch die Ergebnisse der
wiederholten Analyse ersetzt.
Dieses Feature dient unter anderem dem Zweck, die Ergebnisse komplexer
Analysen nach der Eingabe neuer Daten zu wiederholen bzw. zu aktualisieren.
Wenn beispielsweise die Analyse wiederholt wird, nachdem die Daten der
geöffneten Datendatei Adstudy.sta geändert wurden, werden die neuen Ergebnisse
anhand der neuen Daten ermittelt.
Die Funktion Analyse fortsetzen ermöglicht hingegen, zu dem Punkt der Analyse
zurückzukehren, bevor die Ergebnisse erstellt wurden. Man hat demnach auch die
Möglichkeit, die Analyse unter der Auswahl anderer Optionen fortzusetzen.
Klicken Sie erneut mit der rechten Maustaste auf den Ordner Deskriptive
Statistiken, und wählen Sie aus dem Kontextmenü Analyse fortsetzen, so dass der
Dialog Analyse fortsetzen aufgerufen wird. Dieser Dialog enthält wiederum
Optionen zum Festlegen der Datenquelle (ursprüngliche oder neue Daten).
Bezüglich der Ausgabe der neuen Ergebnisse stehen die beiden Optionen Ausgabe
in aktuellen Ordner (im Sinne einer Erweiterung der vorigen Analyse) oder Ausgabe
in neuen Ordner (im Sinne einer neuen Analyse) zur Verfügung.
256 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
Übernehmen Sie die Standardeinstellungen und bestätigen Sie mit OK. Der Dialog
Deskriptive Statistik wird mit genau den Einstellungen aufgerufen, die beim
Erstellen des bisherigen Ordnerinhalts verwendet wurden. Da die
Standardeinstellung auf Ausgabe in aktuellen Ordner gesetzt ist, führt das Klicken
der Schaltfläche Zusammenfassung dazu, dass die neue Ausgabe in demselben
Ordner platziert wird.
Der Begriff ActiveX wird in verschiedenen Zusammenhängen verwendet und seine
Definitionen betonen unterschiedliche Aspekte des Konzepts. Innerhalb von
STATISTICA lässt sich seine Verwendung in zwei allgemeine Kategorien
gruppieren: ActiveX-Objekte und ActiveX-Dokumente.
. Ein ActiveX-Objekt ist das, was früher einmal als OLEObjekt (OLE – Object Linking and Embedding) bezeichnet wurde. Herzstück ist die
Microsoft COM-Technologie (COM – Component Object Model), die es
ermöglicht, auf Objekte in vereinheitlichter Form zuzugreifen. Dank der
Verwendung von Standardprotokollen können Objekte, die in einer Anwendung
erstellt wurden, in einer anderen Anwendung gespeichert und editiert werden. Um
diese Funktionalität zu unterstützen, muss die Anwendung, die das Objekt enthält,
ein ActiveX-Objektclient sein, und die Anwendung, die das Objekt ursprünglich
generiert hat, ein ActiveX-Objektserver. STATISTICA ist beides. Als ActiveXClient erlaubt es STATISTICA, Objekte aus anderen Anwendungen in ein Tabellen-,
Grafik- oder Berichtsfenster einzubetten und zu verknüpfen. Als ActiveX-Server
ermöglicht es STATISTICA, seine Tabellen und Grafiken in andere Anwendungen
einzubetten und zu verknüpfen.
STATISTICA-Handbuch – 257
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
ActiveX-Dokumente gehen mit der ActiveX-Steuerung
einen Schritt weiter, indem sie es erlauben, ganze Dokumente in andere
Anwendungen einzubetten. Ein ActiveX-Dokumentcontainer erlaubt es anderen
Anwendungen, dessen Dokumente in ihm zu benutzen, und ein ActiveX
Dokumentserver erlaubt es seinen Dokumenten, in einem beliebigen ActiveXDokumentcontainer benutzt zu werden. STATISTICA kann wieder beides.
STATISTICA-Arbeitsmappen sind ActiveX-Dokumentcontainer und ermöglichen
die Anzeige von Dokumenten anderer ActiveX-Server innerhalb von
Arbeitsmappen. Beispiele hierfür sind Microsoft Word und Excel; deren
Dokumente direkt in STATISTICA-Arbeitsmappen verwendet werden können.
Ähnlich sind Tabellen, Grafiken und Berichte von STATISTICA ActiveXDokumentserver, die in einen beliebigen ActiveX-Dokumentcontainer wie z. B.
dem Microsoft Internet Explorer platziert werden können.
Die Technologie der
ActiveX-Dokumente stellt besondere Anwendungsmöglichkeiten für Word- und
Excel-Dokumente bereit. STATISTICA kann diese Dokumente in ihren eigenen
gewohnten Fenstern innerhalb des STATISTICA-Arbeitsplatzes öffnen. Diese
„Office-Integration“ ermöglicht, Excel-Dokumente als Datenquellen zu nutzen und
Berichte von Analysen direkt als Word-Dokumente auszugeben. Wenn diese
Dokumente innerhalb des STATISTICA-Fensters geöffnet werden, stehen auch die
entsprechenden Menüs und Symbolleisten für Excel bzw. Word zur Verfügung.
STATISTICA unterstützt die Object Linking und Embedding-Konventionen (OLE;
Verknüpfen und Einbetten) für die Verbindung von Werten, Texten, Grafiken oder
anderen Objekten in STATISTICA-Dokumenten (z. B. Tabellen oder Berichte) mit
Dokumenten in anderen (Windows-) Anwendungen. Technisch gesprochen können
OLE-Verbindungen zwischen einer Quelldatei (oder Server-Datei; z. B. einem
Microsoft Word-Dokument) und einem STATISTICA-Dokument (die Client-Datei)
aufgebaut werden, so dass sich bei Veränderungen der Daten in der Quelldatei die
Daten im entsprechenden Teil des STATISTICA-Dokuments (Client-Datei)
automatisch aktualisieren. Darüber hinaus kann STATISTICA als Quelldatei (oder
Server-Datei) für andere OLE-kompatible Dokumente fungieren. Auf diese Weise
lassen sich Werte einer STATISTICA-Tabelle mit einer Tabelle in einem Microsoft
258 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
Word-Dokument verbinden, so dass sich das Word-Dokument aktualisiert, sobald
Daten in der STATISTICA-Tabelle verändert werden.
STATISTICA unterstützt ebenfalls die Dynamic Data Exchange (Dynamischer
Datenaustausch; DDE)-Konventionen. Man kann DDE-Verknüpfungen zwischen
einer Quelldatei (oder Server-Datei; z. B. eine Microsoft Excel-Tabelle) und einer
STATISTICA-Datendatei (der Client-Datei) aufbauen, so dass Veränderungen der
Daten der Quell-Datei zu einer automatischen Aktualisierung des entsprechenden
Teils der STATISTICA-Tabelle (Client-Datei) führen. So lassen sich Bereiche von
Daten in der Tabelle dynamisch mit einer Teilmenge von Daten anderer WindowsAnwendungen verbinden.
Eine typische Anwendung für die dynamische Verbindung zweier Dateien wäre
eine industrielle Umgebung, in der die STATISTICA-Datendatei dynamisch mit
einem Messgerät verbunden ist, das an eine serielle Schnittstelle angeschlossen ist
(um z. B. automatisch bestimmte Messungen stündlich zu aktualisieren). Wie beim
OLE ist der Aufbau dieser Prozeduren einfacher als es erscheinen mag und erfordert
keine technischen Kenntnisse über die Mechanismen des DDE.
STATISTICA-Handbuch – 259
Copyright © StatSoft, 2009
KAPITEL 9: STATISTICA VISUAL BASIC
260 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
STATISTICA Quick Reference – 261
Copyright © StatSoft, 2007
Die technischen Begriffe in dieser Einführung (z. B. ODBC, SQL)
werden im Glossar des Elektronischen Handbuchs erklärt, das im Hilfe-Menü über
STATISTICA Hilfe aufgerufen werden kann.
STATISTICA Query wird eingesetzt, um bequemen Zugriff auf Daten in
verschiedenen Datenbanken (einschließlich vieler großer Systemdatenbanken wie
Oracle, MS SQL Server, Sybase) über Microsofts OLE-DB-Konventionen zu
verschaffen. OLE DB ist eine mächtige Datenbanktechnologie, die ungeachtet des
Datentyps eine universelle Datenintegration in einem unternehmensweiten
Netzwerk vom Großrechner bis zum Desktop erlaubt. OLE DB bietet eine
allgemeinere und effizientere Strategie des Datenzugriffs als das ältere ODBC, weil
es mehr Datentypen unterstützt und auf dem Component Object Model (COM)
basiert.
STATISTICA Query unterstützt multiple Datenbanktabellen. Datensätze
(Tabellenreihen) lassen sich über SQL-Code auswählen, welchen STATISTICA
Query automatisch für Sie generiert, wenn Sie die Komponenten der Abfrage über
eine einfache grafische Oberfläche oder intuitive Menüoptionen und Dialoge
auswählen. Daher sind keine tiefer gehenden Kenntnisse von SQL erforderlich, um
auf schnelle Art komplexe und mächtige Datenabfragen zu generieren. Mehrere
Abfragen auf viele verschiedene Datenbanken zur Weitergabe an ein einzelnes
STATISTICA Handbuch – 263
Copyright © StatSoft, 2009
KAPITEL 10:
STATISTICA QUERY
Datenblatt lassen sich ebenfalls erstellen und die simultane Verknüpfung zu
mehreren externen Datenbanken aufrechterhalten.
Dies sind die erforderlichen Schritte zur Abfrage externer Daten über STATISTICA
Query:
1. Wählen Sie Neue Abfrage erstellen im Menü Daten - Externe Daten (oder im
Menü Datei - Externe Daten), um den Dialog Datenbankverknüpfung aufzurufen.
In diesem Dialog wählen Sie eine vordefinierte Datenbankverbindung (den
Provider, Datenquellenpfad und weitere Einstellungen des Servers oder des
Verzeichnisses für den Ort der Daten). Wenn noch keine Datenbankverbindung
eingerichtet wurde, lässt sich das über die Schaltfläche Neu im Dialog
Datenbankverknüpfung nachholen. Der Dialog Datenverknüpfungseigenschaften
wird dann angezeigt, der Sie mit einem Assistenten Schritt-für-Schritt beim
Erstellen der Datenbankverknüpfung begleitet. Eine spezielle Dokumentation
zum Gebrauch des Dialogs Datenverknüpfungseigenschaften rufen Sie mit F1 ab,
um Hilfe zu Microsoft Data Link Help® anzeigen zu lassen.
2. Nach Auswahl der Datenbankverknüpfung und Bestätigung mit OK im Dialog
Datenverknüpfungseigenschaften haben Sie Zugang zu STATISTICA Query, wo
Sie Ihren SQL-Ausdruck durch Spezifikation der gewünschten Tabellen, Felder,
Verknüpfungen, Kriterien usw. (über die Menüs Tabelle, Verknüpfung und
Kriterien) zur Aufnahme in die Abfrage erstellen können.
264 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 10: STATISTICA QUERY
3. Nachdem Sie die Abfrage spezifiziert haben, wählen Sie Daten an STATISTICA
zurückgeben im Menü Datei. Danach wird der Dialog Externe Daten an eine
Tabelle übergeben angezeigt, in dem Sie den Namen der Abfrage, Zielort für die
von STATISTICA Query übergebenen Daten und weitere Einstellungen
vornehmen können.
Siehe das Elektronische Handbuch zu weiteren Einzelheiten.
Die in den vorangegangenen Abschnitten beschriebenen Abfragefunktionen sind als
Teil der Unternehmensversionen von STATISTICA (siehe STATISTICAProduktfamilie, Seite 298) zusätzlich erweitert durch Optionen zur Verarbeitung der
Daten von externen Servern „vor Ort“, d. h., ohne die Daten zu importieren und eine
lokal Datendatei anzulegen. Diese In-Place Database Processing-Technologie
STATISTICA-Handbuch – 265
Copyright © StatSoft, 2009
KAPITEL 10:
STATISTICA QUERY
(IDP) eignet sich besonders zur Bearbeitung sehr großer Datendateien, bei der sie
signifikante Leistungsgewinne zeigt. Dadurch wird die Bearbeitung von
Datendateien ermöglicht, deren Größe die Speicherkapazität des lokalen Laufwerks
oder STATISTICA-Servers übersteigt.
. Die IDP-Technologie basiert auf einer Architektur
verteilter Verarbeitung, wobei die Abfragen auf der Serverseite durchgeführt
werden (hierbei werden die CPU-Ressourcen des Servers verwendet) und die
entsprechenden Aufzeichnungen an den STATISTICA-Computer gesendet werden,
wo sie in dem Moment, in dem sie zur Verfügung stehen, simultan (asynchron)
verarbeitet werden.
266 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
Nahezu jeder Aspekt von STATISTICA liegt auch in der Form von COM-Interfaces
vor, die auf einem Rechner während der STATISTICA-Installation registriert
werden. Da .NET-Sprachen nicht direkt mit COM kommunizieren können, wird
eine Wrapper-Klasse namens COM Interop verwendet, um die STATISTICABibliotheken in das .NET-Projekt zu integrieren. Sofern man Visual Studio .NET
als integrierte Entwicklungsumgebung verwendet, wird beim Import eines COMInterfaces das COM Interop automatisch erstellt. COM Interop ist hierbei für alle
Details bezüglich der Interaktion der COM-Bibliotheken innerhalb .NET zuständig.
Nach Anbindung von COM Interop lassen sich die STATISTICA COM-Interfaces
wie jedes andere .NET-Objekt handhaben.
Beim Hinzufügen der gewünschten STATISTICA COM-Interfaces in das .NETProjekt wird COM Interop automatisch erstellt. STATISTICA Object Library ist
hierbei die grundlegende STATISTICA COM-Bibliothek. Um die STATISTICA
Object Library in ein .NET-Projekt einzubinden, wählen Sie im ProjektmappenExplorer zunächst das gewünschte .NET-Projekt. Wählen Sie anschließend im
STATISTICA-Handbuch – 269
Copyright © StatSoft, 2009
KAPITEL 11: PROGRAMMIERUNG IN .NET
Kontextmenü (aufrufbar mit Rechtsklick auf dem .NET-Projekt) den Befehl
Verweis hinzufügen, so dass der Dialog Verweis hinzufügen aufgerufen wird.
Wählen Sie im Dialog Verweis hinzufügen das Register COM und anschließend in
der Liste Komponentenname die STATISTICA Object Library. Bestätigen Sie mit
OK.
Hierdurch wird die notwendige COM Interop-Bibliothek automatisch erstellt. Wird
der Knoten Verweise geöffnet, erscheint nun der Eintrag STATISTICA.
270 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 11:
PROGRAMMIERUNG IN .NET
Zusätzlich wird die Datei Interop.STATISTICA.dll dem Ausgabepfad des Projektes
hinzugefügt. Die STATISTICA COM Interop-Bibliothek ist in dieser Datei
gespeichert. Um die STATISTICA Object Library innerhalb des .NET-Projektes zu
betrachten, müssen Sie mit rechter Maustaste auf den STATISTICA-Verweis klicken
und anschließend im Kontextmenü den Befehl Im Objekt-Browser anzeigen wählen.
Es ebenfalls möglich, die COM-Interoperabilität manuell zu erzeugen und dann in
das .NET-Projekt zu importieren. Dies ermöglicht zusätzlich, die Interop-DLL
umzubenennen sowie einen benutzerdefinierten Namensraum (namespace) zu
definieren. Das Programm, mit dem diese COM-Interoperabilität erzeugt werden
kann, heißt TLBIMP.EXE. Rufen Sie das Programm TLBIMP über Visual Studio
mit Verweis auf die Typbibliothek und folgenden Befehlszeilenoptionen auf, die
den DLL-Namen sowie Namensraum spezifizieren:
STATISTICA-Handbuch – 271
Copyright © StatSoft, 2009
KAPITEL 11: PROGRAMMIERUNG IN .NET
In diesem Beispiel wird auf STATIST.EXE verwiesen, da diese Datei die
Typbibliothek STATISTICA Object Library enthält. Nach dem Erstellen der InteropDLL kann die Datei im Projektmappen-Explorer wie im vorigen Abschnitt über den
Befehl Verweis hinzufügen Ihrem .NET-Projekt hinzugefügt werden. Sie müssen in
dem Dialog dann allerdings das Register Durchsuchen wählen, um die neu erstellte
Interop-DLL auszuwählen.
Um mehrere Versionsnummern von STATISTICA zu unterstützen, ist es notwendig,
die verschiedenen Versionen der STATISTICA Object Library mittels separater
Interop-DLL-Dateien einzubinden. Verwenden Sie hierfür den TLBIMP-Befehl, um
für bestimmte Versionen der STATIST.EXE und anderen DLL-Dateien die
entsprechenden Interop-DLL-Dateien zu erzeugen. Vergewissern Sie sich vor dem
Verteilen der Anwendung auf verschiedene Rechner, dass die korrekte Version der
STATISTICA Interop-DLL eingebunden wurde.
Aufgrund der COM-Architektur kann STATISTICA in viele unterschiedliche
Entwicklungsumgebungen eingebunden werden. Wenn STATISTICA innerhalb
einer externen Entwicklungsumgebung verwendet wird, ist es notwendig, ein Top272 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 11:
PROGRAMMIERUNG IN .NET
Level-Objekt zu definieren, das als Applikationsobjekt bezeichnet wird. Dieses
Applikationsobjekt stellt die STATISTICA-Anwendung dar, die wiederum andere
Objekte enthält (zum Beispiel Tabellen und Grafiken). Der Zugriff auf diese
untergeordneten Objekte ist allerdings nur dann möglich, sofern das
Applikationsobjekt ausgeführt wird.
Angenommen, man verwendet den voreingestellten Namensraum STATISTICA, so
sollte die Variable als STATISTICA.Application deklariert werden. Um eine neue
STATISTICA-Instanz zu generieren, setzen Sie die Variable dann gleich
new STATISTICA.ApplicationClass().
Nach der Erzeugung einer Instanz der STATISTICA.ApplicationClass wird ein
STATIST.EXE-Prozess gestartet. Dies entspricht dem Starten von STATISTICA aus
dem Start-Menü. Die STATISTICA-Instanz ist zunächst verborgen, kann aber durch
den entsprechenden Befehl sichtbar gemacht werden. Da dies ein separater Prozess
ist, sind alle Aufrufe dieser Instanz prozessextern (out-of-process).
Zusätzlich zu dem Objekt STATISTICA.Application gibt es auch eine schlankere,
leistungsstärkere Version dieses Objekts namens STATISTICA.Library. Die
Library-Version wird separat lizenziert und ist demnach eventuell nicht Bestandteil
Ihrer Installation. Diese Version enthält dieselben Schnittstellen wie
STATISTICA.Application. In jeder bestehenden Codezeile, die das ApplicationObjekt aufruft, kann dieses Objekt mit dem Library-Objekt ersetzt werden.
Die hauptsächliche Einschränkung der Library-Version besteht darin, dass die
Features der STATISTICA-Benutzeroberfläche nicht verfügbar sind. Wird demnach
im obigen Beispiel das Applikationsobjekt als neue STATISTICA.LibraryClass
generiert, wäre es nicht möglich, das Objekt (die STATISTICA-Benutzeroberfläche)
sichtbar zu machen.
STATISTICA-Handbuch – 273
Copyright © StatSoft, 2009
KAPITEL 11: PROGRAMMIERUNG IN .NET
Die Library-Version von STATISTICA wird prozessintern geladen, womit der
Zugriff auf die COM-Interfaces effizienter als bei der Application-Version des
Objektes ist (die prozessextern geladen wird). Da prozessintern geladen wird,
können nicht mehrere Instanzen dieser Library-Version generiert werden.
Normalerweise wird in einem Programm allerdings nur eine Instanz des LibraryObjekts bzw. Application-Objekts generiert.
274 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
KAPITEL 11:
PROGRAMMIERUNG IN .NET
STATISTICA-Handbuch – 275
Copyright © StatSoft, 2009
KAPITEL 11: PROGRAMMIERUNG IN .NET
276 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
Der einfachste Weg zur Hilfe bei der
Programmbedienung und zu einem breiten
Angebot an Information über STATISTICA ist
das Elektronische Handbuch, das mehr als 100
Megabytes an Literaturhinweisen,
Illustrationen und Beispiele enthält.
Dieses Hypertext-Dokument bietet mehr als
nur Erklärungen von Optionen in STATISTICA.
Es enthält zahlreiche Beispiele, Überblicke und
Illustrationen mit Tausenden von Tipps zur
Optimierung Ihrer Arbeit.
STATISTICA-Handbuch – 277
Copyright © StatSoft, 2009
ANHANG A: WEITERE HILFE
Das STATISTICA Elektronische Handbuch ist
sehr umfassend und bietet auch einen
integrierten Statistischen Ratgeber (siehe
Seite 33), begleitet vom kompletten Inhalt des
preisgekrönten Elektronischen StatistikLehrbuchs und dem Glossar von StatSoft.
Das Elektronische Statistik-Lehrbuch von
StatSoft wurde von der Encyclopedia
Britannica wegen seiner Qualität, Genauigkeit,
Gestaltung und Bedienbarkeit empfohlen.
Dieses Textbuch wird schon seit Jahren
weltweit in Bildungs- und
Forschungsaktivitäten von Universitäten und
Forschungsinstituten eingebunden.
Die Website von StatSoft bietet
Zugang zu vielen nützlichen Quellen für die
professionelle Datenanalyse und enthält
darüber hinaus:
 eine ständig aktualisierte Sektion Frequently
Asked Questions (häufig gestellte Fragen)
 einen Download-Bereich, in dem Anwender
der aktuellen Versionen von STATISTICAProdukten herunterladbare Updates ihrer
Software bekommen. Wir arbeiten
fortlaufend an einer Steigerung der
Kompatibilität von STATISTICA auch mit
Anwendungen, die nicht den
Standardkonventionen entsprechen. Darum
kann ein Herunterladen eines Updates
278 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
ANHANG A: WEITERE HILFE
hilfreich sein, wenn das aufgetretene
Problem durch eine unübliche
Systemkonfiguration oder einen Konflikt
mit anderen Anwendungen verursacht
wurde.
Betriebssystems bereit, wenn Sie Ihre StatSoftNiederlassung kontaktieren.
Wenn die oben angegebenen Quellen Ihre
Frage nicht beantworten, können Sie uns eine
E-Mail schreiben. Bitte geben Sie dabei
Seriennummer (wählen Sie Info im Hilfe-Menü
zur Anzeige Ihrer Seriennummer),
Informationen über Ihre Hardware
[Prozessortyp (CPU), Speicherumfang (RAM)
und Festplattenkapazität] sowie die Version des
Betriebssystems an. Senden Sie Ihre E-Mail an
[email protected].
Sie
können auch Ihre regionale StatSoftNiederlassung anrufen, um mit einem
Techniker zu sprechen (in Deutschland
040 - 4688660). Anschriften der StatSoftNiederlassungen finden Sie im Hilfe-Menü
unter Info im Register Niederlassungen:
Bitte halten Sie stets Ihre Seriennummer
(wählen Sie Info im Hilfe-Menü zur Anzeige
Ihrer Seriennummer), Informationen über Ihre
Hardware sowie über die Version des
STATISTICA-Handbuch – 279
Copyright © StatSoft, 2009
ANHANG A: WEITERE HILFE
280 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
STATISTICA-Handbuch – 281
Copyright © StatSoft, 2009
ANHANG A: WEITERE HILFE
282 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
STATISTICA wird mittels
WebSTATISTICA Server die komplette
Webfähigkeit hinzugefügt, einschließlich der
Möglichkeit, STATISTICA
interaktiv von einem
Webbrowser aus
auszuführen. Sofern eine
Internetverbindung besteht,
wird von nahezu jedem
Computer auf dieser Welt
der einfache und schnelle
Zugriff auf Daten und
mächtige analytische
Werkzeuge ermöglicht.
Dieses Produkt wird mit
einer Auswahl von
Webbrowser-basierten
Benutzeroberflächen (in der
Form von Dialogen, die extrem einfach zu
navigieren und zu verwenden sind) angeboten,
die es ermöglichen, mit einem standardmäßigen
Webbrowser Analysen zu spezifizieren und sich
Ergebnisansichten erstellen zu lassen. Es werden
ebenfalls Tools angeboten, um diese Dialoge
anzupassen, um neue, benutzerangepasste
Oberflächen zu erstellen oder um neue
Funktionen hinzuzufügen. Die Oberfläche in
dem Webbrowser kann beispielsweise aus einem
einfachen Dialog bestehen, der lediglich drei
Schaltflächen enthält, wobei das Klicken einer
dieser Schaltflächen, eine Serie von Analysen
ausführt und detaillierte Berichte erstellt.
WebSTATISTICA Server fügt der gesamten
Produktlinie von STATISTICA, der
Datenanalyse, Data Mining und
Qualitätsregelkarten/Six Sigma-Methoden, eine
neue Dimension und eine
große Anzahl von neuen
Anwendungsmöglichkeiten hinzu.
WebSTATISTICA Server
ist ein hoch skalierbares
Anwendungssystem auf
Unternehmensebene, das
eine webbasierte
Datenanalyse und ein
Datenbank-Gateway
umfasst. Dieses System
basiert auf der
Technologie der verteilten Verarbeitung und
unterstützt vollständig Konfigurationen von
mehrstufigen Client-Server-Architekturen.
WebSTATISTICA Server bietet die Analyse-,
Abfrage-, Berichts- und Grafikfunktionen von
STATISTICA über eine einfach zu verwendende,
interaktive, standardmäßige Weboberfläche an.
Sie wird als eine komplette, zur Installation
bereitstehende Anwendung angeboten, die eine
interaktive, Webbrowser-basierte („Point-andClick“-)Benutzeroberfläche umfasst, die es
Anwendern in entfernten Orten ermöglicht,
interaktiv Datensätze zu erstellen, Analysen
STATISTICA-Handbuch – 283
Copyright © StatSoft, 2009
ANHANG B: WebSTATISTICA
auszuführen und Analyseergebnisse zu
betrachten. Aufgrund seiner offenen Architektur
umfasst WebSTATISTICA Server jedoch
ebenfalls Development Kit Tools (wobei die
gesamten Syntaxkonventionen auf
Industriestandards wie VB Script, C++, HTML
und XML basieren), die es einer IT-Abteilung
ermöglichen, alle Hauptkomponenten des
Systems anzupassen oder zu erweitern, indem
neue Komponenten und/oder
unternehmensspezifische Analyse- oder
Datenbankfunktionen hinzugefügt werden. Das
System ist mit allen gebräuchlichen WebserverPlattformen (z. B. UNIX Apache, Microsoft IIS)
kompatibel, funktioniert in Microsoft .NET- als
auch Sun/Java-Umgebungen und erfordert keine
Anpassungen von vorhandenen Firewall- und
Internet/Intranet-Sicherheitssystemen.
WebSTATISTICA Server wird als eine
Komplettlösung angeboten, die alle
Analysefunktionen eines beliebigen STATISTICAProdukts oder einer beliebigen Kombination von
Produkten enthalten kann, z. B. von STATISTICA
Basis bis zu Produkten der Enterprise-Linie (u. a.
STATISTICA Enterprise und Data Miner).
Die Installation der WebSTATISTICA ServerSoftware umfasst als Minimum die
Analysefunktionen von STATISTICA Basis und
eine Netzwerklizenz von 5 Nutzern.
Man kann hierbei entweder eine bestimmte
Version von WebSTATISTICA Server
einschließlich der erforderlichen
Analysefunktionen erwerben (z. B. STATISTICA
Basis für 10 Benutzer) oder die Web ServerFunktionalität (wie sie in diesem Abschnitt
beschrieben wird) für alle oder einen Teil der
Nutzer der bereits verwendeten STATISTICANetzwerklizenz hinzufügen (z. B. die Web
Server-Funktionalität für 20 der 50 Nutzer von
STATISTICA Enterprise hinzufügen).
Der
wahrscheinlich deutlichste Vorteil der
WebSTATISTICA Server-Technologie liegt darin,
dass die Leistungsstärke jedes einzelnen Produkts
der STATISTICA-Produktfamilie für jeden
beliebigen Computer in der Welt zur Verfügung
gestellt wird, sofern der Rechner mit dem Internet
verbunden ist. Die WebSTATISTICA ServerAnwendungen fügen demnach der gesamten
Produktlinie der STATISTICA Datenanalyse, Data
Mining und Qualitätssicherung/Six SigmaSoftware eine neue Dimension unbegrenzter
Möglichkeiten hinzu.
Beispielsweise können die aktuellsten Daten und
Berichte (die z. B. mittels Abfragen des im
Unternehmen vorhandenen Data Warehouse
aktualisiert werden) – einschließlich interaktiver
Drill-Down-Optionen, um aus den Ergebnissen
zusätzliche Einsichten über die Geschäftslage zu
erhalten – nun für autorisierte Angestellte
überall auf der Welt und unabhängig vom
Rechnertyp verfügbar gemacht werden. Wo auch
immer eine Internetverbindung verfügbar ist
(d. h. nahezu überall), besteht nun gleichzeitig
Zugriff auf Abfragen, Berichte und
Analysewerkzeugen des umfassendsten
Datenanalysesystems.
Ein weiterer
ebenso wichtiger Ansatz, aus der
WebSTATISTICA Server-Funktion Vorteile zu
ziehen, liegt darin, es als Kern und natürliche
Erweiterung eines STATISTICA-Produkts der
Enterprise-Linie (z. B. STATISTICA Enterprise
oder Data Miner) zu verwenden.
Insbesondere kann WebSTATISTICA Server als
Kern eines unternehmensweiten Netzwerkes
dienen, das den Teilnehmern ermöglicht,
gemeinschaftlich zu arbeiten und Ergebnisse
284 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
ANHANG B: WebSTATISTICA
(Berichte), sowie Skripte von Analysen oder
Abfragen auf schnellem Wege auszutauschen.
Benutzer- oder Gruppenrechte (siehe
Technischen Hinweis weiter unten) können von
Administratoren verwaltet werden, so dass nur
bestimmte Gruppen von Nutzern Zugriff auf
bestimmte Daten oder Berichte erhalten. Dank
der Verfügbarkeit über das Internet ist
WebSTATISTICA Server ein perfektes System,
um Gemeinschaftsprojekte von Mitarbeitern zu
erleichtern, die sich in verschiedenen
Betriebsstätten aufhalten (selbst auf
unterschiedlichen Kontinenten), verschiedenen
Branchen des Unternehmens angehören,
Heimarbeit betreiben oder sich häufig auf
Geschäftsreise befinden.
Unabhängig
davon, ob sich die Anwender nahe zum
WebSTATISTICA Server befinden (z. B. im
selben Gebäude) oder weit entfernt (z. B. auf
einem anderen Kontinent), liegt der Nutzen nicht
nur in der vereinfachten Gemeinschaftsarbeit,
sondern auch in der Option, rechenintensive und
zeitaufwendige Aufgaben an die Servercomputer
zu übergeben. Insbesondere da die meisten
leistungsstarken Mehrprozessor-CPUs (und/oder
mehrere Computer) gewöhnlich als Server
verwendet werden, können Anwender nun die
rechenintensiven Aufgaben abgeben und
beispielsweise „im Hintergrund“ Abfragen
ausführen, die Terabytes von Daten auf einem
entfernten Server scannen und auch gleichzeitig
lange Sequenzen von Analysen und Berichten
ausführen. Der Computer des Anwenders wird
hierbei nicht beansprucht, so dass noch weitere
Aufgaben durchgeführt werden können.
Aufgrund dieser Architektur verteilter
Verarbeitung kann WebSTATISTICA Server in
hocheffizienter Manier aus Mehrprozessor-CPUs
und/oder mehreren Computern Vorteile ziehen,
wobei diese Vorteile der mehrstufigen ClientServer-Architektur dem Anwender direkt
weitergegeben werden. Die Stufen bestehen
hierbei aus:
 Stufe 1 ist die Benutzeroberfläche des Clients
(ein einfacher Browser oder STATISTICA
Client, siehe weiter unten),
 Stufe 2 ist die WebSTATISTICA ServerSoftware und gegebenenfalls die Einrichtung
eines „Informationsdienstes des
Unternehmens“ (bestimmte Abfragen, Skripte
von benutzerangepassten Analysen usw.) und
 Stufe 3 sind die STATISTICA-Datenbanken
(z. B. STATISTICA Data Warehouse) oder
andere Datenbanken des Unternehmens.
In der Desktop-Version von STATISTICA
werden alle Berechnungen auf dem lokalen
Rechner durchgeführt, wobei Ressourcen
anderer Rechner nur dann beansprucht werden,
wenn die In-Place Database Processing (IDP)Schnittstelle zu externen Datenbanken
eingerichtet worden ist. Mit IDP werden die
Daten von einem Datenbankserver direkt und
asynchron abgerufen (unter Verwendung
verteilter Verarbeitung, wenn dies vom Server
unterstützt wird), womit die Notwendigkeit eines
Datenimports umgangen und eine lokale Kopie
des Datensatzes erstellt wird. Insbesondere
verwendet IDP die Verarbeitungsressourcen
(mehrere CPUs) des Server-Computers, um die
Abfrage-Operationen auszuführen, die
Datensätze zu extrahieren und diese an den
STATISTICA-Computer zu senden, während
STATISTICA die erhaltenen Datensätze
gleichzeitig verarbeitet.
Bei Verwendung einer Client-Server-Version
von STATISTICA ist der lokale Computer nur für
die Benutzeroberfläche von STATISTICA
zuständig, wobei sämtliche Berechnungen auf
dem Server ausgeführt werden. Die ClientServer-Architektur bietet bei größeren Projekten
(z. B. rechenintensive Aufgaben oder die
Bearbeitung extrem großer Datensätze)
offensichtliche Vorteile, da der lokale Rechner
nach der Übergabe dieser Projekte an den Server
andere Aufgaben durchführen kann.
STATISTICA-Handbuch – 285
Copyright © StatSoft, 2009
ANHANG B: WebSTATISTICA
Obwohl für den Client
keine Komponenten des STATISTICA-Systems
zwingend notwendig sind (lediglich ein
Browser), bietet die Installation von
STATISTICA auf der Clientseite weitere
Möglichkeiten. Man könnte sich fragen:
„Warum sollte man WebSTATISTICA Server
verwenden, wenn auf dem Laptop bereits eine
bereits eine STATISTICA-Version installiert
ist?“ Die Antwort ist, dass es die STATISTICAInstallation auf dem Client-Rechner ermöglicht,
zusätzliche Vorteile aus der mehrstufigen ClientServer-Architektur (siehe oben) zu ziehen. Es
bietet sich nun an, die lokale STATISTICAInstallation interaktiv mit dem Server zu nutzen,
indem bestimmte zeitaufwendige Aufgaben
übertragen und/oder Daten zwischen allen drei
Ebenen ausgetauscht werden. WebSTATISTICA
lässt sich innerhalb der lokalen STATISTICAInstallation starten, wobei sich deren Interaktion
flexibel regeln lässt. Eine Vielzahl von Optionen
ist verfügbar, um die Aufgaben zwischen
Desktop-Rechner und Server zu verteilen.
Falls die Ausgabe von WebSTATISTICA im
Browser betrachtet wird, bieten sich ebenfalls
Optionen, einen Teil oder alle Ausgabeobjekte
zur Weiterverarbeitung auf den Desktop-Rechner
zu transferieren. Dies kann beispielsweise mit
einem Klick auf einer kleinen Schaltfläche
realisiert werden, die von WebSTATISTICA
Server optional (abhängig von der Benutzerkonfiguration) an jedes Ausgabeobjekt (Tabelle
oder Grafik) angehängt werden kann. Es bietet
sich somit die Option, das Objekt (eine
STATISTICA-Tabelle oder -Grafik) auf den
Client-Rechner in seinem originalen
STATISTICA-Format (im .sta- oder .stgDateiformat) herunterzuladen, so dass es mittels
der lokal installierten STATISTICA-Werkzeuge
auch offline weiterverarbeitet werden kann.
Die WebSTATISTICA-Plattform basiert auf den
fortgeschrittenen Technologien der verteilten
Verarbeitung und des Multithreading, um große
Rechenvorgänge optimal zu verwalten. Diese
Technologie ermöglicht die schnelle Verarbeitung
von selbst sehr großen rechenintensiven Projekten,
wobei die Vorteile von Servern mit
Mehrprozessor-CPUs oder gar mehreren parallelen
Servern voll genutzt werden.
Diese Abbildung zeigt ein Projekt, das auf einem
Server mit vier Prozessoren ausgeführt wird,
inklusive des Monitors der Systemleistung, der
anzeigt, dass die Ressourcen aller vier CPUs, die
im Multithreading-Modus ein einzelnes
rechenintensives STATISTICA Data MinerProjekts ausführen, voll ausgeschöpft werden.
Die WebSTATISTICA-Architektur liefert
zusätzlich eine plattformunabhängige,
browserbasierte Benutzeroberfläche und die
ultimative Fähigkeit, die Projekte oder Gruppen
von Nutzern auf Unternehmensebene „über den
286 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
ANHANG B: WebSTATISTICA
Büroflur oder über Kontinente hinweg“ zu
verwalten.
Eine der
besonderen Fähigkeiten bezüglich der
Technologie der verteilten Verarbeitung von
STATISTICA liegt in der flexiblen
Skalierbarkeit, die sich nicht nur auf alle CPUs
des aktuellen Servers bezieht (um neben
mehreren Aufgaben/Nutzern auch einzelne
rechenintensive Projekte zu unterstützen),
sondern selbst mehrere Servercomputer umfasst.
Dieses einzigartige Feature ist wichtig, da es
eine signifikante Leistungssteigerung
ermöglicht. STATISTICA wendet die parallele
Verarbeitung auch über mehrere Hardwareeinheiten an (wie es von einigen
Supercomputern praktiziert wird). Beim
Vorhandensein von drei Servern mit jeweils vier
Prozessoren ist es beispielsweise möglich, dass
STATISTICA einzelne Projekte auf allen 12
Prozessoren ausführen kann (wenn der Umfang
dieses Projekts eine derartige Verarbeitung
erfordert).
Die Benutzeroberfläche von STATISTICA lässt
sich also von einem oder mehreren Benutzern
gleichzeitig von jedem Computer in der Welt
erreichen (sofern ein Internetanschluss vorliegt,
selbst bei langsamer Verbindung), wohingegen
der Server alle Berechnungen und Datenoperationen durchführt, so dass die
Sicherheitsarchitektur und die Zugriffsrechte auf
die entsprechenden Projekte und Benutzerklassen von einem Netzwerkadministrator
verwaltet werden können.
WebSTATISTICA bietet eine geradlinige
Benutzeroberfläche, die eine Auswahl von
interaktiven Arbeitsabläufen im Bereich
Datenanalyse, Data Mining, Qualitätsregelung,
Datenbankverwaltung, Datenbankabfragen und
Grafikanpassung ermöglicht.
Nach Anmeldung in das WebSTATISTICASystem ...
Mit der Umsetzung von WebSTATISTICA
können die Anwender das Programm vom
Clientrechner interaktiv in einer Browseroberfläche ausführen, die der Oberfläche der
Desktopversion von STATISTICA ähnelt. Sofern
der Rechner mit dem Internet verbunden ist,
kann die Clientseite der Anwendung (das
„Frontend“) auf jedem beliebigen Computer
(selbst auf einem Laptop) ausgeführt werden.
Die tatsächlichen Berechnungen und andere
Arbeiten an den Daten werden jedoch auf dem
(entfernten) Server ausgeführt, der gewöhnlich
über leistungsstärkere Prozessoren und weitaus
größere Speicherressourcen verfügt (die darüber
hinaus mittels der optimierten Architektur des
Multihreading und der verteilten Verarbeitung
verwaltet werden, so dass die maximale Leistung
erreicht wird).
STATISTICA-Handbuch – 287
Copyright © StatSoft, 2009
ANHANG B: WebSTATISTICA
... kann eine Datenquelle (Datensatz oder
bestehende Datenbankverbindung) ausgewählt
werden, ...
(oder mittels Verknüpfung im benutzerdefinierten My Menu), ...
... können Variablen und bestimmte optionale
Analyseparameter festgelegt werden ...
... können anschließend die Daten im
interaktiven WebSTATISTICA-Tabelleneditor
betrachtet und bearbeitet werden, ...
... kann die durchzuführende Analyse mittels des
standardmäßigen Menüsystems gewählt werden
288 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
ANHANG B: WebSTATISTICA
... und Ergebnisse interaktiv betrachtet werden.
interaktiven Erstellung von Data-MiningModellen, die durch das Ziehen von Pfeilen in
der Modell-Arbeitsfläche realisiert wird, siehe
unten). Alle diese Möglichkeiten können mittels
eines Standardbrowsers durchgeführt werden.
Zusätzlich zu diesen voreingestellten,
geradlinigen Möglichkeiten der Benutzeroberfläche umfasst WebSTATISTICA auch ein
Toolkit, welches den Anwendern ermöglicht, die
Benutzeroberfläche anzupassen und
benutzerdefinierte Anwendungen zu entwickeln,
die bestimmte vordefinierte Funktionen
enthalten. Diese Anpassungen können derart
standardisiert werden, dass sie den
Erfordernissen der bestimmten Anwendungen
Rechnung tragen.
Es besteht eine Vielzahl von interaktiven
Möglichkeiten zur Durchführung bestimmter
Datenbankoperationen, der Qualitätsregelung
oder des Data Mining (einschließlich der
STATISTICA-Handbuch – 289
Copyright © StatSoft, 2009
ANHANG B: WebSTATISTICA
Die unübertroffene Kompatibilität mit
Industriestandards ist ein weiterer Punkt in der
langen Liste der einzigartigen Vorteile von
WebSTATISTICA Server.
WebSTATISTICA Server kann auf allen
verbreiteten Webserver-Plattformen (z. B.
UNIX/Apache oder IIS) installiert werden und
erfüllt demnach auch die bestehenden lokalen
Sicherheitsprotokolle (Firewalls), wie sie von
den Firmenkunden verlangt werden.
WebSTATISTICA Server verwendet
fortgeschrittene proprietäre Technologie, die
direkt von StatSoft entwickelt wurde, um die
hohe Leistungsfähigkeit und Skalierbarkeit
sicherzustellen (z. B., dass selbst für mehrere
Mehrprozessor-Rechner der Ansatz der
verteilten Verarbeitung effizient durchgesetzt
werden kann). Diese Technologie basiert auf der
jahrelangen Erfahrung, die StatSoft durch
Bereitstellung und Einrichtung leistungsfähiger
und hochskalierbarer Unternehmenssysteme bei
bedeutenden Unternehmen in den Vereinigten
Staaten und überall in der Welt erhalten hat. Die
Protokolle, die WebSTATISTICA Server für den
Datenaustausch verwendet, folgen jedoch dem
Industriestandard (z. B. XML), um Folgendes
sicherzustellen: (1) Plattformunabhängigkeit, (2)
einen reibungslosen Übergang beim
Vorhandensein neuer Technologien und (3) die
290 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
ANHANG B: WebSTATISTICA
Erleichterung von Benutzeranpassungen für den
Kunden. Hierbei ist zu beachten, dass
Benutzeranpassungen zusätzlich durch die
Tatsache erleichtert werden, dass ausschließlich
dem Industriestandard folgende
Syntaxkonventionen (wie VB, C++, HTML und
XML) verwendet werden, um die verschiedenen
Analyse- und Ausgabeoptionen in
WebSTATISTICA zu konfigurieren.
Obwohl im Allgemeinen das Design in einer
typischen Konfiguration auf zwei Computern
basiert, dem Webserver (z. B. auf einem UNIXApache-System) und zumindest einem
STATISTICA Server (optional auf mehrere
STATISTICA Server skalierbar), kann der
STATISTICA Server in vielen Fällen auch auf
demselben Rechner installiert werden, falls dies
erwünscht wird (z. B. bei Verwendung von IIS):
Das Design erlaubt unter Verwendung einer
standardmäßigen Skriptsprache auf dem
Webserver eine flexible Implementierung des
Webservers in das System. Der Zweck des
Webservers besteht darin, Anfragen von
Anwendern zu bündeln (die von deren Browser
erhalten werden), diese an den STATISTICA
Server zu senden und anschließend die
Antworten des STATISTICA Servers zu
verarbeiten, so dass sie dem Anwender im
Browser dargestellt werden können.
Die Kommunikation zwischen Webserver und
STATISTICA Server wird mittels einer
Technologie realisiert, die den Industriestandard
folgenden XML-Konventionen zugrunde liegt.
Das System ist vollkommen anpassbar, und für
Kunden, die ihre eigenen Modifikationen oder
Erweiterungen für dieses (bereits einsatzfähige)
System entwickeln möchten, wird ein
Development Tool Kit angeboten, das die
Modifikation aller Aspekte der Skripte
ermöglicht, die von STATISTICA (auf
STATISTICA Server-Seite) ausgeführt werden
und die die
Erscheinung der
Benutzeroberfläche
regeln, die den
Anwendern auf der
(browserbasierten)
Clientseite
entgegentritt. Hierbei
werden nur
standardmäßige,
weitverbreitete Tools (wie VB oder
XML/HTML) verwendet, um das System
anzupassen oder zu erweitern.
Die gegenwärtigen
WebseitenDefinitionen und
auszuführende
STATISTICA-Skripte
werden auf dem
STATISTICA Server
auf einen
gesonderten
Speicherplatz abgelegt, wo sie sequentiell
verarbeitet werden. Das System umfasst darüber
hinaus einen hoch optimierten Manager, der die
eintreffende zu verarbeitende Last optimal über
STATISTICA-Handbuch – 291
Copyright © StatSoft, 2009
ANHANG B: WebSTATISTICA
die mehreren Pfade von STATISTICA und
mehreren STATISTICA Server verteilt.
Das Softwaresystem WebSTATISTICA Server
enthält ebenfalls die STATISTICA Visual BasicWeberweiterungen. Diese Erweiterungen der
SVB-Sprache ermöglichen dem SkriptSchreiber, die resultierenden Grafiken und
Tabellen auf den automatisch generierten
Webseiten darzustellen oder das Erscheinungsbild dieser generierten Ausgabeseiten durch das
Hinzufügen von HTML-Befehlen wunschgemäß
anzupassen.
Sicherheit und Authentifikation sind Schlüsselfunktionen von WebSTATISTICA Server. Zum
Beginn einer Sitzung melden sich die Benutzer
mit ihrem Benutzernamen und Kennwort an.
Hierbei ist es Systemadministratoren möglich,
den Zugriff auf Datenquellen und Skripte anhand
der Benutzer- oder Gruppenrechte zu regeln. Die
höchste Stufe der Zugriffsrechte ermöglicht
fortgeschrittenen Nutzern (oder Administratoren)
die Ausführung von nahezu jedem beliebigem
Skript (z. B. um die Systemadministration oder
Wartungsarbeiten durchzuführen). Dieser Stufe
müssen demnach gesonderte (höchste)
Zugriffsrechte zugewiesen werden, da aufgrund
der allgemeinen Struktur und Leistungsstärke von
STATISTICA Visual Basic den autorisierten
Nutzern der Zugriff auf alle Ressourcen des
Netzwerks ermöglicht wird.
Es ist zu beachten, dass dieses System innerhalb
eines „traditionellen“ STATISTICA ConcurrentNetzwerkes (d. h. ohne Webfähigkeit) oder einer
STATISTICA Enterprise-Lizenz integriert
werden kann. Ein Kunde kann demnach
WebSTATISTICA mit einer Netzwerk-Lizenz
von 50 Nutzern kombinieren, so dass 20 dieser
Nutzer den Zugriff auf den WebSTATISTICA
Server erhalten.
Die kompetitiven Vorteile von WebSTATISTICA
Server beginnen offensichtlich mit der
umfangreichen Liste von besonderen Features,
die direkt in STATISTICA enthalten sind. Im
Gegensatz zu Konkurrenzprodukten wird
darüber hinaus eine komplette Anwendung (eine
„Lösung“) mit einer webbasierten Benutzeroberfläche angeboten, die ein einfaches
„Development Kit“ weit übertreffen. Außerdem
ist es nicht erforderlich, dass zunächst eine
bestimmte Webserver-Software installiert
werden muss (die ggf. nicht mit den Sicherheitsstandards und anderen Vorgaben des Kunden in
Einklang zu bringen sind). Darüber hinaus wird
unser System mittels VB, C++, HTML und
XML geregelt, die alle dem Industriestandard
folgen und bequem von Anwendern oder
Systemadministratoren modifiziert werden
können. Hinzuzufügen ist, dass unsere Technologien der verteilten Verarbeitung und des
Multithreading eine Leistung und Ansprechbarkeit des Systems liefern, die von keinem
anderen Konkurrenzprodukt erreicht wird.
Die Anwendung WebSTATISTICA Knowledge
Portal ist optional verfügbar, womit Anwendern
ermöglicht wird, Ausgabedokumente über das
Internet effektiv und sicher zu verwalten. Es
unterstützt die Einrichtung mehrerer Arbeitsgruppen von Nutzern (jede einzelne mit
unterschiedlichen Zugriffsrechten, womit der
Zugriff auf unterschiedliche Bereiche der
Datenbank der Ausgabedokumente verwaltet
wird), eine intuitive Baumansicht der verfügbaren Materialen und Optionen, die Dokumente
auf dem Webserver zu veröffentlichen und in
Echtzeit zu aktualisieren.
Besuchen Sie die Website www.statsoft.com,
um eine Präsentation über die Features von
WebSTATISTICA zu betrachten. Der Film
beinhaltet u. a. ein Schritt-für-Schritt-Beispiel.
292 – STATISTICA-Handbuch
Copyright © StatSoft, 2009

Zusätzlich zu der Eigenschaft als umfassendes
innovatives Analysewerkzeug bieten alle
STATISTICA-Produkte frei gestaltbare
Benutzeroberflächen (mit einfachen Knopfdrucklösungen für Neueinsteiger), flexible
präsentationsreife Ausgabemöglichkeiten
(einschließlich verschiedener Berichtsformate
wie .pdf, Word, .rtf, .html und Ausgabe in ein
Webportal), vollständige Unterstützung von
OLE und ActiveX sowie Webfähigkeit.
Außerdem enthalten alle Produkte ein
optimiertes Datenmanagement zur Behandlung
großer Datenbestände, interaktive Werkzeuge
zur Datenbankabfrage und ein breites Spektrum
an Import- und Exportfunktionen. Alle
Produkte können Datenbestände unbegrenzten
Umfangs, mehrere Eingabedateien und
Multitasking handhaben. In jedes Produkt ist
eine große Auswahl von Werkzeugen zur
interaktiven Erstellung von Visualisierungen
und Grafiken höchster Qualität integriert, sowie
Automatisierungsoptionen und eine
professionelle Visual Basic- und NETkompatible Entwicklungsumgebung mit mehr
als 13.000 extern aufrufbaren Funktionen.
Dieses
Produkt bietet eine Auswahl
grundlegender statistischer Verfahren in einem
benutzerfreundlichen Paket, das alle
Leistungen und die Bedienerfreundlichkeit der
STATISTICA-Technologie bereithält.
• Alle Grafikwerkzeuge von STATISTICA
• Elementare Statistiken, Gliederungen und
Tabellen
• Verteilungsanpassung
• Multiple lineare Regression
• Varianzanalyse
• Nichtparametrische Verfahren
Dieses Produkt bietet ein umfassendes
Spektrum von linearen und nichtlinearen
Modellen mit fortgeschrittenen
Prognosewerkzeugen einschließlich der
Funktionen zur automatischen
Modellbestimmung und umfassender
interaktiver Grafikunterstützung.
• Allgemeine Lineare Modelle
• Verallgemeinerte lineare/nichtlineare Modelle
• Allgemeine Regressionsmodelle
STATISTICA-Handbuch – 295
Copyright © StatSoft, 2009
ANHANG C: PRODUKTFAMILIE
•
•
•
•
•
•
•
•
Modelle partieller kleinster Quadrate
Varianzkomponenten
Survival-Analyse
Nichtlineare Regression
Quasilineare Regression
Loglineare Analyse von Häufigkeitstabellen
Zeitreihenanalyse/Prognose
Strukturgleichungsmodelle
Dieses Produkt bietet
eine breite Palette von explorativen Techniken
für unterschiedliche Datentypen mit
interaktiven Visualisierungstools.
• Clusteranalyse
• Faktorenanalyse
• Hauptkomponenten- und
Klassifikationsanalyse
• Kanonische Analyse
• Diskriminanzanalyse
• Allgemeine diskriminanzanalytische Modelle
• Reliabilitäts- und Item-Analyse
• Klassifikationsbäume
• Korrespondenzanalyse
• Multidimensionale Skalierung
• Erwartete mittlere quadratische Abweichung
und Varianzkomponenten mit
Konfidenzintervallen
• Flexible Handhabung von mehreren
abhängigen Variablen, gleichzeitige Analyse
von mehreren Variablen mit gleichem oder
unterschiedlichem Design
• Grafische Darstellungen der
Varianzkomponenten
Dieses
Produkt beinhaltet eine umfassende Auswahl
an Netzarchitekturen und TrainingsAlgorithmen.
• Automatische Suche nach der besten
Architektur
• Multilayer-Perzeptron
• Radiale-Basis-Funktionen
• Selbstorganisierende Karten
• Zeitreihenanalyse mittels Neuronaler Netze
für Regressions- und Klassifikationsprobleme
• Eine Auswahl von schnellen und effizienten
Trainings-Algorithmen einschließlich
Gradient-Descent, Conjugate-Gradient und
BFGS
• Eine Vielzahl analytischer Grafiken für eine
Eine umfassende
Auswahl an Techniken zur Analyse von
experimentellen Daten, die sowohl feste als
auch zufällige Effekte enthalten. Der Ansatz
basiert auf REML (Restricted Maximum
Likelihood Estimation), wobei es STATISTICA
VEPAC ermöglicht, Schätzungen der
Varianzkomponenten zu ermitteln und sie für
Aussagen zur Genauigkeit verwenden, während
beim Vergleich fester Effekte gleichzeitig
mehrere Quellen von Streuung vorliegen.
• Streuungsplots
• Mehrere Plot-Layouts für den direkten
Vergleich mehrerer abhängiger Variablen
vereinfachte Interpretation der Ergebnisse
• Stichprobenauswahl für die Optimierung der
Netzwerkleistung und Verbesserung der
Generalisierungsfähigkeit
• Sensitivitätsanalyse, Lift-Charts und
ROC-Kurven
• Erstellen eines Gesamtnetzwerkes aus bereits
bestehenden Einzelnetzwerken
• Benutzerfreundliche C-Code und PMML
(Predictive Model Markup Language) Neural
Network Code Generators
Dieses Produkt stellt ein präzises und
benutzerfreundliches Forschungswerkzeug für
die Analyse aller Aspekte der statistischen
296 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
ANHANG C: PRODUKTFAMILIE
Teststärke (Macht) und der Berechnung von
Stichprobenumfängen dar.
• Berechnung von Stichprobenumfängen
• Schätzung von Konfidenzintervallen
• Generator für statistische Verteilungen
Dieses Produkt bietet anpassungsfähige
(z. B. aus anderen Umgebungen aufrufbare),
präsentationsreife Regelkarten mit
Automatisierungsoptionen zur Vereinfachung
von Routineaufgaben (ein umfassendes
Werkzeug für Six Sigma-Methoden).
• Multiple Karten (Six Sigma-Stil)
• X-quer und R-Karten; X-quer und S-Karten;
Np-, P-, U-, C-Karten
• Paretoanalyse
• Prozessfähigkeitsindizes
• MA- und MR-Karten, EWMA-Karten
• Short-Run-Karten (inkl. Sollwert- und
Zielwertkarten)
• CuSum-Karten (kumulative Summen)
• Runs-Tests
• Interaktives, analytisches Brushing
• Aktionen und Ursachen zuweisen, flexible
Alarmmeldungen
Dieses Produkt stellt ein umfangreiches
Paket für Prozessfähigkeit, Wiederhol- und
Vergleichpräzision und andere Verfahren im
Rahmen der statistischen Prozesslenkung dar
(ein umfassendes Werkzeug für Six SigmaMethoden).
• Prozessfähigkeitsanalysen mit Grafiken
• Ishikawa (Ursache-Wirkung)-Diagramme
• Wiederhol- und Vergleichpräzision
• Varianzkomponenten für Zufallseffekte
• Weibull-Analyse
• Stichprobenpläne
Dieses Produkt
bietet eine große Auswahl von
Verfahren zur Erstellung und Auswertung von
Versuchsplänen, Techniken zur Visualisierung
und interaktive Wunschfunktionen zur
Prozessoptimierung (ein umfassendes
Werkzeug für Six Sigma-Methoden).
• Fraktionelle faktorielle Pläne
• Mischungspläne
• Lateinische Quadrate
• Suche nach optimalen 2(k-p)-Plänen
• Residualanalyse und Transformationen
• Optimierung von einzelnen/mehreren
Response-Variablen
• Zentral zusammengesetzte Pläne
• Taguchi-Designs
• Pläne minimaler Aberration und maximaler
Unvermengtheit
• 2(k-p) fraktionelle faktorielle Pläne mit
Blöcken
• Pläne mit Nebenbedingungen
• D- und A-optimale Designs
• Wunschprofile zur Prozessoptimierung
Eine Komplettlösung zur
multivariaten statistischen Prozesslenkung
innerhalb einer skalierbaren SoftwarePlattform.
• Univariate und multivariate Methoden für
Qualitätssicherung, Prognosemodelle und
Methoden zur Datenreduktion
• Funktionen zur Bestimmung der kritischsten
Prozesse, Rohmaterialien und
Umgebungsfaktoren einschließlich der
Bestimmung ihrer optimalen Einstellungen,
um Produkte höchster Qualität herzustellen
• Interaktive oder automatische Überwachung
der Prozesseigenschaften während der
einzelnen Produktionsschritte
STATISTICA-Handbuch – 297
Copyright © StatSoft, 2009
ANHANG C: PRODUKTFAMILIE
• Basierend auf Produktionsergebnissen
bekannter Daten können Prognosemodelle
erstellt, evaluiert und angewendet werden.
• Interaktive Überwachung mittels DashboardZusammenfassungen und automatisch
aktualisierten Ergebnissen
• Automatisierte Überwachung mit Regeln,
Alarm-Ereignissen und konfigurierbaren
Aktionen
• Multivariate Techniken einschließlich
Partielle Kleinste Quadrate (PLS),
Hauptkomponentenanalyse (PCA), Neuronale
Netze, Rekursives Partitionieren, Support
Vector Machines, Independent Components
Analysis, Clusteranalyse usw.
Zusätzlich zu den oben aufgelisteten
allgemeinen Funktionen bieten die
unternehmensweiten Lösungen von
STATISTICA eine umfassende Auswahl von
Groupware-Funktionalitäten,
Benutzeroberflächen für Webbrowser (beim
Gebrauch vom STATISTICA Web-Server),
spezialisierte Datenbanken und eine
hochoptimierte Schnittstelle zu
unternehmensweiten Datenbeständen,
einschließlich Optionen zur schnellen Vor-OrtVerarbeitung großer Datenmengen aus
externen Servern ohne Erstellung
lokaler Kopien. Darüber hinaus stehen
Angebote zur Einrichtung und Schulung beim
Kunden zur Verfügung.
Dieses System bietet eine umfassende
Auswahl von Data-Mining-Lösungen mit einer
sehr einfach zu bedienenden
Benutzeroberfläche (optional Webbrowserbasiert, siehe WebSTATISTICA Seite 300) und
einer Deployment-Engine. Die integrierten und
automatisierten Lösungen lassen sich für eine
große Bandbreite von Geschäftsanwendungen
verwenden und sind einfach einzurichten, dabei
aber leicht anzupassen. Eine spezielle SPCVersion (QC Data Miner) für die Analyse
großer Datenströme von QC-Daten ist ebenfalls
verfügbar. Die Data-Mining-Lösungen werden
über fünf mächtige Module gesteuert:
• Allgemeiner Datenexplorer (optional mit
OLAP)
• Klassifizierer
• Modellbilder/Multivariater Explorer
• Prognostiker
• Neural Networks Explorer
Eine effiziente
Softwarelösung für die Überwachung von
Prozessen mit dem Ziel, Qualitätsprobleme zu
identifizieren und vorherzusagen. STATISTICA
Process Optimization umfasst alle
Qualitätsregelkarten, Prozessfähigkeitsanalysen,
Versuchsplanungsmethoden und Six-SigmaVerfahren einschließlich einer umfassenden
Bibliothek von Techniken für das explorative
und prädiktive Data Mining.
• Qualitätsprobleme mit modernsten DataMining-Methoden vorhersagen
• Ursachen von Problemfeldern ergründen
• ROI (Return on Investment) überwachen und
verbessern
• Vorschläge für Verbesserungen erarbeiten
• Prozesse über das Internet in Echtzeit
überwachen
• SPC-Lösungen über das Internet entwickeln
und umsetzen
• Verwendung von Multithreading und
Distributed Processing, um extrem große
Datenströme schnell verarbeiten zu können
Eine
leistungsstarke Softwarelösung für
Text-Mining, Dokumentenwiederherstellung
und die Analyse unstrukturierter Daten. Eine
optionale Erweiterung für den STATISTICA
298 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
ANHANG C: PRODUKTFAMILIE
Data Miner, die für den Zugriff und die Analyse
von Dokumenten (unstrukturierter Information)
in einer Vielzahl von Formaten entwickelt und
optimiert wurde. Die Formate umfassen: .txt
(Text), .pdf (Adobe), .ps (PostScriptTM), .html,
.xml (Webformate) und die meisten Microsoft
Office-Formate (z. B. .doc, .rtf). Der optimierte
Zugriff auf Webseiten (URL-Adressen) wird
ebenfalls unterstützt.
• Effiziente Indexierung sehr großer Mengen
von Textdokumenten; Ermittlung von
Schlüsselwörtern und Ähnlichkeiten zwischen
Dokumenten und Begriffen, Extraktion der
relevanten Information
• Anwendung von Ausschlusslisten (zu
ignorierende Wörter) und sprachspezifischen
Wortstammalgorithmen (eine Vielzahl von
Sprachen wird unterstützt)
• Zahlreiche Optionen, die Dokumente in
numerische Information zu konvertieren, so
dass sie weiterverarbeitet werden können
(z. B. Mapping, Clustering, prädiktives Data
Mining, Klassifikation von Dokumenten
usw.)
• Volle Unterstützung für Multithreading bei
Installationen auf Mehrprozessor-Servern für
die extrem schnelle Indexierung und Suche in
riesigen Dokumentarchiven
• Kann auch für die Indexierung und Analyse
von anderen unstrukturierten Informationen,
wie z. B. Sound- oder Bilddateien (nach
Anwendung der entsprechenden
Vorverarbeitung) verwendet werden
• Vollständig in STATISTICA und
WebSTATISTICA integriert, womit direkt auf
eine große Anzahl verfügbarer Methoden für
Learning-, Clusterverfahren, Mapping,
Datenvisualisierungen usw. zurückgegriffen
werden kann. Viele der Algorithmen, die im
STATISTICA Data Miner verfügbar sind, wie
z. B. die Machine-Learning-Algorithmen
(k-Nearest Neighbor, Kernel-, Naiver BayesKlassifikator und Support Vector Machine)
sind besonders gut für das Text Mining oder
die Analyse anderer unstrukturierter
Information geeignet.
STATISTICA SAL
adressiert Kundenbedürfnisse in verschiedenen
Branchen wie dem Einzelhandel oder dem
Banken- und Versicherungsgeschäft. Die
implementierten Algorithmen sind extrem
schnell und skalierbar, sie erlauben die
Extraktion von Sequenz- und
Assoziationsregeln innerhalb einer einzigen
Analyse. Bereits als Stand-alone-Version kann
das Tool sowohl für die Modellbildung als
auch für den Modelleinsatz (Deployment)
genutzt werden. Im STATISTICA Data Miner
ist SAL als fester Tool-Bestandteil integriert, so
dass die Ergebnisse aus STATISTICA SAL dort
schnell und mühelos eingesetzt werden können.
• Bei der Extraktion von Sequenz- und
Assoziationsregeln wird auf eine Technik
zurückgegriffen, wie sie bei der Bildung von
Bäumen verwendet wird.
• Beim Speichern der Sequenz- und
Assoziationsmodelle kommt eine effiziente
und zugriffssichere (thread-safe) relationale
Datenbank-Technologie zum Einsatz.
• Mehrfach-Antworten, mehrfache
Dichotomien und metrische Variablen können
innerhalb einer Analyse gehandhabt werden.
• Innerhalb einer einzigen Analyse können
sowohl Sequenz- als auch Assoziationsregeln
ermittelt werden.
• Sequenz- und Assoziationsregeln lassen sich
für mehrere Dimensionen simultan ermitteln.
• Aufgrund der Möglichkeit, assoziatives und
sequenzielles Mining zu betreiben, sowie der
Fähigkeit, Regeln für bestimmte Items zu
extrahieren, lässt sich die Software für DataMining-Prognosen einsetzen.
• Das Modul bietet eine hierarchische
Clusteranalyse (Fusion über Nächster
Nachbar, Single-Linkage), um wahrscheinlich
STATISTICA-Handbuch – 299
Copyright © StatSoft, 2009
ANHANG C: PRODUKTFAMILIE
auftretende Item-Cluster aufzuspüren. Hierin
liegt ein hoher praktischer Nutzen, etwa im
Einzelhandel.
Ein
integriertes Mehrbenutzersystem für die
allgemeine Datenanalyse und als Informationsdienst im Forschungsbereich eines
Unternehmens. STATISTICA Enterprise kann
optional die Funktionen eines beliebigen oder
auch aller STATISTICA-Produkte zur
Verfügung stellen.
• Data Warehouse-Integration
• Intuitive Abfrage- und Filterwerkzeuge
• Benutzerfreundliche Administration
• Automatische Verteilung von Berichten
• Benachrichtigung bei Alarm-Ereignis
Dieses Produkt wurde für
Anwendungen (einschließlich Six SigmaMethoden) für die lokale und globale
Qualitätssicherung entwickelt. STATISTICA
Enterprise/QC bietet unter anderem eine
leistungsstarke Datenbank (oder eine optimierte
Schnittstelle zu bereits bestehenden
Datenbanken), Überwachung der Produktion
und Benachrichtigungen über Alarm-Ereignisse
in Echtzeit, eine umfassende Auswahl von
Analysewerkzeugen für Ingenieure,
hochentwickelte Berichtsfunktionen für die
Betriebsleitung und eine flexible
Berichtsgestaltung.
• Webfähige Benutzeroberfläche und Berichte,
Werkzeuge für interaktive Datenbankabfrage
• Nach Anwendertyp differenzierte Oberfläche
(z. B. Werker, Ingenieur usw.)
• Groupware-Funktionalität für die
gemeinsame Nutzung von Datenbankabfragen
und anderen speziellen Anwendungen
• Unbefristete Benachrichtigungen über AlarmEreignisse einschließlich Ursache- und
Aktionsmeldungen
• Skalierbar, anpassbar und kann in bereits
bestehende Datenbanken/ERP-Systeme
integriert werden
Diese
Erweiterung ermöglicht das automatisierte
Überwachen von bis zu Tausenden kritischen
Prozessen und Produktparametern. Die
fortlaufende Überwachung ist eine
automatisierte und effiziente Methode für:
• Simultane Überwachung vieler kritischer
Parameter
• Das Bereitstellen von „Schnappschüssen“ der
aktuellen Resultate der Überwachungsaktivitäten, die anhand der Zuständigkeiten
der Belegschaft zugeordnet werden können
• Dashboards, die mit Benutzern/Gruppen
assoziiert werden
Die
Softwarelösung zum Erkennen und
Implementieren effektiver Strategien für die
fortgeschrittene multivariate
Prozessüberwachung und -lenkung.
STATISTICA MultiStream wurde allgemein für
die Prozessindustrie konzipiert, ist allerdings
besonders gut geeignet, Betreibern von
Kraftwerken zu helfen, ihre Daten (aus bereits
bestehenden Prozessdatenbanken für die
multivariate Prozessüberwachung) in
Beratungssysteme wirksam einzusetzen.
STATISTICA MultiStream ist ein komplettes
Unternehmenssystem, das (bei voller
Webfähigkeit) auf einer robusten,
hochentwickelten Client-Server-Architektur
basiert. Es bietet die Möglichkeit einer
zentralen Verwaltung der angewendeten
Modelle sowie brandaktuelle Technologien für
Ursache-Wirkungs-Analysen und Data-MiningPrognosen. Die Analysewerkzeuge sind nahtlos
in einem eingebauten Dokumentenmanagementsystem integriert.
300 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
ANHANG C: PRODUKTFAMILIE
• Automatisierte (nichtlineare) UrsacheWirkungs-Analyse und Feature Selection von
Tausenden Parametern, um eindeutig zu
erkennen, welche Parameter höchstwahrscheinlich die Prozessprobleme verursachen
• Automatisierte und interaktive Analyse
gemeinsamer Anforderungen, um Parameter
und Prozesse zu identifizieren, die in einem
bestimmten Zeitintervall vom normalen
Betriebsablauf abweichen
• Hochentwickelte lineare und nichtlineare
Modelle (z. B. SVM, Rekursives
Partitionieren, Neuronale Netze) zum
Erstellen feinfühliger multivariater Kontrollmechanismen, um multivariate
Abweichungen früh zu erkennen, bevor
Probleme verursacht werden
• STATISTICA kann auf jedem beliebigen
Rechner (einschließlich Linux, UNIX)
interaktiv via Webbrowser ausgeführt werden
• Zeitaufwendige Tasks können auf den Server
geladen werden
• Verwendung einer mehrstufigen ClientServer-Architektur
• Projektbetreuung über das Internet
• Koordinierung von Projekten „über den
Büroflur oder über Kontinente hinweg“
• Unterstützung von Multithreading und
verteilter Verarbeitung selbst bei mehreren
Servern.
• Hochentwickelte Data-Mining-Algorithmen
zur Prognose und Optimierung der
Schlüsselindikatoren
• Gleichzeitiges Verfolgen von Hunderten von
Datenströmen
• Übersichtliche Zusammenfassungen von
Ergebnissen kritischer Prozessparameter
mittels effizienter Dashboards und DrillDown-Optionen
• Standardisierte und benutzerangepasste
Analysewerkzeuge zur Ursache-WirkungsAnalyse mittels Verwendung brandaktueller
Data-Mining-Technologien
• Warnungen bezüglich (prognostizierter)
Probleme und Gerätefehler, bevor sie
auftreten (prädiktiver Alarm), womit
kostspieliges Herunterfahren und außerplanmäßige Wartungen vermieden werden
• Beobachtet in Echtzeit „alles“, was die
Prozessleistung beeinflusst
Das
ultimative Unternehmenssystem, das
volle Webfähigkeit bietet:
Eine komplette, hochskalierbare Lösung für die
Verwaltung elektronischer Dokumente. Mit
dem STATISTICA Document Management
System können Dokumente jeglichen Typs
schnell, effizient und sicher verwaltet werden
[z. B. Auffinden, Zugriff, Inhaltssuche,
Überprüfung, Organisierung, Bearbeitung (mit
Audit-Trail und Versionsführung), Freigabe
usw.].
• Sehr transparent und benutzerfreundlich
• Flexible, anpassbare (optional browser/webfähige) Benutzeroberfläche
• Elektronische Signaturen
• Umfangreiche Audit-Trail-Optionen
• Optimierte Suche
• Werkzeuge für Dokumentenvergleich
• Datensicherheit
• Erfüllt FDA 21 CFR Part 11
• Erfüllt Dokumentationsanforderungen von
ISO 9000 (9001, 14001)
• Unbegrenzte Skalierbarkeit (von Desktopoder Netzwerk-Versionen bis zu
allumfassenden webbasierten weltweiten
Systemen)
STATISTICA-Handbuch – 301
Copyright © StatSoft, 2009
ANHANG C: PRODUKTFAMILIE
• Offene Architektur und Kompatibilität mit
Industriestandards
•
Eine optionale STATISTICAKomponente, die dem Anwender die direkte
Integration von Daten ermöglicht, die in der PI
Data Historian gespeichert sind. STATISTICA
PI Connector verwendet die PI-Benutzerkontensteuerung und das zugehörige
Sicherheitskonzept, ermöglicht das interaktive
Browsen nach Tags und zieht aus den
speziellen PI-Funktionalitäten den Nutzen für
Interpolation und Snapshot der Daten. Ein
innerhalb eines PI-Systems integriertes
STATISTICA wird für straffe und
automatisierte Analysen verwendet, wie sie
beispielsweise in FDA-regulierten Industrien
(Process Analytical Technology – PAT), in der
chemischen und petrochemischen Industrie
(Advanced Process Control – APC) und in der
Energie- und Versorgungsindustrie für
Compliance und Beratungssystemen zur
Prozessoptimierung von Vorteil sind.
Die komplette,
leistungsstarke, skalierbare und auf
Kundenbedürfnisse anpassbare DataWarehouse-Lösung, die darüber hinaus
optional anbietet, die umfassendste Auswahl an
Analysewerkzeugen vollständig in das System
zu integrieren. Die Anwendungen für
STATISTICA Data Warehouse sind hierbei in
Komponenten zusammengefasst, die sich
flexibel wählen lassen. Diese Komponente
umfassen:
• STATISTICA Data Warehouse Server
Database
• STATISTICA Data Warehouse Query
(ausgestattet mit WebSTATISTICA Query)
• STATISTICA Data Warehouse Analyzer
(ausgestattet mit WebSTATISTICA Data
Miner, WebSTATISTICA Text Miner,
WebSTATISTICA Process Optimization oder
•
•
•
optional mit allen Analysewerkzeugen von
WebSTATISTICA)
STATISTICA Data Warehouse Reporter
(ausgestattet mit WebSTATISTICA
Knowledge Portal und/oder WebSTATISTICA
Interactive Knowledge Portal)
STATISTICA Data Warehouse Document
Repository (ausgestattet mit WebSTATISTICA
Document Management System)
STATISTICA Data Warehouse Scheduler
STATISTICA Data Warehouse Real Time
Monitor and Reporter (ausgestattet mit
WebSTATISTICA Enterprise oder
WebSTATISTICA Enterprise/QC)
Falls Sie den Data-Warehouse-Prozess neu in
Ihr Unternehmen integrieren, können StatSoftBerater Sie Schritt-für-Schritt durch den
gesamten Prozess begleiten – vom Entwurf der
optimalen Data-Warehouse-Architektur, dem
eine umfassende Überprüfung Ihrer
Informationsspeicherung und Extraktions/Analysebedürfnisse zugrunde liegt, bis zur
abschließenden Schulung Ihrer Angestellten
und Technischen Support.
Die entscheidenden Features und Vorteile der
STATISTICA Data Warehouse-Lösung
umfassen unter anderem:
• Eine komplette Anwendung für den DataWarehouse-Prozess, die speziell für Ihr
Unternehmen maßgeschneidert ist
• Plattformunabhängige Architektur, die eine
nahtlose Integration mit Ihrer bestehenden
Infrastruktur sicherstellt
• Möglichkeit zur Datenintegration aus einer
Vielzahl von Quellen
• Nahezu unbegrenzte Skalierbarkeit
• Aktualisieren und Synchronisieren von Daten
verschiedener Quellen – manuell oder
automatisch via Scheduler
• Komplett webfähige Systemarchitektur, um
die ultimativen Funktionalitäten rund um den
Globus allen Standorten Ihres Unternehmens
302 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
ANHANG C: PRODUKTFAMILIE
•
•
•
•
•
•
•
zur Verfügung zu stellen (z. B. durch Zugriff
mittels Webbrowser)
Hochentwickeltes Sicherheitskonzept und
Authentifizierung
Umfassende Optionen zum Dokumentenmanagement, um die Verwaltung der
Dokumente verschiedener Dateitypen zu
optimieren und um Regulierungsauflagen zu
erfüllen (z. B. FDA 21 CFR Part 11 und ISO
9000)
Hochentwickelte analytische Komponenten
zur Säuberung und Abgleich von Daten und
um automatisiertes Data Mining, Artificial
Intelligence und Prozessüberwachung in
Echtzeit zu integrieren
Automatisches Veröffentlichen maßgeschneideter Berichte im Knowledge Portal,
einschließlich interaktiver Berichte und
Ergebnisse (d. h. bei Erhalt der Anpassungsfähigkeit für einzelne Nutzer, inklusive DrillDown-Option und Teilauswahl)
Backups und Archivierungen
Für bestimmte Aufgabenprofile
programmierbar, anpassbar und erweiterbar
(offene Architektur, die Erweiterungen
mittels VB, C++, Java und HTML zulässt)
Basierend auf robuster, ausgiebig getesteter,
hochskalierbarer, brandaktueller Technologie,
um Ihre Investition zum Durchbruch zu
verhelfen [einschließlich der hochoptimierten
IDP-Technologie (In-Place Database
Processing), Multithreading, Distributed/
Parallel Processing und der Möglichkeit,
CPU-Ressourcen mehrerer Server
zusammenarbeiten zu lassen, um nahezu die
Performance eines Supercomputers zu
erhalten]
STATISTICA Data Warehouse ist eine
Komplettlösung zur Datenspeicherung und
Informationsverteilung, die ermöglicht, den
Informationsfluss innerhalb Ihres Unternehmens zu steuern, so dass allen autorisierten
Mitarbeitern flexibler, sicherer und schneller
Zugriff auf kritische Informationen zur
Verfügung gestellt werden kann.
Das System ist nahezu plattformunabhängig und
passt in jede bestehende Datenbankarchitektur
und Hardwareumgebung. Informationen aus
mehreren Datenbankformaten und -quellen (von
manuellen Dateneinträgen bis zu Einrichtungen
zur automatischen Datenerfassung) können
effizient kombiniert werden. Darüber hinaus
kann das System durch Integration von weiteren
vollständig kompatiblen Komponenten der
STATISTICA-Produktlinie erweitert werden. Zu
diesen Komponenten gehören unter anderem:
• STATISTICA Data Miner für
hochentwickelte Lösungen, die auf Data
Mining und künstlicher Intelligenz (z. B.
Neuronale Netze) basieren, um mit
innovativen Methoden aus den Daten Wissen
und Prognosen zu generieren
• STATISTICA Process Optimization und
Enterprise/QC die enge Integration mit der
Softwarelösung für Qualitäts- bzw.
Prozessregelung und Ertragsmanagement
• STATISTICA Text Miner für das
automatische Verarbeiten unstrukturierter
Information in Dokumenten, Datenbanken
oder Webverzeichnissen (via Webcrawling)
• STATISTICA Knowledge Portal für die
Präsentation von Berichten, Karten und
Handlungsanweisungen mittels eines sicheren
Access-Portals über das Internet, um die
Informationen und Entscheidungshilfen den
Endanwendern (Management, Vertrieb,
Ingenieure usw.) weltweit zur Verfügung zu
stellen (d. h., dass man von überall auf der
Welt mittels eines Webbrowsers auf das
STATISTICA Knowledge Portal Zugriff hat)
STATISTICA Data Warehouse kann mit jeder
Plattform, Datenbank oder Datenquelle
verbunden werden und kann auf jede beliebige
Betriebsgröße bzw. jeden Anwendungsumfang
angepasst werden. Das Programm basiert auf
STATISTICA-Handbuch – 303
Copyright © StatSoft, 2009
ANHANG C: PRODUKTFAMILIE
einer Datenbank und einem Datenbankschema,
das speziell für Ihr Unternehmen angepasst
wird. Die Lösung kann entweder einschließlich
einer leistungsstarken Datenbank-Engine (SQL
Server) installiert werden oder als (virtuelles)
Datenbankschema, das mit den meisten dem
Industriestandard folgenden Datenbanken
kompatibel ist. STATISTICA Data Warehouse
kann demnach nahtlos in Ihr bereits
bestehendes Datenbanksystem integriert
werden.
Da STATISTICA Data Warehouse nicht für
einen speziellen Datenbank-Anbieter oder eine
spezielle Hardware konzipiert wurde, besteht
vollkommene Plattformunabhängigkeit. Die
Data Warehouse-Software kann mit jedem
Datenbankformat verbunden werden, so dass
Information aus verschiedenen Quellen
effizient kombiniert und zusammengefasst
werden kann.
Die Anwendungssoftware von STATISTICA
Data Warehouse kann auf Servern mit
mehreren Prozessoren oder auf einer Bank von
Mehrprozessor-Servern ausgeführt werden, so
dass nahezu die Performance eines
Supercomputers erreicht wird. Das System
kann sich mühelos selbst riesigen Datengrößen
und Analyseproblemen anpassen.
STATISTICA Data
Warehouse extrahiert Information aus Quellen,
die sich überall auf der Welt befinden können,
und kann anschließend die Analyseergebnisse
einem Rechner zur Verfügung stellen, der sich
überall auf der Welt befinden kann.
Die Webkomponente des Systems basiert auf
bewährter WebSTATISTICA-Technologie, die
weltweit von Unternehmen verwendet wird, um
sicheren Zugriff mittels standardmäßiger
Webbrowser zu gewährleisten. Im Gegensatz
zu anderen webbasierten Lösungen erfordert
STATISTICA Data Warehouse keine
zusätzlichen Komponenten, die auf den ThinClients installiert werden müssen. Das System
kann demnach weltweit von (autorisierten und
authentifizierten) Nutzern verwendet werden:
aus Hotelzimmern via Modem, von zu Hause
aus, aus dem Büro oder aus Produktionsstätten,
die sich auf den entferntesten Orten der Welt
befinden können (via Satellitenverbindung).
STATISTICA Data
Warehouse implementiert ein detailliertes und
technisch ausgereiftes Sicherheitssystem, um
sicherzustellen, dass das firmeneigene Wissen
vor unautorisierten Zugriffen geschützt ist. Da
dieses System als Informationsdienst des
Unternehmens als das hauptsächliche
Entscheidungshilfesystem dient, ist die
Sicherheit dieses Systems die oberste Priorität.
Durch das Einführen von Nutzergruppen mit
unterschiedlichen Zugriffsrechten (bezüglich
der Information und durchführbaren
Tätigkeiten) und der Erfordernis der
regelmäßigen Passwortaktualisierung
implementiert STATISTICA Data Warehouse
den höchsten Grad an Sicherheit. Darüber
hinaus werden besondere
Sicherheitsvorkehrungen getroffen, um
Eindringungsversuche ("Hacking") zu erkennen
und zu verhindern.
STATISTICA
Data Warehouse ermöglicht vollständiges
Dokumentenmanagement, das dem
Industriestandard und gesetzlichen Richtlinien
folgt.
STATISTICA Document Management System
kann nahtlos in STATISTICA Data Warehouse
integriert sein, um den Informationsfluss
innerhalb des Unternehmens zu optimieren, so
dass sich hieraus Produktivitätssteigerungen
ergeben. Darüber hinaus kann dieses System
derart konfiguriert werden, dass es alle
Richtlinien zum Dokumentenmanagement sowie
alle Regulierungen zur Dokumentensicherheit,
Audit-Trails und Elektronischen
Signaturen/Authentifizierung erfüllt
(beispielsweise vorgeschrieben nach FDA 21
CFR Part 11: Elektronische Aufzeichnungen;
304 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
ANHANG C: PRODUKTFAMILIE
Elektronische Unterschriften oder ISO 9001 4.2:
Allgemeine Forderungen zur Dokumentation).
STATISTICA Data Warehouse kann die
fortschrittlichsten Methoden der Datenanalyse
umfassen, die weit über OLAP hinausgehen,
um die komplexesten – und für andere
Anwendungen unzugänglichen – Muster in den
Daten für die Wissensextraktion zu
vereinfachen.
Da STATISTICA Data Warehouse aus denselben
leistungsstarken Komponenten wie die gesamte
STATISTICA-Produktlinie besteht, können diese
Analysewerkzeuge bequem und nahtlos
integriert werden. STATISTICA bietet das
umfassendste Paket an Werkzeugen für Data
Mining, Text Mining, Datenanalyse, Grafiken
(bzw. Visualisierungen), Qualitäts- und
Prozesslenkung (einschließlich Six Sigma) auf
dem Markt an. Diese Ressourcen und
Technologien können in STATISTICA Data
Warehouse direkt mit den Datenquellen
verbunden werden, so dass die fortschrittlichsten
Technologien und Algorithmen für alle Quellen
wirksam eingesetzt werden können. Es lassen
sich beispielsweise Hunderte von NeuronalenNetzwerk-Architekturen, leistungsstarke
Baummethoden für Klassifikationsprognosen
(z. B. stochastisches Gradient Boosting), flexible
Ursache-Wirkungs-Analysen,
Regelkartenmethoden, mächtige BusinessForecasting-Methoden oder hochentwickelte
grafische Analysemethoden anwenden, um die
Rohdaten im Data Warehouse in nützliche und
verwertbare Information zu verwandeln, so dass
sich für Unternehmensentscheidungen klare
Implikationen ergeben.
STATISTICA Data
Warehouse ist eine offene Architektur, so dass
man nicht in die Abhängigkeit eines einzelnen
Anbieters gezwängt wird. Man kann demnach
schnell auf Anforderungen reagieren, die im
Data Warehouse aufgenommen werden sollen.
Wie bei allen anderen Anwendungen und
Lösungen der STATISTICA-Produktfamilie
lässt sich auch STATISTICA Data Warehouse
mittels Programmiersprachen wie Visual Basic,
C++, Java oder HTML automatisieren und
anpassen. Dieses Feature ist von besonderer
Bedeutung, wenn es für Ihr Unternehmen
erforderlich ist, sich neuen Informationen und
Marktsituationen schnell anzupassen. Da das
System angepasst werden kann, ohne
gezwungen zu sein, auf Programmierer eines
bestimmten Anbieters zurückzugreifen, die sich
auf eine spezifische Programmiersprache
spezialisiert haben (was bei vielen
Konkurrenzprodukten erforderlich ist), besteht
nach wie vor die Freiheit, die gewünschten
Data-Warehouse-Erweiterungen selbständig zu
entwickeln. Neben benutzerangepassten
Berichten können auch Analysen und
Datentransformationen mittels VB, C++, Java
oder HTML maßgeschneidert werden. Darüber
hinaus bietet StatSoft ergänzend
Dienstleistungen bezüglich Systemintegration,
Programmierungen und Consulting an.
Eine komplette
Softwarelösung für die verarbeitende
Industrie, die (mittels bereits gesammelter und
verwalteter Daten) die fundamentalen kausalen
Zusammenhänge zwischen den Produkten und
deren zugrundeliegenden Prozessen
herausdestilliert. PROCEED implementiert den
patentierten Ansatz, der von Caterpillar Inc.
entwickelt wurde und sich dort unter der
Verwendung der STATISTICA Enterprise
bewährt hat.
Unternehmen im Hochtechnologie-Sektor
sammeln heutzutage eine unermessliche Menge
an Daten.
• Daten über die Produktionsprozesse
STATISTICA-Handbuch – 305
Copyright © StatSoft, 2009
ANHANG C: PRODUKTFAMILIE
• Daten über Tests der Rohmaterialien,
Teilerzeugnisse und Werkstoffe, die gerade
verarbeitet werden
• Daten über die qualitätskritischen Merkmale
eines Produkts.
All diese Bestrebungen der Datenerfassung
werden durch die zunehmende Automatisierung, gesteigerte Speicherkapazitäten und
Fortschritte in der Sensor- und Messtechnik
weiterhin vorangetrieben. Für die heutigen
Produzenten stellen die verfügbaren
Informationen eine Goldmine dar – allerdings
nur dann, wenn sie dazu in der Lage sind, dies
in verwertbare Information umzumünzen.
Die Erhebung von Daten ist nicht hinreichend,
um Veränderungen im Unternehmen zu
bewirken. Um die Veränderungen
durchzusetzen, müssen die Daten zunächst in
Wissen transformiert werden, das dann in ein
Format übersetzt werden muss, welches
ermöglicht, mit denjenigen zu kommunizieren,
die diese Änderungen durchführen können. Mit
PROCEED ist es nun möglich, bezüglich der
Datenerfassung einen positiven Return on
Investment zu erzielen.
PROCEED kombiniert neue und traditionelle
Methoden der Wissensextraktion, um:
Alternative zu Investitionen in neue oder
aktuellere Betriebseinrichtungen (Hardware),
die mehrere Millionen Euro erfordern.
Basierend auf mehr als 20 Jahre an Erfahrung
in der Anwendung von Data-Mining-Prognosen
und der Entwicklung von Technologien zur
Prozessoptimierung in verschiedenen
Industrien wird es Kraftwerken mit
STATISTICA PowerSolutions ermöglicht, die
vorliegenden Betriebseinrichtungen und
Kontrollsysteme optimal zu nutzen. Hierbei
werden aus den verschiedenen Anlagen alle
gesammelten Daten wirksam eingesetzt, um die
Gelegenheiten zur Optimierung aufzuspüren.
Dies gilt auch für ältere Modelle wie
Zyklonfeuerung mittels Kohlenstaub (mit
Wandfeuerung als auch Tangentialfeuerung).
• einfache und komplexe kausale
Zusammenhänge zwischen Produktionsprozessen und Produktqualität herzuleiten
und zu validieren
• verwertbare Information anzuwenden, so dass
Prozessverantwortliche und Spezialisten
verschiedene Was-wäre-wenn-Szenarien
vergleichen und bei Zielkonflikten simultan
optimieren können
Dies ist ein Lösungskonzept für
Energieversorgungsunternehmen, um die
Kraftwerksleistung zu optimieren, die Effizienz
zu steigern und die Emissionen zu reduzieren.
Dieses Produkt ist eine sehr attraktive
306 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
ANHANG C: PRODUKTFAMILIE
STATISTICA-Handbuch – 307
Copyright © StatSoft, 2009
HANDBUCH:
INDEX
.NET 269
Abfrage 263
ActiveX 185, 194, 257
Dokumente 258
Objekte 257
Allgemeine Einführung
Benutzeroberfläche 3
Bes. Eigenschaften 4
Software-Technologie 5
Webfähigkeit 7
Allgemeine Lineare
Modelle 37, 295
Analyse
fortsetzen 256
Register Standard vs.
Register Details 18
wiederholen 255
Analyse-Makros 242
Analysen für Gruppen 46
ANOVA-Beispiel 34
Anpassung 12, 133
Bedienung von
STATISTICA 231
Benutzeroberfläche 232
Dokumente 233
Erscheinungsbild von
STATISTICA 231
Grafiken 29, 208, 235
Individuelle
Arbeitsweise 134
lokal vs. permanent 233
Netzwerk 237
STATISTICA Visual
Basic 149, 241
Steuerung aus anderen
Anwendungen 149
Symbolleisten 147
Systemstandards 234
verschiedene
Konfigurationen 236
Ansicht-Menü 233
Arbeitsmappe 16, 21, 23,
24, 25, 47, 93, 94, 96,
134, 147, 152, 157, 158,
159, 160, 162, 163, 167,
180, 181, 186, 187, 188,
193, 194, 203, 232, 233,
234, 250, 252, 253, 255,
258
Analyse wiederholen
255
Anmerkungen und
Kommentare 159
Baum 187
Eingabetabelle 192
Überblick 185
Attributive
Messsystemanalyse 84
Audit-Trail 103
Ausgabe 15
Arbeitsmappe 158, 185
Bericht 162, 194
Einzelfenster 160
Grafik 196
HTML 166
Microsoft Word 165
PDF 164
Tabelle 189
Web 167
Ausgabesteuerung 141,
157
Ausreißer
umkodieren 70
Autofiltern 140
Auto-Sichern 158
Datenaufbereitung –
Säuberung und
Filterung 65
Direkter Datenzugriff
auf Datenbanken 60
Eingabedaten direkt aus
Excel 57
Ergebniszusammenfassungen 79
Gruppenanalyse 46
Korrelationen 11
STATISTICA Data Miner
Recipe 86
STATISTICA Enterprise
110
STATISTICA im regulierten Umfeld 102
STATISTICA Visual
Basic 248
Tabellen- und BatchFormeln 74
Variablenbündel 42
WebSTATISTICA 97
Benutzeroberfläche 3
Ablauf der Analyse 137
anpassen 133, 232
Eigenschaften 133
interaktiv 136
Bericht 25, 162, 194
aus Arbeitsmappen 163
Baum 195
GxP 108
HTML 166
Microsoft Word 165
PDF 164
RTF 164
Browserbasierte
Benutzeroberfläche 150,
283
Brushing 139, 222
Batch-Formeln 74, 76
Beispiele
ANOVA 34
C/C++ 5
Codes 37, 72, 109, 110
308 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
HANDBUCH:
Data Miner 298
Deployment 95
Data Miner Recipe 86, 199
Projektdateien 201
Data Warehouse 302
Data-Mining-Menü 142
Daten
Auswahl der Datei 13
Batch Formeltransformationen 74, 77,
78
direkter Zugriff auf
Datenbanken 60
Dubletten filtern 66
Missing Data 71
Säubern und Filtern 65
Transformationen 305
umkodieren 66, 68, 72,
74
Unvollständige Daten
filtern 68
Datenbanken
Direkter Zugriff 60
Datentabellen 13
DDE (Dynamic Data
Exchange) 259
Dialog Optionen
Grafikregister 208
Dialoge
Analysespezifikation
138
Ausgabeselektion
(Ergebnisse) 138
Intelligente
Dialogführung 19
Optionen 16
DIN 55319 80, 84
Document Management
System 301
Dokumente anpassen 233
Dokumenttypen 145
Symbolleisten 146
Drag & Drop siehe
Ziehen-und-Ablegen
Eingabetabellen 192
Einzelfenster 160
Elektronisches Handbuch
33, 277
Elektronisches StatistikLehrbuch 26
Enterprise-Linie 298
Ergebnistabelle 22
Ergebnisübersicht 83
Ergebniszusammenfassungen 79
Excel 31, 55, 57, 58, 59,
147, 149, 152, 153, 158,
162, 185, 187, 188, 194,
195, 196, 213, 245, 246,
258, 259
Eingabedaten direkt aus
Excel 57
in STATISTICA öffnen
152
Export der Ausgabe 6, 15
Export von Daten 295
Externe Datenbanken 265
Externe Server 265
Extras-Menü 234
Fähigkeitsanalyse siehe
Prozessfähigkeitsanalyse
Fälle
Dubletten filtern 66
Schaltfläche in der
Symbolleiste 13
Fallnamen 191
Fallstatus 222
Filtern von Daten siehe
Daten – Säuberung und
Filterung
Formel
in Tabellen 14
INDEX
Funktion
extern aufrufbar 3, 246,
295
intern verwendete 12,
74, 75, 104, 151, 211,
245
Grafiken 196, 207
Anpassung 208, 210,
219, 235
automatische
Aktualisierung 152
benutzerdefinierte 209
Blockdaten 214, 218
Brushing 222
Eingabedaten 214, 215
Fallstatus 222
Kategorien 214
Menü 220
mit STATISTICA Visual
Basic erzeugen 227
Referenzen 209
Spezielle Grafiken 226
Standardgrafiken 219
STATISTICA Visual
Basic 209
Zusammenfassung 79
Grafikfenster
anpassen 29
erstellt aus Tabellen 28
Grafik-Menü 143
GxP-Bericht 108
Hilfe 33, 277
Höhere Modelle 295
HTML 151, 284, 291, 292,
299, 303, 305
Import von Daten 6, 152,
265, 285, 295
STATISTICA-Handbuch – 309
Copyright © StatSoft, 2009
HANDBUCH:
INDEX
ISO 21747 80, 82, 83, 84
Java 5
k-Nearest-Neighbor 72
Knoten 89
Knowledge Portal 167,
178
Kontextmenü 15
Kopieren 24
Kopieren mit Kopfzeile 24
Korrelationsbeispiel 11
Korrelationsmatrix 16
Makros 42, 197
Analyse-Makros 242
aufzeichnen 4, 42, 53,
149, 241, 242, 243
in Symbolleisten/Menüs
hinzufügen 247
Master-Makros 243
Tastatur-Makros 243
über Befehlszeile
ausführen 248
Master-Makros 243
Mehrere Analysen
durchführen 134
Menü
Ansicht 233
benutzerdefiniert 148
Data Mining 142
Datei 13
Daten 13
Extras 234
Fälle-Schaltfläche 13
Grafik 143
Kontextmenü einer
Tabelle 15
Statistik 142
Var.-Schaltfläche 13
Microsoft OfficeIntegration 152, 258
Microsoft Word
Bericht 165
Integration 153
Missing Data 59, 69, 71,
72, 73, 87, 107, 202
auf einen bestimmten
Wert setzen 71, 72,
106
ersetzen 72, 73
Modell-Deployment 298
Monitoring and Alerting
Server 300
Multimedia-Tabelle 13,
189
Multivariate explorative
Verfahren 296
Multivariate statistische
Prozesslenkung 297
Navigationsbaum (Bericht)
195
Neuronale Netze 296
Nodes 89
Office-Integration siehe
Microsoft OfficeIntegration
OLE-DB 263
OLE-Objekte 195
OLE-Unterstützung 258
Optionen
Analyse fortsetzen 144
Automatisches
Minimieren 143
Auto-Sichern 158
in den Vordergrund 145
Info-Box verbergen 145
verbergen 144
PDF-Datei
speichern als PDF 165
PI connector 302
Poweranalyse 296
PROCEED 305
Process Optimization 298
Projekte siehe
STATISTICA-Projekte
Prozessanalyse 297
Prozessfähigkeitsanalyse
80
QC Miner siehe Process
Optimization
Qualitätsregelkarten 297
Query 263
Recipe siehe Data Miner
Recipe
Register Standard 4, 18,
19, 21, 36, 38, 44, 82,
180, 231
Regulierte Bereiche 102
RTF
Bericht 164
Format 194
SAL (Sequence
Association and Link
Analysis) 299
Server-Integration 97
Six-Sigma-Grafiken 79
Six-Sigma-Werkzeuge 297
Sperren von Tabellen 106
SQL 60, 64, 119, 120,
125, 127, 263, 264, 304
Standardeinstellungen 234
Start-Menü 137
310 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
HANDBUCH:
STATISTICA
Anpassung 231
Aufruf aus anderen
Anwendungen 149
Bes. Eigenschaften 4
Gemeinsame Systemeigenschaften 295
Software-Technologie 5
Übersicht der
Kernfunktionen 3
STATISTICA Automated
Neural Networks 296
STATISTICA Basis 295
STATISTICA Data Miner
298
STATISTICA Data Miner
Recipe 86, 199
STATISTICA Data
Warehouse 302
STATISTICA Document
Management System
301
STATISTICA Enterprise
300
STATISTICA Enterprise
Manager 110
STATISTICA
Enterprise/QC 300
STATISTICA EnterpriseLinie 298
STATISTICA Explorative
Verfahren 296
STATISTICA Höhere
Modelle 295
STATISTICA Monitoring
and Alerting Server 300
STATISTICA MultiStream
300
STATISTICA Multivariate
Statistische
Prozesslenkung 297
STATISTICA PI Connector
302
STATISTICA Poweranalyse
296
STATISTICA
PowerSolutions 306
STATISTICA Process
Optimization 298
STATISTICA
Prozessanalyse 297
STATISTICA
Qualitätsregelkarten 297
STATISTICA Query 263
STATISTICA Sequence
Association and Link
Analysis 299
STATISTICA StartSchaltfläche 146
STATISTICA Text Miner
298
STATISTICA
Unternehmensweites
Data-Mining-System
298
STATISTICA Variance
Estimation and Precision
296
STATISTICA
Versuchsplanung 297
STATISTICA Visual Basic
42, 149, 197, 209, 241
Analyse-Makros 242
Beispiel 248
Editor und Debugger
243
Eigenschaften 149
Master-Makros 243
Methoden 149
mit SVB Grafiken
erstellen 227
Programme ausführen
246
Struktur 246
Tastatur-Makros 243
STATISTICA-Projekt
speichern 198
STATISTICA-Projekte 198
Statistik-Menü 142
Statistischer Berater 33
INDEX
StatSoft Website 278
Streuungsplot 49, 50
STR-Format 194
Symbolleiste 138, 146
anpassen 147
benutzerdefiniert 147
Tabelle 13, 189
Batch-Formeln 76
Bildlauf unterteilen 30
drucken 25
Eingabe 192
Ergebnisse 22
Fallnamen 191
Formeln 14, 75
Info-Feld 191
Kontextmenü 15
Kopfleiste 190
sperren 106
Titel 191
Variablennamen 191
verschlüsseln 105
Zellformatierung 192
Ziehen-und-Ablegen 31
Tabellenformeln 74
Tastatur-Makros 243
Technischer Support 279
Teilen von Tabellen 30
Text Miner 298
Umkodierung siehe Daten
umkodieren
Var.-Schaltfläche 13
Variable
Auswahl 20
automatische
Vorauswahl 140
Invariante Variablen
filtern 69
STATISTICA-Handbuch – 311
Copyright © StatSoft, 2009
HANDBUCH:
INDEX
Spezifikationen 14
Variablenbündel-Beispiel
42
Variablennamen 191
VEPAC (Variance
Estimation and
Precision) 296
Verschlüsselung von
Tabellen 105
Versuchsplanung 297
Visual Basic 241
Eigenschaften 149
Methoden 149
Webfähigkeit 7
Website, StatSoft 278
WebSTATISTICA 97, 150,
167, 283
Inhalte publizieren 169
Knowledge Portal 167
WebSTATISTICA Server
301
XML 151, 284, 290, 291,
292, 299
Ziehen-und-Ablegen 31,
152, 186, 188, 196, 232
Zusammenfassung
Grafiken 79
312 – STATISTICA-Handbuch
Copyright © StatSoft, 2009
HANDBUCH:
NOTIZEN
STATISTICA-Handbuch – 313
Copyright © StatSoft, 2009