Diagnostische Merkmale von Screeningverfahren zur Vorhersage

Transcription

Diagnostische Merkmale von Screeningverfahren zur Vorhersage
Marx, P. & Lenhard, W. (2010). Diagnostische Merkmale von
Screeningverfahren. In M. Hasselhorn & W. Schneider (Hrsg),
Frühprognose schulischer Kompetenzen. Göttingen: Hogrefe.
Diagnostische Merkmale von Screening-Verfahren zur Früherkennung möglicher Probleme
beim Schriftspracherwerb
Peter Marx und Wolfgang Lenhard
Zusammenfassung
Möglichst frühzeitige Hinweise auf Beeinträchtigungen im Erwerb der grundlegenden
schulischen Fertigkeiten Lesen und Rechtschreiben können zweifellos von großem Nutzen
sein. Vorschulische und schulische Screening-Verfahren zur Vorhersage späterer Lese- und
Rechtschreibschwierigkeiten sind dann wertvoll, wenn sie prognostisch valide sind, und wenn
sich die Informationen für den Einsatz von Präventionsmaßnahmen nutzen lassen. In diesem
Kapitel werden die wesentlichen Gütekriterien von Screening-Verfahren erläutert und gängige
Screening-Verfahren auf diese Gütekriterien hin verglichen. Dabei soll auf die Chancen einer
frühzeitigen Diagnostik hingewiesen werden, aber auch auf mögliche Konsequenzen von
Fehlklassifikationen. Schließlich wird auf die bestehenden Möglichkeiten zur Verknüpfung
von Screening-Befunden mit Fördermaßnahmen hingewiesen.
1. Einleitung
Psychologische Diagnostik kann eine Reihe unterschiedlicher Ziele verfolgen. Sie dient in der
Forschung der Entwicklung und Validierung von Verfahren und Modellen. Innerhalb der
Pädagogischen Psychologie stellt sich beispielsweise bei der Einschulung und in der
Schullaufbahnberatung die Frage nach den für das Kind am besten geeigneten Schulformen.
Ziel ist es hierbei, Kinder für geeignete Bildungswege auszuwählen („Selektionsdiagnostik“)
oder Kinder der bestmöglichen Beschulung zuzuordnen („Platzierungsdiagnostik“). Diese
Fragestellung liegt also nicht primär darin begründet, etwaige Lernrückstände zu
kompensieren, sondern den Ist-Stand der individuellen Eigenschaften zu ermitteln (siehe auch
Amelang & Schmidt-Atzert, 2006, S. 15 f.). Auf der anderen Seite ist pädagogischpsychologische Diagnostik meist auch vom Wunsch motiviert, die Ergebnisse für die
Förderung nutzbar zu machen („Modifikationsdiagnostik“). Ziel hierbei ist es, gestörte
Lernprozesse zu untersuchen und Interventionsmaßnahmen zu planen und zu evaluieren.
Diese unterschiedlichen Diagnosestrategien stehen nicht im Gegensatz zueinander, sondern
bedingen sich im Fall der Erfassung der Vorläuferfertigkeiten des Schriftspracherwerbs sehr
stark gegenseitig: Die Vorläuferfertigkeiten sind eine wichtige Voraussetzung für den
erfolgreichen Erwerb der Schriftsprache und Kinder mit Defiziten in diesem Bereich sollten
einer weiterführenden Förderung zugeführt werden („Selektion“). Zum anderen liefern
entsprechende Tests im Idealfall Ansätze für eine effektive Förderung, indem sie aufzeigen,
welche Schwächen vorliegen, und welche Kompetenzen das Kind vorweisen kann. Sie
können also möglicherweise aufzeigen, wie bei einer Förderung am besten vorgegangen
werden könnte („Modifikationsdiagnostik“).
Dennoch ist die Frage schwierig, in welcher Weise die diagnostischen Informationen
eingesetzt werden können, da einerseits Screeningverfahren nicht zwangsläufig detaillierte
und zuverlässige Informationen über Leistungsprofile von Kindern liefern. Zum anderen sind
auch verschiedene Vorläuferfertigkeiten unterschiedlich gut trainierbar, sodass ein Teil der
Testergebnisse nicht unmittelbar in eine Förderung münden kann, da er sich auf stabile und
schwer beeinflussbare Leistungen bezieht. Gleichzeitig steht zum Schuleingang nur eine
begrenzte Zeit zur Verfügung, bevor sich vorhandene Rückstände chronifizieren (Mannhaupt,
1994), sodass die Entscheidung über die Art und Weise der Förderung zügig getroffen werden
sollte. Doch wie früh kann man effektiv fördern, wen sollte man fördern und wo ist dabei
individuell anzusetzen? Hier ist erst einmal zwischen universeller und selektiver Prävention
zu unterscheiden.
Bei universeller Prävention wird darauf verzichtet, Kinder zu identifizieren, die Prävention
(besonders) nötig haben. Stattdessen werden alle Kinder in einem bestimmten Alter bzw. in
einem
bestimmten
Lebensabschnitt,
z.
B.
im
letzten
Kindergartenjahr,
in
die
Präventionsmaßnahme einbezogen. Ein wesentlicher Vorteil einer universellen Prävention
liegt darin, dass keine förderbedürftigen Kinder aufgrund von Fehlklassifikationen von der
Präventionsmaßnahme ausgeschlossen werden. Zudem lassen sich universelle Maßnahmen
teilweise leichter in den Alltag integrieren. Auch wird einer Stigmatisierung vorgebeugt, da
leistungsschwache Kinder in die normalen Fördergruppen integriert sind und keinen
besonderen Status erhalten. Mit einer universellen Prävention ist jedoch ein im Vergleich zur
selektiven Prävention höherer personeller und finanzieller Aufwand verbunden. Darüber
hinaus besteht bei einer universellen Prävention die Gefahr, dass diejenigen, die einer
Förderung besonders bedürfen, nicht intensiv genug gefördert werden können.
Eine selektive Prävention setzt eine valide Bestimmung einer „Risikogruppe“ voraus, also
eine Identifikation derjenigen Kinder, die eine Förderung nötig haben. Im Gegensatz zu einer
Vorhersage von Lese- oder Rechtschreibleistungen über das gesamte Leistungsspektrum, zu
der korrelative Ansätze herangezogen werden, basiert die Vorhersage späterer LeseRechtschreibschwierigkeiten auf einem klassifikatorischen Ansatz, also der Zuordnung von
Kindern zur Risiko- und zur Nicht-Risiko-Gruppe. Im deutschsprachigen Raum existieren
einige Verfahren, die bereits im Vorschulalter Kinder ausfindig machen wollen, bei denen mit
erhöhter Wahrscheinlichkeit Probleme im schulischen Schriftspracherwerb zu erwarten sind.
Diese Verfahren machen sich die Erkenntnis zunutze, dass Kinder bereits vor Schuleintritt
Vorläuferfertigkeiten des Lesens und Rechtschreibens erwerben. Defizite in diesen
Vorläuferfertigkeiten werden als Risikofaktoren für die spätere Aneignung der Schriftsprache
gewertet. Durch Präventionsmaßnahmen kann nun versucht werden, über eine Förderung der
defizitären Vorläuferfertigkeiten das Risiko späterer Lese-Rechtschreibschwierigkeiten zu
verringern.
2. Überblick über aktuell verfügbare Screening-Verfahren
Beflügelt
von
den
Forschungsergebnissen
zur
Bedeutung
der
phonologischen
Informationsverarbeitung für den Schriftspracherwerb wurde eine Reihe an ScreeningVerfahren zur frühen Vorhersage von Lese- und Rechtschreibschwierigkeiten entwickelt. Im
Folgenden werden einige Verfahren kurz beschrieben und dahingehend charakterisiert, ob sie
sehr spezifisch phonologische Fertigkeiten erfassen, den Sprachstand umfassender erheben
oder auch über den sprachlichen Bereich hinausgehende Aufgaben enthalten.
Die Differenzierungsprobe (DP) nach Breuer und Weuffen ist das älteste verfügbare
Screening-Verfahren. Sie erschien in der ersten Auflage in der DDR bereits 1975 und hat das
Ziel, Defizite in Differenzierungsleistungen vor oder zum Schuleingang festzustellen (Breuer
& Weuffen, 2000, S. 49). Da die Konstruktion bereits vor den Forschungsarbeiten zum
Themenbereich phonologische Informationsverarbeitung in den 1980er und 1990er Jahren
stattfand, weist sie im Aufbau deutliche Unterschiede zu den anderen Diagnoseverfahren auf:
Die Autoren gehen davon aus, dass für den Schriftspracherwerb die fünf verschiedenen
Wahrnehmungsbereiche a) optisch-graphomotorische, b) phonematisch-akustische, c)
kinästhetisch-artikulatorische, d) melodisch-intonatorische und e) rhythmisch-strukturierende
Differenzierungsfähigkeit wichtig sind. Diese Teilbereiche werden in Einzeltestungen erfasst.
Für unterschiedliche Altersgruppen stehen unterschiedliche Versionen der DP zur Verfügung.
Der Gruppentest zur Früherkennung von Lese- und Rechtschreibschwierigkeiten (PB-LRS;
Barth & Gomm, 2004a) beschränkt sich auf die Erfassung von Leistungen, die zum Bereich
phonologische Bewusstheit gerechnet werden. Dabei werden sowohl Aufgaben vorgegeben,
die zur phonologischen Bewusstheit im engeren Sinne zu zählen sind (erfordern den Umgang
mit Einzellauten) als auch Aufgaben, die der phonologischen Bewusstheit im weiteren Sinne
zuzuordnen sind (Umgang mit größeren sprachlichen Einheiten wie Silben oder Reimen). Zur
Vorhersage wird ein Testgesamtwert berechnet, der sich aus der Summe der korrekt gelösten
Aufgaben der Subtests ergibt.
Der „Rundgang durch Hörhausen“ (Martschinke, Kirschhock & Frank, 2002), der zu Beginn
und in der Mitte des ersten Schuljahres durchgeführt werden kann, erfasst ebenfalls die
phonologische Bewusstheit im weiteren und im engeren Sinne. Er ist als Einzeltest
durchzuführen.
Das Bielefelder Screening (BISC, Jansen, Mannhaupt, H. Marx & Skowronek, 1999) ist als
Einzeltest für das letzte Kindergartenjahr konzipiert. Das BISC legt zwar ebenfalls einen
Schwerpunkt auf die phonologische Bewusstheit, enthält jedoch nur Aufgaben, die zur
phonologischen Bewusstheit im weiteren Sinne zu zählen sind, da vor Schulbeginn Aufgaben
zur phonologischen Bewusstheit im engeren Sinne in der Regel Bodeneffekte produzieren,
also nicht in der Lage sind, im unteren Leistungsbereich zu differenzieren. Neben den vier
Aufgaben zur phonologischen Bewusstheit im weiteren Sinne werden in vier bzw. fünf
weiteren Aufgaben Leistungen aus den Bereichen Gedächtnis und (visuelle) Aufmerksamkeit
erfasst.
Eng an das Bielefelder Screening angelehnt sind die Aufgaben des Münsteraner Screenings
(MÜSC; Mannhaupt, 2006), das als Gruppentest zu Beginn des ersten Schuljahres eingesetzt
werden kann. Das MÜSC verzichtet dabei darauf, die von den Kindern zu Schulbeginn
erworbene phonologische Bewusstheit im engeren Sinne zu erfassen.
Das Heidelberger Auditive Screening in der Einschulungsuntersuchung (HASE; Schöler &
Brunner, 2007, siehe auch Schöler, in diesem Band) enthält Aufgaben zur Erfassung der
Leistungsfähigkeit
des
phonologischen
Arbeitsgedächtnisses
und
des
Sprachentwicklungsstandes. Die in den bisher angeführten Verfahren im Vordergrund
stehende phonologische Bewusstheit wird nicht erfasst.
Das Dortmunder Entwicklungsscreening für den Kindergarten (DESK 3-6; Tröster, Flender
& Reineke, 2004) ist umfassender angelegt als die anderen Screenings. Es hat das Ziel,
Entwicklungs- und Verhaltensauffälligkeiten im Kindergartenalter festzustellen und
berücksichtigt neben Sprache und Kognition auch Feinmotorik, Grobmotorik und soziale
Entwicklung. Das Verfahren ist also nicht speziell für die Prognose späterer LeseRechtschreibschwierigkeiten konzipiert. Eine weitere Besonderheit dieses Verfahrens ist auch
der Versuch, die Datenerhebung durch die Erzieherinnen in den Kindergartenalltag zu
integrieren. Ein Teil der Daten wird durch Beobachtung der Kinder erfasst, der Rest
(„Durchführungsaufgaben“) wird über einen Zeitraum von vier Wochen ermittelt, wobei die
Aufgaben in ein „Zirkusspiel“ integriert sind.
3. Gütekriterien von Screening-Verfahren
Als Hauptgütekriterien gelten Objektivität, Reliabilität und Validität. Welche Besonderheiten
bestehen hier für Screening-Verfahren?
3.1 Objektivität
Wie
bei
allen
Diagnose-Instrumenten
sollten
Durchführungs-,
Auswertungs-
und
Interpretationsobjektivität gegeben sein. Hohe Durchführungs- und Auswertungsobjektivität
sollten durch Standardisierung sichergestellt werden. Die Standardisierung der Durchführung
ist beim DESK 3-6 nicht vollständig gewährleistet, bei den restlichen Verfahren sollten sich
hier keine größeren Probleme ergeben, wenn die jeweilige Instruktion genau befolgt wird.
Eine instruktionswidrige mündliche Vorgabe stellt bei denjenigen Verfahren, die eine
Vorgabe
per
CD
vorsehen,
eine
schwerwiegende
Beeinträchtigung
der
Durchführungsobjektivität dar (zu den Auswirkungen einer solchen Abweichung siehe
Schöler, in diesem Band). Hinsichtlich der Auswertungsobjektivität können zwar einzelne
Probleme auftauchen, beispielsweise wenn entschieden werden muss, ob ein Wort exakt
nachgesprochen wurde oder nicht, im Großen und Ganzen sollte die Auswertungsobjektivität
bei den Verfahren in ausreichendem Maße gegeben sein. Die Interpretationsobjektivität ist im
Falle von Screening-Verfahren durch klare Kriterien für die Ermittlung eines Risikos auf der
Basis der Rohwerte zu gewährleisten. Auch wenn sich die Vorgehensweise bei den
Screening-Verfahren unterscheidet, ist anhand der Rohwerte in der Regel eine klare
Entscheidung vorgegeben.
Beim PB-LRS und beim DESK 3-6 wird das Risiko über den Gesamtscore (Summe aller
richtigen Antworten über alle Untertests hinweg) ermittelt. Beim BISC und beim HASE wird
für jeden Untertest anhand der Anzahl richtiger Lösungen ein Risikopunkt vergeben oder
nicht. Ein Risiko wird dann über die Anzahl der Risikopunkte bestimmt, beim HASE zudem
über
die
Kombination
bestimmter
Risikopunkte.
In
der
DP
wird
für
jeden
Wahrnehmungsbereich separat das Vorliegen eines Defizits ermittelt.
3.2 Reliabilität
Für Screening-Verfahren wesentlich ist die Zuverlässigkeit, mit der ein Kind der Risiko- oder
der Nicht-Risiko-Gruppe zugeordnet werden kann. Daten liegen hier nur spärlich vor. Eine
Besonderheit stellt dabei bei manchen Verfahren eine Zwischenkategorie („Grenzfälle“) dar.
Diese Kategorie trägt dem Umstand Rechnung, dass es zwischen „Risiko-Kindern“ und
„Nicht-Risiko-Kindern“ keinen qualitativen Unterschied gibt. In den durch das Screening
erfassten Variablen findet man üblicherweise eine kontinuierliche Leistungsverteilung,
innerhalb der man ein bestimmtes Kriterium setzen muss, ab dem einem Kind ein „Risiko“
zugeschrieben wird. Diese Entweder-Oder-Entscheidung wird durch die Kategorie
„Grenzfall“ sozusagen abgemildert.
3.3 Inhaltliche Validität
Die inhaltliche Validität ist im Rahmen von Screening-Verfahren vor allem dann von
Bedeutung, wenn aus Defiziten im Screening-Verfahren unmittelbar auf die zu fördernden
Leistungsbereiche
geschlossen
werden
soll.
Die
Zuordnung
von
Aufgaben
zur
phonologischen Bewusstheit erscheint zwar oft eindeutig, doch ist für einige der Aufgaben
eine Konfundierung mit dem phonologischen Arbeitsgedächtnis gegeben. Zudem bestehen
manchmal Schwierigkeiten bei der Abgrenzung zwischen Aufgaben zur phonologischen
Bewusstheit im engeren und im weiteren Sinne. Da die beiden Aufgaben „Laute assoziieren“
und „Laut-zu-Wort“ aus dem BISC auch dann richtig gelöst werden können, wenn nur die
phonologische Bewusstheit auf der Ebene von Silben und Reimen beherrscht wird, sind diese
beiden Aufgaben zur phonologischen Bewusstheit im weiteren Sinne zu zählen, obwohl sie in
einigen Publikationen der phonologischen Bewusstheit im engeren Sinne zugeordnet werden.
Bei Aufgaben zur Erfassung des phonologischen Arbeitsgedächtnisses dürfte die inhaltliche
Validität in der Regel gegeben sein, bei Aufgaben zur Erfassung des schnellen Abrufs aus
dem Langzeitgedächtnis ist die Zuordnung zur phonologischen Informationsverarbeitung
umstritten, da das schnelle Benennen nicht nur phonologische, sondern auch visuelle
Anforderungen beinhaltet. Die Erfassung allgemeiner Sprachkompetenzen über das
Nachsprechen von Sätzen scheint auf den ersten Blick zwar eher eine Aufgabe zum
phonologischen Arbeitsgedächtnis zu sein und ist sicherlich auch damit konfundiert, doch ist
die Notwendigkeit einer grammatischen und semantischen Verarbeitung des Satzes als Basis
für das Nachsprechen unbestritten (siehe auch Schöler, in diesem Band).
Bei der DP ist die Angabe, das Verfahren erfasse Sprachwahrnehmungsleistungen,
hinsichtlich der inhaltlichen Validität kritisch zu sehen, da insbesondere die optischgraphomorische Differenzierungsfähigkeit hier kaum zugeordnet werden kann.
3.4 Prognostische Validität
Im Vordergrund steht bei Screening-Verfahren aber die prognostische Validität, also die
Frage, wie gut das Verfahren spätere Schwierigkeiten voraussagen kann. „Risiko-Kinder“
sollten
mit
hoher
Wahrscheinlichkeit
tatsächlich
Schwierigkeiten
beim
späteren
Schriftspracherwerb haben (wenn sie keine zusätzliche Förderung erhalten), „Nicht-RisikoKinder“
sollten
mit
sehr
hoher
Wahrscheinlichkeit
einem
unbeeinträchtigten
Schriftspracherwerb entgegensehen können.
- Abbildung 1 und Tabelle 1 bitte ungefähr hier einfügen -
3.4.1 Übersicht über die wesentlichen Kennwerte
Als wesentliche Kennzahlen sind dabei die Sensitivität (Anteil der späteren Problemkinder,
der durch das Screening identifiziert wird), die Spezifität (Anteil der später unauffälligen
Kinder, der durch das Screening identifiziert wird) und die Prädiktortrefferquote (Anteil der
Risiko-Kinder, bei dem später Probleme auftreten) zu betrachten (siehe Abbildung 1 und
Tabelle 1). Wenig aussagekräftig ist dagegen die Angabe der (Gesamt-)Trefferquote. Geht
man beispielsweise davon aus, dass die leistungsschwächsten 10 % der Schulkinder
(= Grundrate) bereits im Kindergarten erkannt werden sollen, dann wäre bei einer völlig
zufälligen Klassifikation der Kindergartenkinder und einer Selektionsrate (Anteil der Kinder,
die als „auffällig“ bzw. „Risikokinder“ diagnostiziert werden) von 10 % zu erwarten, dass
10 % der späteren „Problemkinder“ und 90 % der nicht-betroffenen Kinder richtig
vorhergesagt werden. Die Zufallstrefferquote läge in diesem Fall bei 82 %. Dieser hohe Wert
kommt dadurch zustande, dass 81 % der Gesamtgruppe per Zufall korrekterweise als
unproblematisch erkannt würden und weitere 1 % korrekterweise als problematisch. Durch
die Angabe einer hohen Trefferquote wird daher zwar gerne eine hohe prognostische Validität
suggeriert, doch muss diese Trefferquote immer im Vergleich zur Zufallstrefferquote
betrachtet werden. Der Wert, der angibt, inwieweit die durch das Screening erstellte Prognose
eine Zufallsprognose übertrifft ist der RATZ-Index, der Relative Anstieg der Trefferquote
gegenüber der Zufallstrefferquote (H. Marx, 1992), auf den später noch genauer eingegangen
wird.
Ähnlich wie die Gesamttrefferquote weist bei Screening-Verfahren auch die Spezifität schon
bei Zufallsvorhersagen hohe Werte auf, da die meisten Kinder nicht als Risiko-Kinder
identifiziert werden und später auch keine Lese-Rechtschreibschwierigkeiten haben. Wenn
wir von einer Grundrate von 10 % ausgehen, dann ließe sich nämlich sehr leicht durch eine
geeignete Setzung des Cut-Off-Kriteriums eine Spezifität von 90 % erreichen, ohne dass der
Test irgendeinen diagnostischen Wert hätte. Man müsste lediglich alle Kinder als „NichtRisikokinder“ einstufen. Daher ist bei der Interpretation der Spezifität besondere Vorsicht
angebracht. Auch anscheinend hohe Werte von etwa 90 % übertreffen nicht unbedingt den
Zufall.
Von besonderer Bedeutung ist die Sensitivität, die angibt, welcher Anteil an späteren
Problemkindern durch das Screening als Risiko-Kinder identifiziert wurde. Zieht man die
Sensitivität von 100 % ab, erhält man den Anteil an späteren Problemkindern, den man
„übersehen“ hat („falsch Negative“ – Fehlerart I – Gruppe c).
Erhält eine Person ein Testergebnis, so ist es individuell bedeutsam zu erfahren, wie
wahrscheinlich das Eintreffen der Prognose ist. Hier lassen sich der sogenannte positive und
negative prädiktive Wert berechnen. Obwohl diese Angaben sehr relevant sind, werden sie
leider nur selten berichtet. Der positive prädiktive Wert (auch Prädiktortrefferquote) gibt an,
mit welcher Wahrscheinlichkeit ein „Risikokind“ später tatsächlich Probleme bekommt, der
negative prädiktive Wert gibt an, mit welcher Wahrscheinlichkeit ein „Nicht-Risikokind“
später tatsächlich von Problemen verschont bleibt. Auch für den negativen prädiktiven Wert
ergeben sich bei einem hohen Anteil an Kindern ohne spätere Probleme quasi „automatisch“
Werte im Bereich von 85 oder 90 %.
Als weiterer wesentlicher Kennwert für die Qualität eines Screening-Verfahrens wurde bereits
der RATZ-Index genannt, der die Trefferquote in Bezug zur Zufallstrefferquote und zur
maximal möglichen Trefferquote betrachtet. Sobald Selektionsrate und Grundrate nicht
übereinstimmen, liegt die maximal mögliche Trefferquote unter 100 %. Diesem Umstand
trägt der RATZ-Index Rechnung, indem der Anstieg der Trefferquote gegenüber der
Zufallstrefferquote nicht im Hinblick auf eine perfekte Klassifikation berechnet wird, sondern
in Relation zur maximal möglichen Trefferquote. Liegt beispielsweise die Grundrate bei
10 %, die Selektionsrate aber bei 20 % können maximal 90 % der Gesamtgruppe richtig
klassifiziert werden. Mindestens 10 % werden zwangsläufig fälschlicherweise der
Risikogruppe zugeordnet. In diesem Beispiel läge die Zufallstrefferquote bei 74 % (0,8 ∙ 0,9 +
0,1 ∙ 0,2). Geht man nun davon aus, dass die Vorhersage nicht schlechter gelingt als durch
Zufall, dann sollte sich die Trefferquote im Bereich zwischen 74 % und 90 % befinden, so
dass gegenüber der Zufallstrefferquote ein Anstieg um 16 Prozentpunkte möglich ist. Der
RATZ-Index gibt nun an, wie deutlich das Verfahren den Zufall „schlägt“, indem der Anstieg
der Trefferquote gegenüber der Zufallstrefferquote durch den maximal möglichen Anstieg
von 16 Prozentpunkten dividiert wird. Würde die tatsächliche Trefferquote in unserem
Beispiel bei 78 % liegen, ergäbe sich ein RATZ-Index von 25 % ([78-74] / [90-74]). Der
RATZ-Index kann auch negative Werte annehmen. Das ist der Fall, wenn die Trefferquote
unter der Zufallstrefferquote liegt. Nach Jansen et al. (1999) können Werte über 66 % als sehr
gute Klassifikationen bezeichnet werden, Werte zwischen 34 % und 66 % gelten als gute
(aber eher als nicht spezifische) Klassifikationen und Werte unter 34 % als nicht akzeptabel.
Wählt man eine Selektionsrate, die von der Grundrate abweicht, akzeptiert man von
vornherein eine gewisse Anzahl an Fehlern. Diese Fehler werden durch den RATZ-Index
nicht widergespiegelt. Übersteigt die Selektionsrate die Grundrate deutlich, kann die
Vorhersagegüte eines Verfahrens überschätzt werden. Das soll an dem Extrembeispiel
verdeutlicht werden, dass nur eines von 100 Kindern als Nicht-Risikokind ermittelt würde,
was einer (unrealistischen) Selektionsrate von 99 % entspräche. Hat das Nicht-Risikokind nun
später tatsächlich keine Lese-Rechtschreibschwierigkeiten (vielleicht kann es ja schon im
Kindergarten richtig gut lesen), liegt die Trefferquote des Verfahrens auf der Höhe der
maximal möglichen Trefferquote, der RATZ-Index somit bei 100 %. Auch muss ein sehr
hoher RATZ-Index nicht unbedingt bedeuten, dass die Vorhersage signifikant über dem
Zufall liegt. Die Signifikanz muss über einen Chi2-Test nachgewiesen werden.
3.4.2 Kennwerte der Screening-Verfahren
Wie schneiden nun die angeführten Screening-Verfahren hinsichtlich der wesentlichen
Kennwerte zur prognostischen Validität ab?
Hinsichtlich des MÜSC liegen unseres Wissens keine Angaben zur prognostischen Validität
vor. Dem festgestellten Zusammenhang der Risikoklassifikation durch BISC und durch
MÜSC kann in dieser Hinsicht keine Aussagekraft beigemessen werden.
Zur DP wurden von den Autoren zwar Längsschnittstudien berichtet, auch Zusammenhänge
zu späteren Schulleistungen sowie Gruppenunterschiede zwischen auffälligen und
unauffälligen Kindern, doch keine klassifikatorischen Analysen. Eine aktuelle Studie von
Steinbrink, Schwanda, Klatte und Lachmann (2009) mit N = 664 Kindern, die zu Beginn des
ersten Schuljahres die DP durchgeführt hatten, erbrachte nur geringe RATZ-Indizes, die für
verschiedene Kriterien (Lesen, Rechtschreiben) jeweils höchstens 25 % erreichten. Die
Prädiktortrefferquote lag jeweils unter 20 %, was aber auch auf die insgesamt geringe Anzahl
an Kindern mit späteren Lese-Rechtschreibschwierigkeiten zurückzuführen ist. Jedoch konnte
auch die Sensitivität mit Werten von höchstens 33 % nicht überzeugen. Dennoch zeigten sich
in einzelnen Differenzierungsleistungen Gruppenunterschiede zwischen schwachen und
unbeeinträchtigten Lesern im retrospektiven Vergleich.
Für das Bielefelder Screening liegen aus der Evaluationsstudie von Jansen et al. (1999) gute
bis sehr gute Kennwerte vor, die jedoch in unabhängigen Studien nicht repliziert werden
konnten (P. Marx & Weber, 2006). Betrachtet man die Ergebnisse der Studie von P. Marx und
Weber (2006) sowie einer eigenen Reanalyse der LOGIK-Studie (siehe auch Brügelmann,
2003), so scheint es kaum möglich, durch das BISC mehr als die Hälfte der späteren
Problemkinder zu entdecken (Sensitivität). Auch die Wahrscheinlichkeit für spätere LeseRechtschreibschwierigkeiten dürfte bei Risikokindern eher unter 50 % liegen als darüber
(Prädiktortrefferquote). Die Selektionsrate des BISC zehn Monate vor der Einschulung liegt
bei 15 % (Jansen et al., 1999).
Der PB-LRS arbeitet ebenfalls mit einer Selektionsrate von 15 %. Dazu wurden in einer
Evaluationsstudie mit N = 450 Kindern für die beiden Testzeitpunkte zwei Cut-Off-Kriterien
festgelegt: 22 richtig gelöste Aufgaben bei den Kindergarten- und 36 richtige Lösungen bei
den Schulkindern. Bei einer Nachfolgeuntersuchung am Ende der 1. Klasse mit der
Diagnostischen Bilderliste (DBL I; Dummer-Smoch, 1993) wurden 10 % der Kinder als
rechtschreibschwach diagnostiziert. Die Sensitivität lag bei 63 %, die Spezifität bei 87 %, die
Prädiktortrefferquote bei 36 %. Der RATZ-Index von 55 % erreicht ein relativ gutes Niveau
(Gütekriterien berechnet auf der Basis von Barth & Gomm, 2004b, Tab. 18).
Die prognostische Validität des Rundgangs durch Hörhausen wurde ebenfalls durch den
klassifikatorischen Ansatz anhand der Daten von 375 Schülern und Schülerinnen überprüft
(Martschinke, Kirschhock & Frank, 2002, S. 38 f). Bei einer Selektionsrate von 20 %
variieren die RATZ-Indizes in Bezug auf die Kriterien Lesegeschwindigkeit, Leseverständnis
und Rechtschreibung in der ersten Klasse zwischen 25 % (Lesegeschwindigkeit) und 77 %
(Leseverständnis). In der zweiten Klasse liegen die Werte erwartungsgemäß niedriger (29 %
bis 39 %). Die Autoren geben die Spezifität mit über 80 % an. Die Sensitivität variiert
zwischen 38 % und 48 % und ist somit eher niedrig. Im günstigen Fall ergibt sich bei diesen
Werten eine Prädiktor-Treffer-Quote von 63 %.
Zur prognostischen Validität des HASE liegen ermutigende Befunde von Schöler (in diesem
Band; Treutlein, Roos & Schöler, 2007) vor, die jedoch mit einer sehr hohen Selektionsrate
von über 40 % erreicht wurden. Da die Risikokriterien erst nach Feststellung der
Kriteriumsleistungen festgelegt wurden, die Ermittlung der Vorhersagegenauigkeit also an
denselben Daten vorgenommen wurde wie die Festlegung der Grenzwerte, ist eine
Replikation der Ergebnisse unbedingt erforderlich.
Für das DESK 3-6 liegen bislang keine publizierten Angaben zur Vorhersage von LeseRechtschreibschwierigkeiten vor. Die Selektionsrate liegt bei 11 % (davon 4 % „auffällig“
und 7 % „fraglich“). Es werden auch Normen für die vier Entwicklungsbereiche und den
Gesamtscore angegeben.
3.4.3 Fehlklassifikationen
Selbstverständlich ist bei allen Screening-Verfahren eine gewisse – und wie die
Evaluationsstudien zeigen – durchweg nicht unerhebliche Anzahl an Fehlklassifikationen
nicht zu vermeiden. Diese Fehlklassifikationen und die Bedeutung der beiden Fehlerarten
sollen nun etwas genauer betrachtet werden.
Bei den vorherzusagenden Schriftsprachleistungen handelt es sich um kontinuierlich verteilte
Variablen, die willkürlich in defizitäre und unauffällige Leistungsbereiche unterteilt werden
müssen. Daher dürfte bereits unmittelbar einsichtig sein, dass es keine perfekte Vorhersage
geben kann. Insbesondere Kinder im Grenzbereich zwischen defizitären und unauffälligen
Kriteriumsleistungen können kaum überzufällig genau vorhergesagt werden. Setzt man
beispielsweise für Rechtschreibschwierigkeiten einen Prozentrang (PR) von 15 als Grenze an,
wird man ein Kind, das einen PR von 14 erreicht, kaum häufiger als „Risikokind“
klassifizieren können als ein Kind, das einen PR von 16 erreicht, schon alleine deshalb, weil
jemand der einen PR von 14 in einem Rechtschreibtest hat, mit mehr als 50 %
Wahrscheinlichkeit in einem vergleichbaren neuen Rechtschreibtest mindestens PR 15
erreichen würde – wenn man eine gewisse Regression zur Mitte berücksichtigt (bei einer
Reliabilität der Tests von beispielsweise r = .90). An dieser Stelle soll zudem die Frage nach
den möglichen Kriterien gestellt werden. Je nachdem welchen Lese- oder Rechtschreibtest
bzw. welche Kombination von Tests in welchem Schuljahr als Kriterium verwendet wird,
wird man bei unterschiedlichen Kindern Lese-Rechtschreibschwierigkeiten feststellen. Auch
das macht deutlich, dass eine Vorhersage bei weitem nicht perfekt ausfallen kann, sondern
zwangsläufig ein gewisser Anteil an Fehlklassifikationen auftreten muss.
Diskussionswürdig ist, inwieweit dabei jemand als Fehlklassifikation zu betrachten ist, der als
„Risikokind“ identifiziert wurde und dann beispielsweise einen PR von 16 aufweist, oder
jemand, dem kein Risiko zugeschrieben wurde, der dann aber (in einem einzigen Test) einen
PR von 14 aufweist. Würde man diese Fälle nicht als Fehlklassifikation werten, würde sich
allerdings auch die Zufallstrefferquote erhöhen.
Die Prognose von Lese-Rechtschreibschwierigkeiten muss auch deshalb schwerfallen, da ein
komplexes Zusammenwirken vielfältiger individueller Faktoren und unterschiedlicher
Einflüsse der Umwelt zu diesen Schwierigkeiten führt, wobei ein Screening-Verfahren nur
einen Ausschnitt der Faktoren erfassen kann. Zudem erschweren die nach der Durchführung
des Screenings wirkenden Einflüsse der familiären und schulischen Umwelt eine Vorhersage
erheblich („unvermeidliche Unzulänglichkeiten“ von Screeningverfahren, siehe H. Marx,
1992).
Je nachdem, ob die Priorität auf der Erkennung möglichst vieler Merkmalsträger oder der
Vermeidung falsch positiver Ergebnisse liegt, wird die Selektionsrate bzw. das Cut-OffKriterium gewählt, also jenes Kriterium, das angibt, ab wann ein Testergebnis als auffällig
oder unauffällig eingestuft wird. Sollen möglichst wenige falsch positive Testergebnisse
erzielt werden (Minimierung der Gruppe b – siehe Abbildung 1 und Tabelle 1), riskiert man
dafür die Nichtentdeckung von Merkmalsträgern (Vergrößerung der Gruppe c). Sollen
hingegen möglichst alle Personen erkannt werden, die das Merkmal aufweisen, dann erhält
dafür eine umso größere Personengruppe ein falsch positives Ergebnis. Im ersten Fall wird die
Spezifität auf Kosten der Sensitivität maximiert, im zweiten Fall maximiert man die
Sensitivität auf Kosten der Spezifität und des positiven prädiktiven Wertes. Vorgeschlagen
wird eine Selektionsrate, die das 1,3 bis 2,5-fache der (erwarteten) Grundrate beträgt (siehe
z.B. H. Marx, 1992).
Beide Arten von Fehlklassifikationen (falsch positive und falsch negative) können negative
Konsequenzen für die betroffenen Kinder nach sich ziehen. Wird einem Kind
fälschlicherweise ein Risiko zugeschrieben, könnte sich zwar die Konsequenz der Förderung
als positiv erweisen, da durch manche Präventionsmaßnahmen auch die – sowieso schon ganz
guten – Startchancen unbeeinträchtigter Kinder weiter verbessert werden, jedoch könnten sich
durch die Alarmierung der Eltern, Erzieherinnen und des Kindes selbst negative
Konsequenzen für das Selbstbild des Kindes und mögliche Probleme im Sinne einer sich
selbst erfüllenden Prophezeiung ergeben. Zudem sind unnötige Belastungen des Kindes, der
Erzieherinnen und auch der Gesellschaft durch eine überflüssige Förderung in Betracht zu
ziehen. Wird ein Kind dagegen fälschlicherweise nicht als „Risikokind“ erkannt, dann wird
diesem Kind die eigentlich benötigte Förderung vorenthalten. Geht man davon aus, dass diese
Förderung die Startchancen des Kindes für den Schriftspracherwerb verbessert hätte, bestehen
in
diesem
Fall
die
negativen
Konsequenzen
in
den
verminderten
Lese-
und
Rechtschreibleistungen mit all den damit verbundenen Nachteilen für die Schulkarriere und
möglichen Sekundärproblematiken. Die meisten Screening-Verfahren präferieren eine
möglichst hohe Sensitivität und wählen daher eine Selektionsrate die über der Grundrate liegt.
Dieses Vorgehen ist vor allem in Hinblick auf die Konzeption eines Screenings als
Grobsiebverfahren, dem eine Feindiagnostik für alle „Risikokinder“ folgen sollte, sicherlich
zu empfehlen. Denn der somit in Kauf genommene hohe Anteil an falsch Positiven könnte
durch die Ergebnisse der Feindiagnostik reduziert werden. Insbesondere in den – in der Praxis
wohl nicht seltenen – Fällen, in denen dem auffälligen Screening-Befund keine weitere
Diagnostik folgt, muss bei hoher Selektionsrate allerdings deutlich gemacht werden, dass das
Risiko der „Risikokinder“ nicht überschätzt werden sollte.
3.5 Nebengütekriterien
Sicherlich kann den Gruppentestverfahren (PB-LRS, MÜSC) ein Vorteil hinsichtlich der
Ökonomie attestiert werden. Bei den Einzeltests sind die Verfahren mit einer kurzen
Durchführungsdauer von etwa 10 Minuten (HASE, DP) ökonomischer als das BISC (etwa 25
Minuten) oder der PB-LRS (etwa 45 Minuten im Kindergarten bzw. 60 Minuten in der
Schuleingangsphase).
Die Akzeptanz der Verfahren bei Kindern, Eltern, Erzieherinnen und Erziehern und den
Lehrkräften dürfte bei den ökonomischeren Verfahren eher höher sein. Bei den Kindern ist
durch die Abwechslung verschiedener Aufgaben in der Regel gewährleistet, dass sie an der
Testung recht gerne teilnehmen (Zumutbarkeit). Die spielerische Gestaltung der meisten
Screenings sollte auch dafür sorgen, dass die Kinder mit Spaß dabeibleiben. Bei Eltern und
Erzieherinnen und Erziehern bzw. Lehrkräften hängt die Akzeptanz insbesondere wohl davon
ab, welchen Nutzen sie sich von dem Verfahren versprechen. Konkrete Hinweise auf
Fördermaßnahmen (siehe unten) dürften dabei von hoher Bedeutung sein. Darüber wird
vermutlich bei den Erzieherinnen und Erziehern die Integrierbarkeit in den Kindergartenalltag
die Akzeptanz erhöhen (DESK 3-6) – allerdings mit gewissen Gefahren für die Objektivität
aufgrund der geringeren Standardisierung.
4. Verknüpfung mit Förderung
Bereits
mehrfach
wurde
angesprochen,
dass
die
Prognose
von
Lese-
Rechtschreibschwierigkeiten die Prävention dieser Schwierigkeiten zum Ziel hat. In
Abschnitt 3 wurde die Frage diskutiert, inwieweit durch die Screening-Verfahren überhaupt
diejenigen Kinder als „Risikokinder“ identifiziert werden, bei denen ohne Förderung LeseRechtschreibschwierigkeiten auftreten würden, also die Frage der prognostischen Validität
der Verfahren. Nun soll es darum gehen, ob und wie die frühzeitige Identifikation von
„Risikokindern“ zu einer Prävention genutzt werden kann. Einerseits erscheint es plausibel,
durch die Behebung bzw. Reduktion der Defizite in den Vorläuferfertigkeiten, die im
Screening erfasst werden, die Startchancen der betroffenen Kinder für den späteren
Schriftspracherwerb zu erhöhen. Andererseits stellt sich die Frage, inwieweit diese
Vorläuferfertigkeiten effektiv trainierbar sind. Positiven Trainingsbefunden für den Bereich
der phonologischen Bewusstheit und der Buchstabenkenntnis steht beispielsweise das Fehlen
effektiver
Fördermöglichkeiten
für
die
Geschwindigkeit
des
Zugriffs
auf
das
Langzeitgedächtnis und für das phonologische Arbeitsgedächtnis gegenüber. Nur sehr bedingt
liefern die Screening-Verfahren konkrete Hinweise darauf, wo eine Förderung ansetzen sollte.
Sie beschränken sich teilweise auf die Feststellung eines Risikos, das mit der Empfehlung
einer Förderung verknüpft ist.
Defizite in der phonologischen Bewusstheit, die durch den PB-LRS oder den Rundgang durch
Hörhausen festgestellt werden, legen natürlich eine Förderung in diesem Bereich nahe. Der
Rundgang durch Hörhausen ist dabei explizit mit dem Trainingsprogramm „Lesen Lernen mit
der Hexe Susi“ (Forster & Martschinke, 2001) verknüpft. Bei Defiziten in der DP wird in
ähnlicher Weise eine Förderung in dem „Wahrnehmungsbereich“ angeraten, in dem die
Differenzierungsleistungen nicht ausreichend erscheinen. Dazu werden von Breuer und
Weuffen (2000) auch konkrete Übungen vorgeschlagen bzw. auf weitergehende Maßnahmen
verwiesen. Beim BISC wird oft von einer engen Verknüpfung mit den Würzburger
Trainingsprogrammen zur phonologischen Bewusstheit und zur Buchstabe-Laut-Zuordnung
(„Hören, Lauschen, Lernen“, Küspert & Schneider, 2006, und „Hören, Lauschen, Lernen 2“,
Plume & Schneider, 2004) ausgegangen. Diese Verknüpfung ist jedoch nur dann gegeben,
wenn die im BISC ermittelten Defizite im Bereich der phonologischen Bewusstheit liegen.
Beim DESK 3-6 und beim HASE ist jeweils keine direkte Verzahnung mit einer
Fördermaßnahme gegeben. Die im Rahmen der Einschulungsuntersuchung in BadenWürttemberg auf den HASE folgende Feindiagnostik durch den SET-K 3-5 legt nahe, dass
die sich daraus ergebende Förderung allgemein auf den sprachlichen Bereich abzielen dürfte.
Will man aus dem Vorliegen eines Defizits in bestimmten Untertests eines Verfahrens einen
konkreten Förderbedarf im erfassten Bereich ableiten, muss man sich generell die Frage
stellen, inwieweit einzelne Untertests ausreichend zuverlässige Aussagen ermöglichen, da in
der Regel auch bei guten Reliabilitätswerten für einen Gesamttest die entsprechenden Werte
für die Untertests deutlich geringer ausfallen.
5. Diskussion
Die bestehenden Screening-Verfahren lassen keine sicheren Prognosen zu. Daher sollte die
Forderung der Autoren der meisten Screening-Verfahren Ernst genommen werden, dass ein
auffälliges Screening-Ergebnis von einer umfangreicheren Diagnostik gefolgt werden muss.
Zudem scheint eine Prozessdiagnostik erfolgversprechender als eine Prognose anhand eines
einmal durchgeführten Verfahrens. Beim BISC ist es durch die Normierung für zwei
Messzeitpunkte (10 Monate und 4 Monate vor der Einschulung) möglich, eine kombinierte
Prognose zu ermitteln, wobei allerdings nicht ganz klar wird, welche praktischen Folgerungen
sich aus welchen Ergebnissen ergeben. Ist nämlich ein Kind 10 Monate vor der Einschulung
auffällig, sollte es ja gefördert werden, was dann allerdings die Ergebnisse des
zweiten Messzeitpunktes weitgehend unbrauchbar macht.
Aufgrund der prinzipiell begrenzten Vorhersagekraft von Vorschulscreenings und
Schuleingangstests plädieren Amelang und Schmidt-Atzert (2006, S. 476) dafür, stärker die
„Bewährung“ der Kinder in der ersten Klasse im Auge zu behalten. Dies habe den Vorteil,
dass anstatt allgemeiner Leistungsanforderungen die konkret geforderten Bewährungskriterien
erfassbar sind. In Bezug auf den Schriftspracherwerb ist es beispielsweise zu Beginn des
Schriftspracherwerbs bereits möglich, Maße der phonologischen Bewusstheit im engeren
Sinne zu erfassen, und auch erste, sich entwickelnde Lese- und Schreibkompetenzen zu
erheben. Eine Vorhersage des Schulerfolgs und ein Erkennen von sich abzeichnenden
Schwierigkeiten im Schriftspracherwerb sind dadurch vermutlich leichter möglich als zu
Beginn
des
letzten
Kindergartenjahres.
Damit
Kindern
Versagens-
und
Überforderungserlebnisse erspart bleiben, muss in diesem Fall von Beginn an eine erhöhte
Wachsamkeit der Lehrkräfte gegeben sein, und ggf. müssen zusätzliche Fördermaßnahmen im
phonologischen Bereich erfolgen. Das Ende der Kindergartenzeit sollte deswegen jedoch
keineswegs
ungenutzt
verstreichen:
Mit
einem
Training
aller
Kinder
in
den
Vorläuferfertigkeiten des Schriftspracherwerbs (universelle Prävention) lassen sich die
Schuleingangsvoraussetzungen aller Kinder verbessern, ohne dass man riskiert, unerkannte
„Risikokinder“ nicht zu fördern.
Literatur
Amelang, M. & Schmidt-Atzert, L. (2006). Psychologische Diagnostik und Intervention.
Berlin: Springer.
Barth, K. & Gomm, B. (2004a). Gruppentest zur Früherkennung von Lese- und
Rechtschreibschwierigkeiten (PB-LRS). München: Reinhardt.
Barth,
K.
&
Gomm,
B.
(2004b).
Teststatistik
[Internet].
verfügbar
unter:
http://www.reinhardt-verlag.de/pdf/material01716.pdf (Datum des Abrufs: 08.10.2009).
München: Reinhardt.
Breuer,
H.
&
Weuffen,
Schuleingangsdiagnostik
M.
zur
(2000).
Lernschwierigkeiten
Früherkennung
und
am
Schulanfang:
Frühförderung
(Erweiterte
Neuausgabe). Weinheim: Basel.
Brügelmann, H. (2003). Vorschulische Prädiktoren des Misserfolgs beim Schriftspracherwerb
in der Schule. Abschlussbericht des Projekts LOGIK-R an das MWF. Verfügbar unter
http://www.agprim.uni-siegen.de/logik-r/logik%5B1%5D.03.bericht_an_mswf.11-232.pdf
[Zugriff am 07.10.2009]
Dummer-Smoch, L. (1993). Die Diagnostischen Bilderlisten. Siebungsverfahren zur
Früherkennung von Leselernschwierigkeiten im Leselernprozess. Kiel: Veris.
Forster, M. & Martschinke, S. (2001). Leichter lesen und schreiben lernen mit der Hexe Susi.
Donauwörth: Auer.
Jansen, H., Mannhaupt, G., Marx, H. & Skowronek, H. (1999). Bielefelder Screening zur
Früherkennung von Lese-Rechtschreibschwierigkeiten (BISC). Göttingen: Hogrefe.
Küspert, P. & Schneider, W. (2006). Hören, Lauschen, Lernen: Sprachspiele für Kinder im
Vorschulalter; Würzburger Trainingsprogramm zur Vorbereitung auf den Erwerb der
Schriftsprache (5., überarbeitete Aufl.). Göttingen: Vandenhoeck & Ruprecht.
Mannhaupt,
G.
(1994).
Deutschsprachige
Studien
zu
Intervention
bei
Lese-
Rechtschreibschwierigkeiten: Ein Überblick zu neueren Forschungstrends. Zeitschrift für
Pädagogische Psychologie, 8, 123-138.
Mannhaupt, G. (2006). Münsteraner Screening (MÜSC) zur Früherkennung von LeseRechtschreibschwierigkeiten. Hamburg: verlag für pädagogische medien.
Martschinke, S., Kirschhock, E.-M., Frank, A. (2002). Der Rundgang durch Hoerhausen.
Erhebungsverfahren zur phonologischen Bewusstheit. Band 1 (2. Auflage). Donauwoerth:
Auer.
Marx, H. (1992). Methodische und inhaltliche Argumente für und wider eine frühe
Identifikation und Prädiktion von Lese-Rechtschreibschwierigkeiten. Diagnostica, 38 (3),
249-268.
Marx,
P.
&
Weber,
J.
(2006).
Vorschulische
Vorhersage
von
Lese-
und
Rechtschreibschwierigkeiten: Neue Befunde zur prognostischen Validität des Bielefelder
Screenings (BISC). Zeitschrift für Pädagogische Psychologie, 20, 251-259.
Plume, E. & Schneider, W. (2004). Hören, Lauschen, Lernen 2 - Sprachspiele mit Buchstaben
und Lauten für Kinder im Vorschulalter. Göttingen: Vandenhoeck & Ruprecht.
Schöler, H. & Brunner, M. (2007). HASE - Heidelberger Auditives Screening in der
Einschulungsuntersuchung (2. erweiterte Auflage). Wertingen: Westra.
Steinbrink, C., Schwanda, S., Klatte, M. & Lachmann, T. (2009, September). Sagen
Wahrnehmungsleistungen zu Beginn der Schulzeit den Lese-Rechtschreiberfolg in Klasse
1 und 2 voraus? Poster präsentiert auf der 12. Fachtagung Pädagogische Psychologie in
Saarbrücken.
Treutlein, A., Roos, J. & Schöler, H. (2007). Zur prognostischen Validität des Heidelberger
Auditiven Screenings in der Einschulungsuntersuchung HASE. Abschlussbericht des
Projektes EVER. Heidelberg: Pädagogische Hochschule, Fakultät I. Online verfügbar
unter
http://www.ph-heidelberg.de/wp/schoeler/Datein/Abschlussbericht_EVER-
HASE_Feb-2007.pdf [Zugriff am 07.10.2009].
Tröster, H., Flender, J. & Reineke, D. (2004). Dortmunder Entwicklungsscreening für den
Kindergarten DESK 3-6. Göttingen: Hogrefe.
Tabelle 1: Berechnung der Kennwerte zur Vorhersagegüte eines Screening-Verfahrens (siehe
auch H. Marx, 1992)
Kriterium
betroffen
nicht betroffen Gesamt
a
b
a+b
c
d
c+d
a+c
b+d
a + b+ c + d
auffällig
(„Risiko“)
Prädiktor
unauffällig
(„Kein Risiko“)
Gesamt
Sensitivität
a / (a + c)
Spezifität
d / (b + d)
Positiver prädiktiver Wert
a / (a + b)
(= Prädiktortrefferquote)
Negativer prädiktiver Wert
c / (c + d)
Trefferquote (TQ)
(a + d) / (a + b+ c + d)
Maximale Trefferquote (max. TQ)
1 – |(b – c)| / (a + b + c + d)
Zufallstrefferquote (ZTQ)
[(a + b) * (a + c)] / (a + b+ c + d)2 +
[(c + d) * (b + d)] / (a + b+ c + d)2
RATZ-Index
(TQ – ZTQ) / (max. TQ – ZTQ)
Abbildungsvereichnis
Abbildung 1: Mögliche Resultate einer Screeninguntersuchung. Das Ergebnis des Screenings
ist an der y-Achse angetragen, das Kriterium an der x-Achse. Die Flächenanteile bezeichnen
a) die korrekt erkannten betroffenen Kinder, b) die falsch-positiv diagnostizierten Kinder
(Fehlerart II), c) die „übersehenen“ betroffenen Kinder (= falsch negativ, Fehlerart I) und d)
die korrekt erkannten nicht betroffenen Kinder.
Abbildungen
Abbildung 1