Diagnostische Merkmale von Screeningverfahren zur Vorhersage
Transcription
Diagnostische Merkmale von Screeningverfahren zur Vorhersage
Marx, P. & Lenhard, W. (2010). Diagnostische Merkmale von Screeningverfahren. In M. Hasselhorn & W. Schneider (Hrsg), Frühprognose schulischer Kompetenzen. Göttingen: Hogrefe. Diagnostische Merkmale von Screening-Verfahren zur Früherkennung möglicher Probleme beim Schriftspracherwerb Peter Marx und Wolfgang Lenhard Zusammenfassung Möglichst frühzeitige Hinweise auf Beeinträchtigungen im Erwerb der grundlegenden schulischen Fertigkeiten Lesen und Rechtschreiben können zweifellos von großem Nutzen sein. Vorschulische und schulische Screening-Verfahren zur Vorhersage späterer Lese- und Rechtschreibschwierigkeiten sind dann wertvoll, wenn sie prognostisch valide sind, und wenn sich die Informationen für den Einsatz von Präventionsmaßnahmen nutzen lassen. In diesem Kapitel werden die wesentlichen Gütekriterien von Screening-Verfahren erläutert und gängige Screening-Verfahren auf diese Gütekriterien hin verglichen. Dabei soll auf die Chancen einer frühzeitigen Diagnostik hingewiesen werden, aber auch auf mögliche Konsequenzen von Fehlklassifikationen. Schließlich wird auf die bestehenden Möglichkeiten zur Verknüpfung von Screening-Befunden mit Fördermaßnahmen hingewiesen. 1. Einleitung Psychologische Diagnostik kann eine Reihe unterschiedlicher Ziele verfolgen. Sie dient in der Forschung der Entwicklung und Validierung von Verfahren und Modellen. Innerhalb der Pädagogischen Psychologie stellt sich beispielsweise bei der Einschulung und in der Schullaufbahnberatung die Frage nach den für das Kind am besten geeigneten Schulformen. Ziel ist es hierbei, Kinder für geeignete Bildungswege auszuwählen („Selektionsdiagnostik“) oder Kinder der bestmöglichen Beschulung zuzuordnen („Platzierungsdiagnostik“). Diese Fragestellung liegt also nicht primär darin begründet, etwaige Lernrückstände zu kompensieren, sondern den Ist-Stand der individuellen Eigenschaften zu ermitteln (siehe auch Amelang & Schmidt-Atzert, 2006, S. 15 f.). Auf der anderen Seite ist pädagogischpsychologische Diagnostik meist auch vom Wunsch motiviert, die Ergebnisse für die Förderung nutzbar zu machen („Modifikationsdiagnostik“). Ziel hierbei ist es, gestörte Lernprozesse zu untersuchen und Interventionsmaßnahmen zu planen und zu evaluieren. Diese unterschiedlichen Diagnosestrategien stehen nicht im Gegensatz zueinander, sondern bedingen sich im Fall der Erfassung der Vorläuferfertigkeiten des Schriftspracherwerbs sehr stark gegenseitig: Die Vorläuferfertigkeiten sind eine wichtige Voraussetzung für den erfolgreichen Erwerb der Schriftsprache und Kinder mit Defiziten in diesem Bereich sollten einer weiterführenden Förderung zugeführt werden („Selektion“). Zum anderen liefern entsprechende Tests im Idealfall Ansätze für eine effektive Förderung, indem sie aufzeigen, welche Schwächen vorliegen, und welche Kompetenzen das Kind vorweisen kann. Sie können also möglicherweise aufzeigen, wie bei einer Förderung am besten vorgegangen werden könnte („Modifikationsdiagnostik“). Dennoch ist die Frage schwierig, in welcher Weise die diagnostischen Informationen eingesetzt werden können, da einerseits Screeningverfahren nicht zwangsläufig detaillierte und zuverlässige Informationen über Leistungsprofile von Kindern liefern. Zum anderen sind auch verschiedene Vorläuferfertigkeiten unterschiedlich gut trainierbar, sodass ein Teil der Testergebnisse nicht unmittelbar in eine Förderung münden kann, da er sich auf stabile und schwer beeinflussbare Leistungen bezieht. Gleichzeitig steht zum Schuleingang nur eine begrenzte Zeit zur Verfügung, bevor sich vorhandene Rückstände chronifizieren (Mannhaupt, 1994), sodass die Entscheidung über die Art und Weise der Förderung zügig getroffen werden sollte. Doch wie früh kann man effektiv fördern, wen sollte man fördern und wo ist dabei individuell anzusetzen? Hier ist erst einmal zwischen universeller und selektiver Prävention zu unterscheiden. Bei universeller Prävention wird darauf verzichtet, Kinder zu identifizieren, die Prävention (besonders) nötig haben. Stattdessen werden alle Kinder in einem bestimmten Alter bzw. in einem bestimmten Lebensabschnitt, z. B. im letzten Kindergartenjahr, in die Präventionsmaßnahme einbezogen. Ein wesentlicher Vorteil einer universellen Prävention liegt darin, dass keine förderbedürftigen Kinder aufgrund von Fehlklassifikationen von der Präventionsmaßnahme ausgeschlossen werden. Zudem lassen sich universelle Maßnahmen teilweise leichter in den Alltag integrieren. Auch wird einer Stigmatisierung vorgebeugt, da leistungsschwache Kinder in die normalen Fördergruppen integriert sind und keinen besonderen Status erhalten. Mit einer universellen Prävention ist jedoch ein im Vergleich zur selektiven Prävention höherer personeller und finanzieller Aufwand verbunden. Darüber hinaus besteht bei einer universellen Prävention die Gefahr, dass diejenigen, die einer Förderung besonders bedürfen, nicht intensiv genug gefördert werden können. Eine selektive Prävention setzt eine valide Bestimmung einer „Risikogruppe“ voraus, also eine Identifikation derjenigen Kinder, die eine Förderung nötig haben. Im Gegensatz zu einer Vorhersage von Lese- oder Rechtschreibleistungen über das gesamte Leistungsspektrum, zu der korrelative Ansätze herangezogen werden, basiert die Vorhersage späterer LeseRechtschreibschwierigkeiten auf einem klassifikatorischen Ansatz, also der Zuordnung von Kindern zur Risiko- und zur Nicht-Risiko-Gruppe. Im deutschsprachigen Raum existieren einige Verfahren, die bereits im Vorschulalter Kinder ausfindig machen wollen, bei denen mit erhöhter Wahrscheinlichkeit Probleme im schulischen Schriftspracherwerb zu erwarten sind. Diese Verfahren machen sich die Erkenntnis zunutze, dass Kinder bereits vor Schuleintritt Vorläuferfertigkeiten des Lesens und Rechtschreibens erwerben. Defizite in diesen Vorläuferfertigkeiten werden als Risikofaktoren für die spätere Aneignung der Schriftsprache gewertet. Durch Präventionsmaßnahmen kann nun versucht werden, über eine Förderung der defizitären Vorläuferfertigkeiten das Risiko späterer Lese-Rechtschreibschwierigkeiten zu verringern. 2. Überblick über aktuell verfügbare Screening-Verfahren Beflügelt von den Forschungsergebnissen zur Bedeutung der phonologischen Informationsverarbeitung für den Schriftspracherwerb wurde eine Reihe an ScreeningVerfahren zur frühen Vorhersage von Lese- und Rechtschreibschwierigkeiten entwickelt. Im Folgenden werden einige Verfahren kurz beschrieben und dahingehend charakterisiert, ob sie sehr spezifisch phonologische Fertigkeiten erfassen, den Sprachstand umfassender erheben oder auch über den sprachlichen Bereich hinausgehende Aufgaben enthalten. Die Differenzierungsprobe (DP) nach Breuer und Weuffen ist das älteste verfügbare Screening-Verfahren. Sie erschien in der ersten Auflage in der DDR bereits 1975 und hat das Ziel, Defizite in Differenzierungsleistungen vor oder zum Schuleingang festzustellen (Breuer & Weuffen, 2000, S. 49). Da die Konstruktion bereits vor den Forschungsarbeiten zum Themenbereich phonologische Informationsverarbeitung in den 1980er und 1990er Jahren stattfand, weist sie im Aufbau deutliche Unterschiede zu den anderen Diagnoseverfahren auf: Die Autoren gehen davon aus, dass für den Schriftspracherwerb die fünf verschiedenen Wahrnehmungsbereiche a) optisch-graphomotorische, b) phonematisch-akustische, c) kinästhetisch-artikulatorische, d) melodisch-intonatorische und e) rhythmisch-strukturierende Differenzierungsfähigkeit wichtig sind. Diese Teilbereiche werden in Einzeltestungen erfasst. Für unterschiedliche Altersgruppen stehen unterschiedliche Versionen der DP zur Verfügung. Der Gruppentest zur Früherkennung von Lese- und Rechtschreibschwierigkeiten (PB-LRS; Barth & Gomm, 2004a) beschränkt sich auf die Erfassung von Leistungen, die zum Bereich phonologische Bewusstheit gerechnet werden. Dabei werden sowohl Aufgaben vorgegeben, die zur phonologischen Bewusstheit im engeren Sinne zu zählen sind (erfordern den Umgang mit Einzellauten) als auch Aufgaben, die der phonologischen Bewusstheit im weiteren Sinne zuzuordnen sind (Umgang mit größeren sprachlichen Einheiten wie Silben oder Reimen). Zur Vorhersage wird ein Testgesamtwert berechnet, der sich aus der Summe der korrekt gelösten Aufgaben der Subtests ergibt. Der „Rundgang durch Hörhausen“ (Martschinke, Kirschhock & Frank, 2002), der zu Beginn und in der Mitte des ersten Schuljahres durchgeführt werden kann, erfasst ebenfalls die phonologische Bewusstheit im weiteren und im engeren Sinne. Er ist als Einzeltest durchzuführen. Das Bielefelder Screening (BISC, Jansen, Mannhaupt, H. Marx & Skowronek, 1999) ist als Einzeltest für das letzte Kindergartenjahr konzipiert. Das BISC legt zwar ebenfalls einen Schwerpunkt auf die phonologische Bewusstheit, enthält jedoch nur Aufgaben, die zur phonologischen Bewusstheit im weiteren Sinne zu zählen sind, da vor Schulbeginn Aufgaben zur phonologischen Bewusstheit im engeren Sinne in der Regel Bodeneffekte produzieren, also nicht in der Lage sind, im unteren Leistungsbereich zu differenzieren. Neben den vier Aufgaben zur phonologischen Bewusstheit im weiteren Sinne werden in vier bzw. fünf weiteren Aufgaben Leistungen aus den Bereichen Gedächtnis und (visuelle) Aufmerksamkeit erfasst. Eng an das Bielefelder Screening angelehnt sind die Aufgaben des Münsteraner Screenings (MÜSC; Mannhaupt, 2006), das als Gruppentest zu Beginn des ersten Schuljahres eingesetzt werden kann. Das MÜSC verzichtet dabei darauf, die von den Kindern zu Schulbeginn erworbene phonologische Bewusstheit im engeren Sinne zu erfassen. Das Heidelberger Auditive Screening in der Einschulungsuntersuchung (HASE; Schöler & Brunner, 2007, siehe auch Schöler, in diesem Band) enthält Aufgaben zur Erfassung der Leistungsfähigkeit des phonologischen Arbeitsgedächtnisses und des Sprachentwicklungsstandes. Die in den bisher angeführten Verfahren im Vordergrund stehende phonologische Bewusstheit wird nicht erfasst. Das Dortmunder Entwicklungsscreening für den Kindergarten (DESK 3-6; Tröster, Flender & Reineke, 2004) ist umfassender angelegt als die anderen Screenings. Es hat das Ziel, Entwicklungs- und Verhaltensauffälligkeiten im Kindergartenalter festzustellen und berücksichtigt neben Sprache und Kognition auch Feinmotorik, Grobmotorik und soziale Entwicklung. Das Verfahren ist also nicht speziell für die Prognose späterer LeseRechtschreibschwierigkeiten konzipiert. Eine weitere Besonderheit dieses Verfahrens ist auch der Versuch, die Datenerhebung durch die Erzieherinnen in den Kindergartenalltag zu integrieren. Ein Teil der Daten wird durch Beobachtung der Kinder erfasst, der Rest („Durchführungsaufgaben“) wird über einen Zeitraum von vier Wochen ermittelt, wobei die Aufgaben in ein „Zirkusspiel“ integriert sind. 3. Gütekriterien von Screening-Verfahren Als Hauptgütekriterien gelten Objektivität, Reliabilität und Validität. Welche Besonderheiten bestehen hier für Screening-Verfahren? 3.1 Objektivität Wie bei allen Diagnose-Instrumenten sollten Durchführungs-, Auswertungs- und Interpretationsobjektivität gegeben sein. Hohe Durchführungs- und Auswertungsobjektivität sollten durch Standardisierung sichergestellt werden. Die Standardisierung der Durchführung ist beim DESK 3-6 nicht vollständig gewährleistet, bei den restlichen Verfahren sollten sich hier keine größeren Probleme ergeben, wenn die jeweilige Instruktion genau befolgt wird. Eine instruktionswidrige mündliche Vorgabe stellt bei denjenigen Verfahren, die eine Vorgabe per CD vorsehen, eine schwerwiegende Beeinträchtigung der Durchführungsobjektivität dar (zu den Auswirkungen einer solchen Abweichung siehe Schöler, in diesem Band). Hinsichtlich der Auswertungsobjektivität können zwar einzelne Probleme auftauchen, beispielsweise wenn entschieden werden muss, ob ein Wort exakt nachgesprochen wurde oder nicht, im Großen und Ganzen sollte die Auswertungsobjektivität bei den Verfahren in ausreichendem Maße gegeben sein. Die Interpretationsobjektivität ist im Falle von Screening-Verfahren durch klare Kriterien für die Ermittlung eines Risikos auf der Basis der Rohwerte zu gewährleisten. Auch wenn sich die Vorgehensweise bei den Screening-Verfahren unterscheidet, ist anhand der Rohwerte in der Regel eine klare Entscheidung vorgegeben. Beim PB-LRS und beim DESK 3-6 wird das Risiko über den Gesamtscore (Summe aller richtigen Antworten über alle Untertests hinweg) ermittelt. Beim BISC und beim HASE wird für jeden Untertest anhand der Anzahl richtiger Lösungen ein Risikopunkt vergeben oder nicht. Ein Risiko wird dann über die Anzahl der Risikopunkte bestimmt, beim HASE zudem über die Kombination bestimmter Risikopunkte. In der DP wird für jeden Wahrnehmungsbereich separat das Vorliegen eines Defizits ermittelt. 3.2 Reliabilität Für Screening-Verfahren wesentlich ist die Zuverlässigkeit, mit der ein Kind der Risiko- oder der Nicht-Risiko-Gruppe zugeordnet werden kann. Daten liegen hier nur spärlich vor. Eine Besonderheit stellt dabei bei manchen Verfahren eine Zwischenkategorie („Grenzfälle“) dar. Diese Kategorie trägt dem Umstand Rechnung, dass es zwischen „Risiko-Kindern“ und „Nicht-Risiko-Kindern“ keinen qualitativen Unterschied gibt. In den durch das Screening erfassten Variablen findet man üblicherweise eine kontinuierliche Leistungsverteilung, innerhalb der man ein bestimmtes Kriterium setzen muss, ab dem einem Kind ein „Risiko“ zugeschrieben wird. Diese Entweder-Oder-Entscheidung wird durch die Kategorie „Grenzfall“ sozusagen abgemildert. 3.3 Inhaltliche Validität Die inhaltliche Validität ist im Rahmen von Screening-Verfahren vor allem dann von Bedeutung, wenn aus Defiziten im Screening-Verfahren unmittelbar auf die zu fördernden Leistungsbereiche geschlossen werden soll. Die Zuordnung von Aufgaben zur phonologischen Bewusstheit erscheint zwar oft eindeutig, doch ist für einige der Aufgaben eine Konfundierung mit dem phonologischen Arbeitsgedächtnis gegeben. Zudem bestehen manchmal Schwierigkeiten bei der Abgrenzung zwischen Aufgaben zur phonologischen Bewusstheit im engeren und im weiteren Sinne. Da die beiden Aufgaben „Laute assoziieren“ und „Laut-zu-Wort“ aus dem BISC auch dann richtig gelöst werden können, wenn nur die phonologische Bewusstheit auf der Ebene von Silben und Reimen beherrscht wird, sind diese beiden Aufgaben zur phonologischen Bewusstheit im weiteren Sinne zu zählen, obwohl sie in einigen Publikationen der phonologischen Bewusstheit im engeren Sinne zugeordnet werden. Bei Aufgaben zur Erfassung des phonologischen Arbeitsgedächtnisses dürfte die inhaltliche Validität in der Regel gegeben sein, bei Aufgaben zur Erfassung des schnellen Abrufs aus dem Langzeitgedächtnis ist die Zuordnung zur phonologischen Informationsverarbeitung umstritten, da das schnelle Benennen nicht nur phonologische, sondern auch visuelle Anforderungen beinhaltet. Die Erfassung allgemeiner Sprachkompetenzen über das Nachsprechen von Sätzen scheint auf den ersten Blick zwar eher eine Aufgabe zum phonologischen Arbeitsgedächtnis zu sein und ist sicherlich auch damit konfundiert, doch ist die Notwendigkeit einer grammatischen und semantischen Verarbeitung des Satzes als Basis für das Nachsprechen unbestritten (siehe auch Schöler, in diesem Band). Bei der DP ist die Angabe, das Verfahren erfasse Sprachwahrnehmungsleistungen, hinsichtlich der inhaltlichen Validität kritisch zu sehen, da insbesondere die optischgraphomorische Differenzierungsfähigkeit hier kaum zugeordnet werden kann. 3.4 Prognostische Validität Im Vordergrund steht bei Screening-Verfahren aber die prognostische Validität, also die Frage, wie gut das Verfahren spätere Schwierigkeiten voraussagen kann. „Risiko-Kinder“ sollten mit hoher Wahrscheinlichkeit tatsächlich Schwierigkeiten beim späteren Schriftspracherwerb haben (wenn sie keine zusätzliche Förderung erhalten), „Nicht-RisikoKinder“ sollten mit sehr hoher Wahrscheinlichkeit einem unbeeinträchtigten Schriftspracherwerb entgegensehen können. - Abbildung 1 und Tabelle 1 bitte ungefähr hier einfügen - 3.4.1 Übersicht über die wesentlichen Kennwerte Als wesentliche Kennzahlen sind dabei die Sensitivität (Anteil der späteren Problemkinder, der durch das Screening identifiziert wird), die Spezifität (Anteil der später unauffälligen Kinder, der durch das Screening identifiziert wird) und die Prädiktortrefferquote (Anteil der Risiko-Kinder, bei dem später Probleme auftreten) zu betrachten (siehe Abbildung 1 und Tabelle 1). Wenig aussagekräftig ist dagegen die Angabe der (Gesamt-)Trefferquote. Geht man beispielsweise davon aus, dass die leistungsschwächsten 10 % der Schulkinder (= Grundrate) bereits im Kindergarten erkannt werden sollen, dann wäre bei einer völlig zufälligen Klassifikation der Kindergartenkinder und einer Selektionsrate (Anteil der Kinder, die als „auffällig“ bzw. „Risikokinder“ diagnostiziert werden) von 10 % zu erwarten, dass 10 % der späteren „Problemkinder“ und 90 % der nicht-betroffenen Kinder richtig vorhergesagt werden. Die Zufallstrefferquote läge in diesem Fall bei 82 %. Dieser hohe Wert kommt dadurch zustande, dass 81 % der Gesamtgruppe per Zufall korrekterweise als unproblematisch erkannt würden und weitere 1 % korrekterweise als problematisch. Durch die Angabe einer hohen Trefferquote wird daher zwar gerne eine hohe prognostische Validität suggeriert, doch muss diese Trefferquote immer im Vergleich zur Zufallstrefferquote betrachtet werden. Der Wert, der angibt, inwieweit die durch das Screening erstellte Prognose eine Zufallsprognose übertrifft ist der RATZ-Index, der Relative Anstieg der Trefferquote gegenüber der Zufallstrefferquote (H. Marx, 1992), auf den später noch genauer eingegangen wird. Ähnlich wie die Gesamttrefferquote weist bei Screening-Verfahren auch die Spezifität schon bei Zufallsvorhersagen hohe Werte auf, da die meisten Kinder nicht als Risiko-Kinder identifiziert werden und später auch keine Lese-Rechtschreibschwierigkeiten haben. Wenn wir von einer Grundrate von 10 % ausgehen, dann ließe sich nämlich sehr leicht durch eine geeignete Setzung des Cut-Off-Kriteriums eine Spezifität von 90 % erreichen, ohne dass der Test irgendeinen diagnostischen Wert hätte. Man müsste lediglich alle Kinder als „NichtRisikokinder“ einstufen. Daher ist bei der Interpretation der Spezifität besondere Vorsicht angebracht. Auch anscheinend hohe Werte von etwa 90 % übertreffen nicht unbedingt den Zufall. Von besonderer Bedeutung ist die Sensitivität, die angibt, welcher Anteil an späteren Problemkindern durch das Screening als Risiko-Kinder identifiziert wurde. Zieht man die Sensitivität von 100 % ab, erhält man den Anteil an späteren Problemkindern, den man „übersehen“ hat („falsch Negative“ – Fehlerart I – Gruppe c). Erhält eine Person ein Testergebnis, so ist es individuell bedeutsam zu erfahren, wie wahrscheinlich das Eintreffen der Prognose ist. Hier lassen sich der sogenannte positive und negative prädiktive Wert berechnen. Obwohl diese Angaben sehr relevant sind, werden sie leider nur selten berichtet. Der positive prädiktive Wert (auch Prädiktortrefferquote) gibt an, mit welcher Wahrscheinlichkeit ein „Risikokind“ später tatsächlich Probleme bekommt, der negative prädiktive Wert gibt an, mit welcher Wahrscheinlichkeit ein „Nicht-Risikokind“ später tatsächlich von Problemen verschont bleibt. Auch für den negativen prädiktiven Wert ergeben sich bei einem hohen Anteil an Kindern ohne spätere Probleme quasi „automatisch“ Werte im Bereich von 85 oder 90 %. Als weiterer wesentlicher Kennwert für die Qualität eines Screening-Verfahrens wurde bereits der RATZ-Index genannt, der die Trefferquote in Bezug zur Zufallstrefferquote und zur maximal möglichen Trefferquote betrachtet. Sobald Selektionsrate und Grundrate nicht übereinstimmen, liegt die maximal mögliche Trefferquote unter 100 %. Diesem Umstand trägt der RATZ-Index Rechnung, indem der Anstieg der Trefferquote gegenüber der Zufallstrefferquote nicht im Hinblick auf eine perfekte Klassifikation berechnet wird, sondern in Relation zur maximal möglichen Trefferquote. Liegt beispielsweise die Grundrate bei 10 %, die Selektionsrate aber bei 20 % können maximal 90 % der Gesamtgruppe richtig klassifiziert werden. Mindestens 10 % werden zwangsläufig fälschlicherweise der Risikogruppe zugeordnet. In diesem Beispiel läge die Zufallstrefferquote bei 74 % (0,8 ∙ 0,9 + 0,1 ∙ 0,2). Geht man nun davon aus, dass die Vorhersage nicht schlechter gelingt als durch Zufall, dann sollte sich die Trefferquote im Bereich zwischen 74 % und 90 % befinden, so dass gegenüber der Zufallstrefferquote ein Anstieg um 16 Prozentpunkte möglich ist. Der RATZ-Index gibt nun an, wie deutlich das Verfahren den Zufall „schlägt“, indem der Anstieg der Trefferquote gegenüber der Zufallstrefferquote durch den maximal möglichen Anstieg von 16 Prozentpunkten dividiert wird. Würde die tatsächliche Trefferquote in unserem Beispiel bei 78 % liegen, ergäbe sich ein RATZ-Index von 25 % ([78-74] / [90-74]). Der RATZ-Index kann auch negative Werte annehmen. Das ist der Fall, wenn die Trefferquote unter der Zufallstrefferquote liegt. Nach Jansen et al. (1999) können Werte über 66 % als sehr gute Klassifikationen bezeichnet werden, Werte zwischen 34 % und 66 % gelten als gute (aber eher als nicht spezifische) Klassifikationen und Werte unter 34 % als nicht akzeptabel. Wählt man eine Selektionsrate, die von der Grundrate abweicht, akzeptiert man von vornherein eine gewisse Anzahl an Fehlern. Diese Fehler werden durch den RATZ-Index nicht widergespiegelt. Übersteigt die Selektionsrate die Grundrate deutlich, kann die Vorhersagegüte eines Verfahrens überschätzt werden. Das soll an dem Extrembeispiel verdeutlicht werden, dass nur eines von 100 Kindern als Nicht-Risikokind ermittelt würde, was einer (unrealistischen) Selektionsrate von 99 % entspräche. Hat das Nicht-Risikokind nun später tatsächlich keine Lese-Rechtschreibschwierigkeiten (vielleicht kann es ja schon im Kindergarten richtig gut lesen), liegt die Trefferquote des Verfahrens auf der Höhe der maximal möglichen Trefferquote, der RATZ-Index somit bei 100 %. Auch muss ein sehr hoher RATZ-Index nicht unbedingt bedeuten, dass die Vorhersage signifikant über dem Zufall liegt. Die Signifikanz muss über einen Chi2-Test nachgewiesen werden. 3.4.2 Kennwerte der Screening-Verfahren Wie schneiden nun die angeführten Screening-Verfahren hinsichtlich der wesentlichen Kennwerte zur prognostischen Validität ab? Hinsichtlich des MÜSC liegen unseres Wissens keine Angaben zur prognostischen Validität vor. Dem festgestellten Zusammenhang der Risikoklassifikation durch BISC und durch MÜSC kann in dieser Hinsicht keine Aussagekraft beigemessen werden. Zur DP wurden von den Autoren zwar Längsschnittstudien berichtet, auch Zusammenhänge zu späteren Schulleistungen sowie Gruppenunterschiede zwischen auffälligen und unauffälligen Kindern, doch keine klassifikatorischen Analysen. Eine aktuelle Studie von Steinbrink, Schwanda, Klatte und Lachmann (2009) mit N = 664 Kindern, die zu Beginn des ersten Schuljahres die DP durchgeführt hatten, erbrachte nur geringe RATZ-Indizes, die für verschiedene Kriterien (Lesen, Rechtschreiben) jeweils höchstens 25 % erreichten. Die Prädiktortrefferquote lag jeweils unter 20 %, was aber auch auf die insgesamt geringe Anzahl an Kindern mit späteren Lese-Rechtschreibschwierigkeiten zurückzuführen ist. Jedoch konnte auch die Sensitivität mit Werten von höchstens 33 % nicht überzeugen. Dennoch zeigten sich in einzelnen Differenzierungsleistungen Gruppenunterschiede zwischen schwachen und unbeeinträchtigten Lesern im retrospektiven Vergleich. Für das Bielefelder Screening liegen aus der Evaluationsstudie von Jansen et al. (1999) gute bis sehr gute Kennwerte vor, die jedoch in unabhängigen Studien nicht repliziert werden konnten (P. Marx & Weber, 2006). Betrachtet man die Ergebnisse der Studie von P. Marx und Weber (2006) sowie einer eigenen Reanalyse der LOGIK-Studie (siehe auch Brügelmann, 2003), so scheint es kaum möglich, durch das BISC mehr als die Hälfte der späteren Problemkinder zu entdecken (Sensitivität). Auch die Wahrscheinlichkeit für spätere LeseRechtschreibschwierigkeiten dürfte bei Risikokindern eher unter 50 % liegen als darüber (Prädiktortrefferquote). Die Selektionsrate des BISC zehn Monate vor der Einschulung liegt bei 15 % (Jansen et al., 1999). Der PB-LRS arbeitet ebenfalls mit einer Selektionsrate von 15 %. Dazu wurden in einer Evaluationsstudie mit N = 450 Kindern für die beiden Testzeitpunkte zwei Cut-Off-Kriterien festgelegt: 22 richtig gelöste Aufgaben bei den Kindergarten- und 36 richtige Lösungen bei den Schulkindern. Bei einer Nachfolgeuntersuchung am Ende der 1. Klasse mit der Diagnostischen Bilderliste (DBL I; Dummer-Smoch, 1993) wurden 10 % der Kinder als rechtschreibschwach diagnostiziert. Die Sensitivität lag bei 63 %, die Spezifität bei 87 %, die Prädiktortrefferquote bei 36 %. Der RATZ-Index von 55 % erreicht ein relativ gutes Niveau (Gütekriterien berechnet auf der Basis von Barth & Gomm, 2004b, Tab. 18). Die prognostische Validität des Rundgangs durch Hörhausen wurde ebenfalls durch den klassifikatorischen Ansatz anhand der Daten von 375 Schülern und Schülerinnen überprüft (Martschinke, Kirschhock & Frank, 2002, S. 38 f). Bei einer Selektionsrate von 20 % variieren die RATZ-Indizes in Bezug auf die Kriterien Lesegeschwindigkeit, Leseverständnis und Rechtschreibung in der ersten Klasse zwischen 25 % (Lesegeschwindigkeit) und 77 % (Leseverständnis). In der zweiten Klasse liegen die Werte erwartungsgemäß niedriger (29 % bis 39 %). Die Autoren geben die Spezifität mit über 80 % an. Die Sensitivität variiert zwischen 38 % und 48 % und ist somit eher niedrig. Im günstigen Fall ergibt sich bei diesen Werten eine Prädiktor-Treffer-Quote von 63 %. Zur prognostischen Validität des HASE liegen ermutigende Befunde von Schöler (in diesem Band; Treutlein, Roos & Schöler, 2007) vor, die jedoch mit einer sehr hohen Selektionsrate von über 40 % erreicht wurden. Da die Risikokriterien erst nach Feststellung der Kriteriumsleistungen festgelegt wurden, die Ermittlung der Vorhersagegenauigkeit also an denselben Daten vorgenommen wurde wie die Festlegung der Grenzwerte, ist eine Replikation der Ergebnisse unbedingt erforderlich. Für das DESK 3-6 liegen bislang keine publizierten Angaben zur Vorhersage von LeseRechtschreibschwierigkeiten vor. Die Selektionsrate liegt bei 11 % (davon 4 % „auffällig“ und 7 % „fraglich“). Es werden auch Normen für die vier Entwicklungsbereiche und den Gesamtscore angegeben. 3.4.3 Fehlklassifikationen Selbstverständlich ist bei allen Screening-Verfahren eine gewisse – und wie die Evaluationsstudien zeigen – durchweg nicht unerhebliche Anzahl an Fehlklassifikationen nicht zu vermeiden. Diese Fehlklassifikationen und die Bedeutung der beiden Fehlerarten sollen nun etwas genauer betrachtet werden. Bei den vorherzusagenden Schriftsprachleistungen handelt es sich um kontinuierlich verteilte Variablen, die willkürlich in defizitäre und unauffällige Leistungsbereiche unterteilt werden müssen. Daher dürfte bereits unmittelbar einsichtig sein, dass es keine perfekte Vorhersage geben kann. Insbesondere Kinder im Grenzbereich zwischen defizitären und unauffälligen Kriteriumsleistungen können kaum überzufällig genau vorhergesagt werden. Setzt man beispielsweise für Rechtschreibschwierigkeiten einen Prozentrang (PR) von 15 als Grenze an, wird man ein Kind, das einen PR von 14 erreicht, kaum häufiger als „Risikokind“ klassifizieren können als ein Kind, das einen PR von 16 erreicht, schon alleine deshalb, weil jemand der einen PR von 14 in einem Rechtschreibtest hat, mit mehr als 50 % Wahrscheinlichkeit in einem vergleichbaren neuen Rechtschreibtest mindestens PR 15 erreichen würde – wenn man eine gewisse Regression zur Mitte berücksichtigt (bei einer Reliabilität der Tests von beispielsweise r = .90). An dieser Stelle soll zudem die Frage nach den möglichen Kriterien gestellt werden. Je nachdem welchen Lese- oder Rechtschreibtest bzw. welche Kombination von Tests in welchem Schuljahr als Kriterium verwendet wird, wird man bei unterschiedlichen Kindern Lese-Rechtschreibschwierigkeiten feststellen. Auch das macht deutlich, dass eine Vorhersage bei weitem nicht perfekt ausfallen kann, sondern zwangsläufig ein gewisser Anteil an Fehlklassifikationen auftreten muss. Diskussionswürdig ist, inwieweit dabei jemand als Fehlklassifikation zu betrachten ist, der als „Risikokind“ identifiziert wurde und dann beispielsweise einen PR von 16 aufweist, oder jemand, dem kein Risiko zugeschrieben wurde, der dann aber (in einem einzigen Test) einen PR von 14 aufweist. Würde man diese Fälle nicht als Fehlklassifikation werten, würde sich allerdings auch die Zufallstrefferquote erhöhen. Die Prognose von Lese-Rechtschreibschwierigkeiten muss auch deshalb schwerfallen, da ein komplexes Zusammenwirken vielfältiger individueller Faktoren und unterschiedlicher Einflüsse der Umwelt zu diesen Schwierigkeiten führt, wobei ein Screening-Verfahren nur einen Ausschnitt der Faktoren erfassen kann. Zudem erschweren die nach der Durchführung des Screenings wirkenden Einflüsse der familiären und schulischen Umwelt eine Vorhersage erheblich („unvermeidliche Unzulänglichkeiten“ von Screeningverfahren, siehe H. Marx, 1992). Je nachdem, ob die Priorität auf der Erkennung möglichst vieler Merkmalsträger oder der Vermeidung falsch positiver Ergebnisse liegt, wird die Selektionsrate bzw. das Cut-OffKriterium gewählt, also jenes Kriterium, das angibt, ab wann ein Testergebnis als auffällig oder unauffällig eingestuft wird. Sollen möglichst wenige falsch positive Testergebnisse erzielt werden (Minimierung der Gruppe b – siehe Abbildung 1 und Tabelle 1), riskiert man dafür die Nichtentdeckung von Merkmalsträgern (Vergrößerung der Gruppe c). Sollen hingegen möglichst alle Personen erkannt werden, die das Merkmal aufweisen, dann erhält dafür eine umso größere Personengruppe ein falsch positives Ergebnis. Im ersten Fall wird die Spezifität auf Kosten der Sensitivität maximiert, im zweiten Fall maximiert man die Sensitivität auf Kosten der Spezifität und des positiven prädiktiven Wertes. Vorgeschlagen wird eine Selektionsrate, die das 1,3 bis 2,5-fache der (erwarteten) Grundrate beträgt (siehe z.B. H. Marx, 1992). Beide Arten von Fehlklassifikationen (falsch positive und falsch negative) können negative Konsequenzen für die betroffenen Kinder nach sich ziehen. Wird einem Kind fälschlicherweise ein Risiko zugeschrieben, könnte sich zwar die Konsequenz der Förderung als positiv erweisen, da durch manche Präventionsmaßnahmen auch die – sowieso schon ganz guten – Startchancen unbeeinträchtigter Kinder weiter verbessert werden, jedoch könnten sich durch die Alarmierung der Eltern, Erzieherinnen und des Kindes selbst negative Konsequenzen für das Selbstbild des Kindes und mögliche Probleme im Sinne einer sich selbst erfüllenden Prophezeiung ergeben. Zudem sind unnötige Belastungen des Kindes, der Erzieherinnen und auch der Gesellschaft durch eine überflüssige Förderung in Betracht zu ziehen. Wird ein Kind dagegen fälschlicherweise nicht als „Risikokind“ erkannt, dann wird diesem Kind die eigentlich benötigte Förderung vorenthalten. Geht man davon aus, dass diese Förderung die Startchancen des Kindes für den Schriftspracherwerb verbessert hätte, bestehen in diesem Fall die negativen Konsequenzen in den verminderten Lese- und Rechtschreibleistungen mit all den damit verbundenen Nachteilen für die Schulkarriere und möglichen Sekundärproblematiken. Die meisten Screening-Verfahren präferieren eine möglichst hohe Sensitivität und wählen daher eine Selektionsrate die über der Grundrate liegt. Dieses Vorgehen ist vor allem in Hinblick auf die Konzeption eines Screenings als Grobsiebverfahren, dem eine Feindiagnostik für alle „Risikokinder“ folgen sollte, sicherlich zu empfehlen. Denn der somit in Kauf genommene hohe Anteil an falsch Positiven könnte durch die Ergebnisse der Feindiagnostik reduziert werden. Insbesondere in den – in der Praxis wohl nicht seltenen – Fällen, in denen dem auffälligen Screening-Befund keine weitere Diagnostik folgt, muss bei hoher Selektionsrate allerdings deutlich gemacht werden, dass das Risiko der „Risikokinder“ nicht überschätzt werden sollte. 3.5 Nebengütekriterien Sicherlich kann den Gruppentestverfahren (PB-LRS, MÜSC) ein Vorteil hinsichtlich der Ökonomie attestiert werden. Bei den Einzeltests sind die Verfahren mit einer kurzen Durchführungsdauer von etwa 10 Minuten (HASE, DP) ökonomischer als das BISC (etwa 25 Minuten) oder der PB-LRS (etwa 45 Minuten im Kindergarten bzw. 60 Minuten in der Schuleingangsphase). Die Akzeptanz der Verfahren bei Kindern, Eltern, Erzieherinnen und Erziehern und den Lehrkräften dürfte bei den ökonomischeren Verfahren eher höher sein. Bei den Kindern ist durch die Abwechslung verschiedener Aufgaben in der Regel gewährleistet, dass sie an der Testung recht gerne teilnehmen (Zumutbarkeit). Die spielerische Gestaltung der meisten Screenings sollte auch dafür sorgen, dass die Kinder mit Spaß dabeibleiben. Bei Eltern und Erzieherinnen und Erziehern bzw. Lehrkräften hängt die Akzeptanz insbesondere wohl davon ab, welchen Nutzen sie sich von dem Verfahren versprechen. Konkrete Hinweise auf Fördermaßnahmen (siehe unten) dürften dabei von hoher Bedeutung sein. Darüber wird vermutlich bei den Erzieherinnen und Erziehern die Integrierbarkeit in den Kindergartenalltag die Akzeptanz erhöhen (DESK 3-6) – allerdings mit gewissen Gefahren für die Objektivität aufgrund der geringeren Standardisierung. 4. Verknüpfung mit Förderung Bereits mehrfach wurde angesprochen, dass die Prognose von Lese- Rechtschreibschwierigkeiten die Prävention dieser Schwierigkeiten zum Ziel hat. In Abschnitt 3 wurde die Frage diskutiert, inwieweit durch die Screening-Verfahren überhaupt diejenigen Kinder als „Risikokinder“ identifiziert werden, bei denen ohne Förderung LeseRechtschreibschwierigkeiten auftreten würden, also die Frage der prognostischen Validität der Verfahren. Nun soll es darum gehen, ob und wie die frühzeitige Identifikation von „Risikokindern“ zu einer Prävention genutzt werden kann. Einerseits erscheint es plausibel, durch die Behebung bzw. Reduktion der Defizite in den Vorläuferfertigkeiten, die im Screening erfasst werden, die Startchancen der betroffenen Kinder für den späteren Schriftspracherwerb zu erhöhen. Andererseits stellt sich die Frage, inwieweit diese Vorläuferfertigkeiten effektiv trainierbar sind. Positiven Trainingsbefunden für den Bereich der phonologischen Bewusstheit und der Buchstabenkenntnis steht beispielsweise das Fehlen effektiver Fördermöglichkeiten für die Geschwindigkeit des Zugriffs auf das Langzeitgedächtnis und für das phonologische Arbeitsgedächtnis gegenüber. Nur sehr bedingt liefern die Screening-Verfahren konkrete Hinweise darauf, wo eine Förderung ansetzen sollte. Sie beschränken sich teilweise auf die Feststellung eines Risikos, das mit der Empfehlung einer Förderung verknüpft ist. Defizite in der phonologischen Bewusstheit, die durch den PB-LRS oder den Rundgang durch Hörhausen festgestellt werden, legen natürlich eine Förderung in diesem Bereich nahe. Der Rundgang durch Hörhausen ist dabei explizit mit dem Trainingsprogramm „Lesen Lernen mit der Hexe Susi“ (Forster & Martschinke, 2001) verknüpft. Bei Defiziten in der DP wird in ähnlicher Weise eine Förderung in dem „Wahrnehmungsbereich“ angeraten, in dem die Differenzierungsleistungen nicht ausreichend erscheinen. Dazu werden von Breuer und Weuffen (2000) auch konkrete Übungen vorgeschlagen bzw. auf weitergehende Maßnahmen verwiesen. Beim BISC wird oft von einer engen Verknüpfung mit den Würzburger Trainingsprogrammen zur phonologischen Bewusstheit und zur Buchstabe-Laut-Zuordnung („Hören, Lauschen, Lernen“, Küspert & Schneider, 2006, und „Hören, Lauschen, Lernen 2“, Plume & Schneider, 2004) ausgegangen. Diese Verknüpfung ist jedoch nur dann gegeben, wenn die im BISC ermittelten Defizite im Bereich der phonologischen Bewusstheit liegen. Beim DESK 3-6 und beim HASE ist jeweils keine direkte Verzahnung mit einer Fördermaßnahme gegeben. Die im Rahmen der Einschulungsuntersuchung in BadenWürttemberg auf den HASE folgende Feindiagnostik durch den SET-K 3-5 legt nahe, dass die sich daraus ergebende Förderung allgemein auf den sprachlichen Bereich abzielen dürfte. Will man aus dem Vorliegen eines Defizits in bestimmten Untertests eines Verfahrens einen konkreten Förderbedarf im erfassten Bereich ableiten, muss man sich generell die Frage stellen, inwieweit einzelne Untertests ausreichend zuverlässige Aussagen ermöglichen, da in der Regel auch bei guten Reliabilitätswerten für einen Gesamttest die entsprechenden Werte für die Untertests deutlich geringer ausfallen. 5. Diskussion Die bestehenden Screening-Verfahren lassen keine sicheren Prognosen zu. Daher sollte die Forderung der Autoren der meisten Screening-Verfahren Ernst genommen werden, dass ein auffälliges Screening-Ergebnis von einer umfangreicheren Diagnostik gefolgt werden muss. Zudem scheint eine Prozessdiagnostik erfolgversprechender als eine Prognose anhand eines einmal durchgeführten Verfahrens. Beim BISC ist es durch die Normierung für zwei Messzeitpunkte (10 Monate und 4 Monate vor der Einschulung) möglich, eine kombinierte Prognose zu ermitteln, wobei allerdings nicht ganz klar wird, welche praktischen Folgerungen sich aus welchen Ergebnissen ergeben. Ist nämlich ein Kind 10 Monate vor der Einschulung auffällig, sollte es ja gefördert werden, was dann allerdings die Ergebnisse des zweiten Messzeitpunktes weitgehend unbrauchbar macht. Aufgrund der prinzipiell begrenzten Vorhersagekraft von Vorschulscreenings und Schuleingangstests plädieren Amelang und Schmidt-Atzert (2006, S. 476) dafür, stärker die „Bewährung“ der Kinder in der ersten Klasse im Auge zu behalten. Dies habe den Vorteil, dass anstatt allgemeiner Leistungsanforderungen die konkret geforderten Bewährungskriterien erfassbar sind. In Bezug auf den Schriftspracherwerb ist es beispielsweise zu Beginn des Schriftspracherwerbs bereits möglich, Maße der phonologischen Bewusstheit im engeren Sinne zu erfassen, und auch erste, sich entwickelnde Lese- und Schreibkompetenzen zu erheben. Eine Vorhersage des Schulerfolgs und ein Erkennen von sich abzeichnenden Schwierigkeiten im Schriftspracherwerb sind dadurch vermutlich leichter möglich als zu Beginn des letzten Kindergartenjahres. Damit Kindern Versagens- und Überforderungserlebnisse erspart bleiben, muss in diesem Fall von Beginn an eine erhöhte Wachsamkeit der Lehrkräfte gegeben sein, und ggf. müssen zusätzliche Fördermaßnahmen im phonologischen Bereich erfolgen. Das Ende der Kindergartenzeit sollte deswegen jedoch keineswegs ungenutzt verstreichen: Mit einem Training aller Kinder in den Vorläuferfertigkeiten des Schriftspracherwerbs (universelle Prävention) lassen sich die Schuleingangsvoraussetzungen aller Kinder verbessern, ohne dass man riskiert, unerkannte „Risikokinder“ nicht zu fördern. Literatur Amelang, M. & Schmidt-Atzert, L. (2006). Psychologische Diagnostik und Intervention. Berlin: Springer. Barth, K. & Gomm, B. (2004a). Gruppentest zur Früherkennung von Lese- und Rechtschreibschwierigkeiten (PB-LRS). München: Reinhardt. Barth, K. & Gomm, B. (2004b). Teststatistik [Internet]. verfügbar unter: http://www.reinhardt-verlag.de/pdf/material01716.pdf (Datum des Abrufs: 08.10.2009). München: Reinhardt. Breuer, H. & Weuffen, Schuleingangsdiagnostik M. zur (2000). Lernschwierigkeiten Früherkennung und am Schulanfang: Frühförderung (Erweiterte Neuausgabe). Weinheim: Basel. Brügelmann, H. (2003). Vorschulische Prädiktoren des Misserfolgs beim Schriftspracherwerb in der Schule. Abschlussbericht des Projekts LOGIK-R an das MWF. Verfügbar unter http://www.agprim.uni-siegen.de/logik-r/logik%5B1%5D.03.bericht_an_mswf.11-232.pdf [Zugriff am 07.10.2009] Dummer-Smoch, L. (1993). Die Diagnostischen Bilderlisten. Siebungsverfahren zur Früherkennung von Leselernschwierigkeiten im Leselernprozess. Kiel: Veris. Forster, M. & Martschinke, S. (2001). Leichter lesen und schreiben lernen mit der Hexe Susi. Donauwörth: Auer. Jansen, H., Mannhaupt, G., Marx, H. & Skowronek, H. (1999). Bielefelder Screening zur Früherkennung von Lese-Rechtschreibschwierigkeiten (BISC). Göttingen: Hogrefe. Küspert, P. & Schneider, W. (2006). Hören, Lauschen, Lernen: Sprachspiele für Kinder im Vorschulalter; Würzburger Trainingsprogramm zur Vorbereitung auf den Erwerb der Schriftsprache (5., überarbeitete Aufl.). Göttingen: Vandenhoeck & Ruprecht. Mannhaupt, G. (1994). Deutschsprachige Studien zu Intervention bei Lese- Rechtschreibschwierigkeiten: Ein Überblick zu neueren Forschungstrends. Zeitschrift für Pädagogische Psychologie, 8, 123-138. Mannhaupt, G. (2006). Münsteraner Screening (MÜSC) zur Früherkennung von LeseRechtschreibschwierigkeiten. Hamburg: verlag für pädagogische medien. Martschinke, S., Kirschhock, E.-M., Frank, A. (2002). Der Rundgang durch Hoerhausen. Erhebungsverfahren zur phonologischen Bewusstheit. Band 1 (2. Auflage). Donauwoerth: Auer. Marx, H. (1992). Methodische und inhaltliche Argumente für und wider eine frühe Identifikation und Prädiktion von Lese-Rechtschreibschwierigkeiten. Diagnostica, 38 (3), 249-268. Marx, P. & Weber, J. (2006). Vorschulische Vorhersage von Lese- und Rechtschreibschwierigkeiten: Neue Befunde zur prognostischen Validität des Bielefelder Screenings (BISC). Zeitschrift für Pädagogische Psychologie, 20, 251-259. Plume, E. & Schneider, W. (2004). Hören, Lauschen, Lernen 2 - Sprachspiele mit Buchstaben und Lauten für Kinder im Vorschulalter. Göttingen: Vandenhoeck & Ruprecht. Schöler, H. & Brunner, M. (2007). HASE - Heidelberger Auditives Screening in der Einschulungsuntersuchung (2. erweiterte Auflage). Wertingen: Westra. Steinbrink, C., Schwanda, S., Klatte, M. & Lachmann, T. (2009, September). Sagen Wahrnehmungsleistungen zu Beginn der Schulzeit den Lese-Rechtschreiberfolg in Klasse 1 und 2 voraus? Poster präsentiert auf der 12. Fachtagung Pädagogische Psychologie in Saarbrücken. Treutlein, A., Roos, J. & Schöler, H. (2007). Zur prognostischen Validität des Heidelberger Auditiven Screenings in der Einschulungsuntersuchung HASE. Abschlussbericht des Projektes EVER. Heidelberg: Pädagogische Hochschule, Fakultät I. Online verfügbar unter http://www.ph-heidelberg.de/wp/schoeler/Datein/Abschlussbericht_EVER- HASE_Feb-2007.pdf [Zugriff am 07.10.2009]. Tröster, H., Flender, J. & Reineke, D. (2004). Dortmunder Entwicklungsscreening für den Kindergarten DESK 3-6. Göttingen: Hogrefe. Tabelle 1: Berechnung der Kennwerte zur Vorhersagegüte eines Screening-Verfahrens (siehe auch H. Marx, 1992) Kriterium betroffen nicht betroffen Gesamt a b a+b c d c+d a+c b+d a + b+ c + d auffällig („Risiko“) Prädiktor unauffällig („Kein Risiko“) Gesamt Sensitivität a / (a + c) Spezifität d / (b + d) Positiver prädiktiver Wert a / (a + b) (= Prädiktortrefferquote) Negativer prädiktiver Wert c / (c + d) Trefferquote (TQ) (a + d) / (a + b+ c + d) Maximale Trefferquote (max. TQ) 1 – |(b – c)| / (a + b + c + d) Zufallstrefferquote (ZTQ) [(a + b) * (a + c)] / (a + b+ c + d)2 + [(c + d) * (b + d)] / (a + b+ c + d)2 RATZ-Index (TQ – ZTQ) / (max. TQ – ZTQ) Abbildungsvereichnis Abbildung 1: Mögliche Resultate einer Screeninguntersuchung. Das Ergebnis des Screenings ist an der y-Achse angetragen, das Kriterium an der x-Achse. Die Flächenanteile bezeichnen a) die korrekt erkannten betroffenen Kinder, b) die falsch-positiv diagnostizierten Kinder (Fehlerart II), c) die „übersehenen“ betroffenen Kinder (= falsch negativ, Fehlerart I) und d) die korrekt erkannten nicht betroffenen Kinder. Abbildungen Abbildung 1