REI_PEU 1/2003 Titelkıpfe
Transcription
REI_PEU 1/2003 Titelkıpfe
Psychologie in Erziehung und Unterricht Inhalt / Contents Heft 1/2003 Evaluierung und Evaluationsforschung: Begriffe, Modelle und Methoden Helmut Kromrey Freie Universität Berlin Evaluating and Evaluation Research: Concepts, Models and Methods Summary: Evaluation stands for varied concepts of systematical, data-based assessments, and within those frameworks for different empirical models and methods employed. After explicating the relevant terms, evaluation models, their theoretical underpinnings, their methodological and methodical problems as well as the requirements for application are critical discussed. Keywords: Evaluation, evaluation-models, evaluation-application, evaluation-research Zusammenfassung: Evaluation ist nicht nur ein vielfältig verwendeter Begriff. Er steht auch für verschiedenartige Konzepte von systematischer, datengestützter Bewertung; und in deren Rahmen wiederum wird auf unterschiedliche empirische Modelle und Methoden zurückgegriffen. Der vorliegende Text stellt nach einer einführenden Begriffsexplikation die häufigsten Evaluationsmodelle sowie die Voraussetzungen für ihre Anwendung vor und diskutiert die dabei zu bedenkenden methodologischen und methodischen Probleme. Schlüsselbegriffe: Evaluation, Evaluationsmodelle, Evaluationsanwendung, Evaluationsforschung Psychologie in Erziehung und Unterricht, 2003, 50, 11 – 26 © Ernst Reinhardt Verlag München Basel Normierung zweier Fragebögen zur studentischen Beurteilung von Vorlesungen und Seminaren Joerg M. Diehl Justus-Liebig-Universität Giessen Student Evaluations of Lectures and Seminars: Norms for two Recently Developed Questionnaires Summary: This study aimed to provide norms for two recently developed questionnaires for student ratings of lectures and seminars. Based on 620 courses in psychology and education it was analysed to what degree the following factors may bias course evaluations and norm data: student and teacher gender, type of course content and characteristics of participants. Neither lectures nor seminars were generally rated differently by male and female students. Likewise it seemed to have no influence on students’ evaluations whether a course was held by a male or female instructor. In (only) some courses with a mixed audience non-psychology students gave other/ lower ratings than the psychology subgroup. On the other hand, type of course content emerged as an important biasing factor in student evaluations of lectures. Here, courses on methodology were rated more negative in relevance, level of difficulty, and didactic manner than were lectures on other subjects. In order to control for this factor, separate percentile ranks are presented for these two subject areas. Since methodology is almost exclusively taught in lectures such a break down was not neccessary in the norm tables given for seminars. Keywords: Course evaluation, gender differences, biasing variables, norms, course content Zusammenfassung: Ziel der Studie war eine Normierung zweier kürzlich vorgestellter Fragebögen zur Evaluation von Vorlesungen und Seminaren (mit studentischen Referaten). An den Daten von 620 Veranstaltungen aus Psychologie und Pädagogik wurde dabei untersucht, wieweit die nachfolgenden Faktoren die Veranstaltungs-Beurteilung beeinflussen und bei den Normen berücksichtigt werden müssen: Geschlecht der urteilenden und der beurteilten Person, Stoffgebiet der Vorlesung sowie fachliche Zusammensetzung der Teilnehmer. Es ergaben sich keine Hinweise, dass Lehrveranstaltungen von männlichen und weiblichen Teilnehmern durchgehend unterschiedlich beurteilt werden. Gleichermaßen unbedeutend war es auch, ob die Veranstaltung von einem Mann oder einer Frau geleitet wurde. Eine geringe Anzahl von Veranstaltungen mit gemischter Hörerschaft wurde seitens ihrer Nebenfach-Teilnehmer anders/schlechter beurteilt als von der Hauptfach-Gruppe. Als bedeutsamer Biasfaktor erwies sich dagegen das Stoffgebiet einer Vorlesung. Methodik-Veranstaltungen wurden hier hinsichtlich der Aspekte Relevanz, Schwierigkeitsniveau und Darbietung (Didaktik) deutlich schlechter eingestuft als Vorlesungen mit inhaltlichen Themen. Aus diesem Grunde weisen die für den Vorlesungs-Fragebogen mitgeteilten Normen getrennte Prozentrangwerte für die beiden Stoffgebiete auf. Bei der Normierung des Seminar-Fragebogens war eine derartige Unterteilung nicht erforderlich. Schlüsselbegriffe: Lehrevaluation, Geschlechtsunterschiede, Biasvariablen, Veranstaltungsinhalte, Normen Psychologie in Erziehung und Unterricht, 2003, 50, 27 – 42 © Ernst Reinhardt Verlag München Basel Lehrevaluation, Lehrveranstaltungszufriedenheit und Leistung Elke Heise Technische Universität Braunschweig Marcus Hasselhorn & Willi Hager Universität Göttingen Evaluation of University Teaching, Student Achievement and Satisfaction with Courses Summary: This study investigated the relation between students’ evaluation of three introductory university courses in psychology (General Psychology, Developmental Psychology, and Quantitative Methods) and their subjective learning progress as well as objective achievement (test scores). While test scores at the end of the courses were best predicted by a combination of students’ final general school achievement scores before entering university and the regularity of course attendance, personal satisfaction with the course as well as subjective learning progress appeared to depend on aspects of teaching quality. The results further indicate that students do evaluate different courses in a differentiated way. Keywords: Evaluation of university teaching, teaching effectiveness, academic achievement Zusammenfassung: Mit Hilfe des Göttinger „Fragebogen zur Beurteilung einer Lehrveranstaltung durch Studierende“ wurden drei Erstsemester-Vorlesungen des Psychologiestudiums (Allgemeine Psychologie, Entwicklungspsychologie und Quantitative Methoden) bewertet. Für die Vorhersage der drei Kriteriumsvariablen „studentische Zufriedenheit“, „subjektiver Lernerfolg“ und „Klausurleistung“ erwiesen sich jeweils unterschiedliche Prädiktoren als relevant. Während für die Zufriedenheit und den subjektiven Lernerfolg vor allem Faktoren, die von den Lehrenden abhängen, wichtig waren, wurde die Klausurleistung besser durch die Abiturdurchschnittsnote und die Regelmäßigkeit der Veranstaltungsteilnahme vorhergesagt. Weiterhin sprechen die Ergebnisse für eine differenzierte studentische Bewertung verschiedener Lehrveranstaltungen. Schlüsselbegriffe: Lehrevaluation, Studienzufriedenheit, Hochschullehre, Studienleistungen Psychologie in Erziehung und Unterricht, 2003, 50, 43 – 57 © Ernst Reinhardt Verlag München Basel Erste Prüfungen – weiterer Studienerfolg* Hermann Brandstätter, Alois Farthofer Universität Linz First Exams – Further Academic Achievement Summary: In a sample of university students in Austria (University of Linz), the validity of school grades in the major school subjects, and of test scores specific for the intended university subjects (both assessed in the last semester at Gymnasium), was compared to that of grades in the first year at university to predict later study success or discontinuation of university training, respectively. As expected, school grades as scored by the teachers were better predictors of later study success than were the test scores, and university grades achieved in the second semester, but not those of the first semester, exceeded the school grades in predictive power. If university training would be freely accessible for all students who successfully finished secondary school, as some politicians suggest, the combined scores of the first and second semester at university would be a sufficiently valid selection criterion for continuation of university training. Keywords: Selection of university students, predicting academic achievement, Cox-regression, signal detection model, career counseling Zusammenfassung: Im Vergleich zu Prognosen, die mit den vor Studienbeginn erhobenen studienfeldspezifischen kognitiven Testleistungen (SFT) und den Noten in den Schulhauptfächern möglich sind, wurde mit Daten von oberösterreichischen Maturanten (nachher Studierenden der Universität Linz) geprüft, wie genau sich der Studienerfolg (Notendurchschnitt, Studienabbruch und Studienabschluss) ab drittem Semester aufgrund des Notendurchschnitts der ersten beiden Semester vorhersagen lässt. Es zeigte sich erwartungsgemäß, dass die prognostische Validität des SFT geringer war als die der Schul-, Erst- und Zweitsemesterleistungen und dass nur die prognostische Validität des Zweitsemester-Notendurchschnitts, nicht die des Notendurchschnitts des ersten Semesters, höher war als die Validität des Notendurchschnitts der Hauptfächer des letzten Schuljahres. Wenn bei zunächst völlig freiem Zugang zu den Universitäten das Weiterstudium an das Bestehen von Prüfungen des ersten Studienjahres gebunden würde, wäre der Notendurchschnitt der ersten beiden Semester ein hinreichend valides Auswahlkriterium. Schlüsselbegriffe: Selektion an Universitäten, Prognose des Studienerfolgs, Cox-Regression, Signalentdeckungsmodell, Studienberatung Psychologie in Erziehung und Unterricht, 2003, 50, 58 – 70 © Ernst Reinhardt Verlag München Basel Lässt sich die Lehrqualität durch Evaluation und Beratung verbessern?* Überprüfung eines Evaluations-Beratungs-Modells Heiner Rindermann Jürgen Kohler Universität Magdeburg Hochschule für Heilpädagogik Zürich Does Evaluation and Consulting Improve Quality of Instruction? Test of an Evaluation-Consulting-Model Summary: One important aim of the evaluation of instruction is the improvement of instruction. International as well as German studies, however, have provided little evidence that student evaluation of instruction alone would change the quality of teaching. It appears that mere feedback of evaluation results is not effective. The present study aimed at improving the effects of evaluation by combining evaluation feedback with intensive personal consultation of the teachers by experts. The study was conducted in a private school for logopedia (speech therapy) with 16 teachers in 35 classes with about 20 students per class. Evaluation was conducted twice (pre- and post intervention) within a period of six months using a standardized set of questionnaires (HILVE-II) developed for evaluation of university courses. The overall intervention effect on teaching quality as measured by d (effect size for dependent means) was more than half a standard deviation in most scales. Quality of teaching in the school not only improved quantitatively (measured in the scales) and qualitatively (verbal student evaluations) but also became more homogeneous in quality (reduction of standard deviation) although the relative rank order of teachers did not change appreciably. Keywords: Student evaluation of instruction, consultation, quality of instruction, improvement of instruction, effect size d for dependent means Zusammenfassung: Ein wichtiges Ziel der Lehrevaluation ist die Verbesserung der Lehre. In den meisten internationalen und deutschen Studien ließ sich ein Veränderungseffekt auf Grund von Lehrveranstaltungsevaluation aber nicht nachweisen. Reine Feedbackansätze zur Modifikation von Lehrerhandeln genügen nicht. In einer Studie an einem privaten Ausbildungsinstitut für Logopädie (N = 16 Dozenten in 35 Kursen mit jeweils etwa 20 Schülern) wurde deshalb ein BeratungsRückmelde-Verfahren entwickelt und seine Effektivität überprüft. Evaluationen wurden mittels des HILVE-II zweimal mit anschließender Beratung innerhalb von sechs Monaten durchgeführt. Es zeigten sich Verbesserungseffekte größer als eine halbe Standardabweichung (d für abhängige Stichproben) im studentischen Urteil. Verbesserte Lehrqualität war nicht nur quantitativ bestimmbar, sondern ließ sich auch qualitativ den studentischen Kommentaren entnehmen. Zudem wurden die Einschätzungen homogener, d. h. Lehrende erreichten ein einheitliches günstiges Niveau, auch wenn die relativen Positionen im studentischen Urteil weitgehend stabil blieben. Schlüsselbegriffe: Lehrevaluation, Beratung, Lehrqualität, Verbesserung der Lehre, Effektgröße d bei abhängigen Stichproben Psychologie in Erziehung und Unterricht, 2003, 50, 71 – 85 © Ernst Reinhardt Verlag München Basel Evaluation des Modellversuchsprogramms „Qualitätsverbesserung in Schulen und Schulsystemen (QuiSS)“ Michael Jäger, Maike Reese, Manfred Prenzel, Barbara Drechsel Leibniz-Institut für die Pädagogik der Naturwissenschaften, Kiel Evaluating the School-Improvement Programme “Quality Improvement in Schools and School Systems (QuiSS)” Summary: While criteria and methods for evaluating specific school improvement projects are relatively well established, little experience exists with respect to an overarching evaluation of a broad range of diverse school improvement projects. In 1999, the German Federal and State Commission of Educational Planning (BLK – Bund-Länder-Kommission für Bildungsplanung und Forschungsförderung) launched such a large program, QuiSS (Quality Improvement in Schools and School Systems) that included 15 state-based projects with 140 schools. The paper describes the organization of this program and delineates the conception, coordination, and administration of a formative and summative evaluation process that considers general program dimensions as well as project-specific aspects. The evaluation uses multiple perspectives from the stakeholders (students, parents, teachers, headmasters, school administration, project management). Teacher professionalization, as one of the general evaluation dimensions, is presented as an example in more detail. Keywords: Program evaluation, school improvement, school quality, teacher professionalization Zusammenfassung: Während Kriterien und Methoden zur Evaluation gut definierter und abgegrenzter Schulentwicklungsprojekte mittlerweile weitgehend bekannt sind, gibt es nur wenig Erfahrung zur Evaluation von Modellversuchsprogrammen, die aus thematisch und organisatorisch heterogenen Projekten zusammengesetzt sind. Die BLK (Bund-Länder-Kommission für Bildungsplanung und Forschungsförderung) startete 1999 ein solches Modellversuchsprogramm (QuiSS – Qualitätsverbesserung in Schulen und Schulsystemen), das sich aus 15 in ihrer Zielsetzung und Organisation unterschiedlichen Länderprojekten mit insgesamt 140 beteiligten Schulen zusammensetzt. Der Beitrag beschreibt neben der Organisation des Programms die Konzeption und Durchführung einer formativen und summativen Programmevaluation, die sowohl auf die generellen Ziele des Programms wie auch auf die spezifischen Ziele der Länderprojekte und Schulen eingeht. Die Evaluation berücksichtigt dabei die Perspektiven möglichst aller Beteiligten und Betroffenen (Schülerinnen und Schüler, Eltern, Lehrkräfte, Schulleitungen, Schulaufsicht sowie Projektleitungen). Die Professionalisierung der Lehrkräfte als eines der Programmziele wird detaillierter dargestellt. Schlüsselbegriffe: Programmevaluation, Schulentwicklung, Schulqualität, Professionalisierung von Lehrkräften Psychologie in Erziehung und Unterricht, 2003, 50, 86 – 97 © Ernst Reinhardt Verlag München Basel Manifest zur Bildung anlässlich des Kongresses McKinsey bildet (5./6. September 2002, Berlin) Jürgen Kluge, McKinsey & Company, Düsseldorf McKinsey Manifest on Education Psychologie in Erziehung und Unterricht, 2003, 50, 98 – 104 © Ernst Reinhardt Verlag München Basel