Psychologie in Erziehung und Unterricht
3
0342-183X
Ernst Reinhardt Verlag, GmbH & Co. KG München
71
2013
603
Einfluss der Klassenkomposition auf die Leistungsentwicklung in Haupt- und Realschulen in Baden-Württemberg
71
2013
Hanna Dumont
Marko Neumann
Gabriel Nagy
Michael Becker
Norman Rose
Basierend auf einer Schülerstichprobe von N = 1892 Schülerinnen und Schülern aus Haupt- und Realschulen in Baden-Württemberg berichtet der vorliegende Beitrag den Einfluss verschiedener Merkmale der Schülerzusammensetzung (leistungs- und fähigkeitsbezogene, soziale und migrationsbezogene Zusammensetzung der Schulklasse) auf die Leistungsentwicklung in Mathematik und im Leseverständnis zwischen der 5. und 6. Jahrgangsstufe. Nach Kontrolle der individuellen Eingangsvoraussetzungen und der besuchten Schulform waren für keines der betrachteten Kompositionsmerkmale statistisch signifikante Effekte feststellbar. Allerdings zeigte sich im Leseverständnis bei gleichen Eingangsmerkmalen der Schülerinnen und Schüler ein Effekt der besuchten Schulform zugunsten der Realschule, der jedoch bei Hinzunahme der Kompositionsmerkmale nicht mehr signifikant war.
3_060_2013_003_0198
n Empirische Arbeit Psychologie in Erziehung und Unterricht, 2013, 60, 198 -213 DOI 10.2378/ peu2013.art16d © Ernst Reinhardt Verlag München Basel Einfluss der Klassenkomposition auf die Leistungsentwicklung in Haupt- und Realschulen in Baden-Württemberg Hanna Dumont 1 , Marko Neumann 1 , Gabriel Nagy 2 , Michael Becker 1 , Norman Rose 3 , Ulrich Trautwein 3 1 Universität Potsdam 2 Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik (IPN) an der Universität Kiel 3 Universität Tübingen Class Composition Effects in Non-Academic Lower Secondary School Tracks in the State of Baden-Württemberg Summary: The study investigates the effects of classroom composition (average ability, achievement, and socio-economic background, proportion of immigrant students) on the development in mathematics achievement, and reading literacy from grade 5 to 6. The study draws on a sample of N = 1892 students in vocational track schools (Hauptschule) and intermediate track schools (Realschule) in Baden-Wuerttemberg, Germany. After controlling for school type, and between-school differences in student intake characteristics, none of the compositional characteristics showed a statistically significant effect on achievement development. School track was associated with the development of reading literacy even after controlling for individual differences; however, this relationship lost its statistical significance after the composition of the student body was additionally taken into account. Keywords: Academic achievement, tracking, reading comprehension, mathematics, composition effects Zusammenfassung: Basierend auf einer Schülerstichprobe von N = 1892 Schülerinnen und Schülern aus Haupt- und Realschulen in Baden-Württemberg berichtet der vorliegende Beitrag den Einfluss verschiedener Merkmale der Schülerzusammensetzung (leistungs- und fähigkeitsbezogene, soziale und migrationsbezogene Zusammensetzung der Schulklasse) auf die Leistungsentwicklung in Mathematik und im Leseverständnis zwischen der 5. und 6. Jahrgangsstufe. Nach Kontrolle der individuellen Eingangsvoraussetzungen und der besuchten Schulform waren für keines der betrachteten Kompositionsmerkmale statistisch signifikante Effekte feststellbar. Allerdings zeigte sich im Leseverständnis bei gleichen Eingangsmerkmalen der Schülerinnen und Schüler ein Effekt der besuchten Schulform zugunsten der Realschule, der jedoch bei Hinzunahme der Kompositionsmerkmale nicht mehr signifikant war. Schlüsselbegriffe: Leistungsentwicklung, gegliedertes Schulsystem, Lesen, Mathematik, Kompositionseffekte Die Frage, inwieweit der Besuch einer bestimmten Schulform im gegliederten Schulsystem der Sekundarstufe I mit unterschiedlichen Leistungsentwicklungen verbunden ist, ist seit langem Gegenstand des öffentlichen und wissenschaftlichen Diskurses. Ausgelöst durch die Beobachtung von sogenannten Schereneffekten, d. h. Unterschieden in den Wissenszuwächsen von Schülerinnen und Schülern un- Autorenhinweis: Die Datenerhebung der Studie TRAIN wurde durch Zuwendungen der Länder Baden-Württemberg (Ministerium für Kultus, Jugend und Sport) und Sachsen (Staatsministerium für Kultus und Sport), der Robert- Bosch-Stiftung und der Hertie-Stiftung sowie der Universität Tübingen ermöglicht. Hanna Dumont ist Absolventin des vom Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg finanzierten Promotionskollegs Empirische Bildungsforschung. Keiner der Mittelgeber nahm zu irgendeinem Zeitpunkt Einfluss auf die Datenauswertung und Ergebnisdarstellung. Zur Bedeutung der Klassenkomposition in Haupt- und Realschulen 199 terschiedlicher Schulformen (Baumert, Trautwein & Artelt, 2003; Becker, Lüdtke, Trautwein & Baumert, 2006; Pfost, Karing, Lorenz & Artelt, 2010) und der damit einhergehenden Hinweise auf strukturelle Benachteiligungen von Schülerinnen und Schülern an niedrigeren Schulformen, wird die Bedeutung der Schulstruktur in Deutschland in jüngerer Zeit wieder verstärkt diskutiert. Insbesondere Hauptschulen sind in den letzten Jahren als sogenannte Problem- oder Brennpunktschulen verstärkt in die Kritik geraten (Trautwein, Baumert & Maaz, 2007) - nicht zuletzt deswegen, weil davon ausgegangen wird, dass die negativ ausgelesene Schülerschaft von Hauptschulen ungünstige Lern- und Entwicklungsbedingungen für Schülerinnen und Schüler schafft. In der Tat scheint die Hauptschule am stärksten durch eine „negative“ Komposition der Schülerschaft beeinträchtigt zu sein, während sich auf der anderen Seite das Gymnasium als relativ resistent gegenüber Veränderungen in der Schülerzusammensetzung erweist (Baumert, Stanat & Watermann, 2006). Darüber hinaus sind viele Hauptschulen von einer Kumulation ungünstiger Kompositionsmerkmale (niedriges Leistungs- und Fähigkeitsniveau, Konzentration von Schülerinnen und Schülern aus bildungsfernen Familien mit sozialen und privaten Belastungen, hoher Anteil von Wiederholern) betroffen. Wie Baumert et al. (2006) zeigen konnten, ist dies insbesondere in Regionen der Fall, in denen nur ein geringer Prozentsatz der Schülerinnen und Schüler die Hauptschule besucht, wie etwa in Bundesländern, in denen es neben den traditionellen drei Schulformen weitere Schulformen wie die Gesamtschule gibt. In einigen Bundesländern, in denen die Hauptschule nur noch als „Restschule“ für einen kleinen Anteil der Schülerschaft bestand hatte, wurde sie inzwischen abgeschafft und es wurde auf ein zweigliedriges System bestehend aus Gymnasium und einer nichtgymnasialen Schulform (z. B. Berlin: Integrierte Sekundarschule, Bremen: Oberschule, Hamburg: Stadtteilschule) umgestellt. Einige Bundesländer mit nach wie vor vergleichsweise großen Hauptschüleranteilen halten bislang an der Grundidee der Hauptschule fest, zum Teil mit einigen schulorganisatorischen Modifikationen (z. B. Haupt-/ Mittelschule in Bayern). Die Frage stellt sich daher, ob auch in Bundesländern, in denen noch ein größerer Anteil der Schülerschaft auf die Hauptschule wechselt, von ungünstigen Auswirkungen der Schülerkompositionen an der Hauptschule auszugehen ist. An dieser Stelle setzt der vorliegende Beitrag an, indem er die Bedeutung der Klassenkomposition für die Leistungsentwicklung von Schülerinnen und Schülern in den Jahrgangsstufen 5 und 6 in Haupt- und Realschulen in Baden-Württemberg in Schülerjahrgängen untersucht, in denen die Hauptschule noch eine wichtige Säule des Schulsystems darstellte. Theoretischer Hintergrund Leistungshomogenisierung und Kompositionseffekte Der Trennung von Schülerinnen und Schülern auf verschiedene Schulformen in Abhängigkeit ihrer Schulleistungen liegt die Annahme zugrunde, dass Schülerinnen und Schüler in leistungshomogenen Lerngruppen besser gefördert werden können als in leistungsheterogenen Lerngruppen. Dies führt jedoch nicht nur - wie intendiert - in Hinblick auf die Leistungen, sondern auch bezogen auf die soziale Herkunft zu sehr unterschiedlich zusammengesetzten Schülerschaften an den verschiedenen Schulformen (Baumert et al., 2006). Während sich am Gymnasium häufiger Schülerinnen und Schüler aus höheren sozialen Schichten befinden, wird insbesondere die Hauptschule von Schülerinnen und Schülern aus sozial schwachen und bildungsfernen Familien besucht. In diesem Zusammenhang wird davon ausgegangen, dass eine „Ballung“ von Schülerinnen und Schülern aus sozial schwierigen Milieus in einer Schule oder Klasse die Lern- und Leistungsentwicklung der gesamten Lerngruppe negativ beeinflussen kann. In der empirischen Bildungsforschung hat sich für den 200 Hanna Dumont et al. Einfluss der Schülerzusammensetzung der Begriff Kompositionseffekt etabliert (Rumberger & Palardy, 2005; Van Ewijk & Sleegers, 2010). Von Kompositionseffekten spricht man, wenn die auf Klassen- oder Schulebene aggregierten Merkmale von Schülerinnen und Schülern zusätzlich zu den entsprechenden Merkmalen auf Individualebene einen Einfluss auf die Lernentwicklung ausüben (Harker & Tymms, 2004). Übertragen auf zwei Schülerinnen bzw. Schüler mit gleichen individuellen Lernvoraussetzungen, die in unterschiedlich zusammengesetzten Lerngruppen beschult werden, läge ein Kompositionseffekt also beispielsweise dann vor, wenn die Schülerin bzw. der Schüler in der günstiger zusammengesetzten Lerngruppe in einem bestimmten Zeitraum mehr hinzulernt als der Schüler in der weniger günstig zusammengesetzten Lerngruppe. Als zentrale Kompositionsmerkmale, hinsichtlich derer man die Effekte einer Schülerschaft analysieren kann, nennen Baumert et al. (2006) fünf Dimensionen: die soziokulturelle Zusammensetzung, die Konzentration sozialer Risikofaktoren durch belastende Familienverhältnisse, die ethnisch-kulturelle Zusammensetzung, das Fähigkeits- und Leistungsniveau der Schülerschaft und die Konzentration lernbiografischer Belastungsfaktoren. Bezüglich der den Kompositionseffekten zugrunde liegenden Wirkmechanismen werden unter anderem Leistungs- und Verhaltensnormen in der Peergroup und der Elternschaft, innerhalb und zwischen Referenzgruppen stattfindende Vergleichsprozesse sowie die adaptive organisatorische, curriculare und didaktische Gestaltung des Unterrichts durch die Lehrkräfte aufgeführt (vgl. Baumert et al., 2006; Dreeben & Barr, 1988; Helmke & Weinert, 1997), wobei die empirische Befundlage für die Gültigkeit der vermuteten Wirkmechanismen von Kompositionseffekten nach wie vor eher dünn ausfällt (vgl. Dumont, Neumann, Maaz & Trautwein, in diesem Heft). Für die Untersuchung von lernmilieubedingten differenziellen schulischen Entwicklungsverläufen sind in gegliederten Schulsystemen neben Unterschieden in der Schülerzusammensetzung auch institutionelle Unterschiede zwischen den verschiedenen Schulformen einzubeziehen. Hierunter fallen schulorganisatorische Unterschiede in den Lehrplanvorgaben und Stundentafeln ebenso wie schulformspezifische Traditionen in der Lehrerbildung und der Unterrichtsgestaltung. In Deutschland finden sich hier die deutlichsten Unterschiede zwischen dem Gymnasium auf der einen und den nichtgymnasialen Schulformen auf der anderen Seite (vgl. Baumert et al., 2006; Kunter et al., 2011), aber auch zwischen den anderen Schulformen bestehen teilweise substanzielle Unterschiede. Um eine Überschätzung des Ausmaßes von Kompositionseinflüssen zu vermeiden, ist in dem üblicherweise zugrunde gelegten mehrebenenanalytischen Vorgehen nach Kontrolle von Unterschieden in den individuellen Eingangsvoraussetzungen (Schülerebene) auf Ebene der Lerngruppe (Schule, Klasse) somit auch für die besuchte Schulform zu kontrollieren. Empirische Forschungsbefunde zum Einfluss von Kompositionseffekten Der Großteil der Forschung zum Einfluss von Kompositionseffekten konzentriert sich auf das Fähigkeits- und Leistungsniveau der Schülerschaft sowie die soziokulturelle und ethnischkulturelle Zusammensetzung (Alegre & Ferrer, 2006; Perry & McConney, 2010; Rumberger & Palardy, 2005; Van Ewijk & Sleegers, 2010). Obwohl mittlerweile außer Zweifel steht, dass die Zusammensetzung der Schülerschaft einer Klasse oder Schule in der Tat unterschiedliche Lernbedingungen schafft, herrscht hinsichtlich der Wirkungsweise und Größe von Kompositionseffekten in der Literatur noch kein Konsens (Hattie, 2002; Thrupp, Lauder, & Robinson, 2002). Die Befunde unterscheiden sich je nachdem, welche Kriteriumsvariablen untersucht wurden, welche Altersstufe die Stichprobe hatte und welche Indikatoren für die Zusammensetzung der Schülerschaft herangezogen wurden (vgl. im Überblick Dumont et al., in diesem Heft). Zur Bedeutung der Klassenkomposition in Haupt- und Realschulen 201 Opdenakker und van Damme (2006) haben den Einfluss der Schülerzusammensetzung im gegliederten Sekundarschulwesen im flämischen Teil Belgiens untersucht. Mithilfe von Mehrebenenanalysen konnten sie für das Fach Mathematik einen über Unterschiede in den individuellen Eingangsvoraussetzungen und die besuchte Schulform hinausgehenden Effekt der auf Schulebene aggregierten Ausgangsleistungen auf die späteren Lernstände der Schülerinnen und Schüler feststellen. Ein zusätzlicher Effekt der sozialen Zusammensetzung zeigte sich nicht. Für die Schweiz berichten Ramseier und Brühwiler (2003) auf Basis der PISA-2000- Daten Effekte der sozialen und ethnisch-kulturellen Zusammensetzung der Schülerschaft. Allerdings wurden die Analysen ohne Berücksichtigung der leistungsbzw. fähigkeitsbezogenen Schülerkomposition durchgeführt, so dass offen bleibt, ob Auswirkungen der sozialen und ethnisch-kulturellen Schülerzusammensetzung auch unter Einbezug des mittleren Leistungsbzw. Fähigkeitsniveaus der Schule nachweisbar sind. Ebenfalls für die Schweiz konnten Neumann und Kollegen (2007) anhand einer längsschnittlich angelegten Untersuchung im Fach Französisch als Fremdsprache Hinweise auf die Bedeutung kompositioneller Merkmale für die Leistungsentwicklung zwischen der 7. und 8. Jahrgangsstufe erbringen. Allerdings waren die Kompositionseffekte in hohem Maße mit der besuchten Sekundarschulform konfundiert. Bei simultaner Berücksichtigung von Schulform und Merkmalen der Schülerkomposition fielen die Effekte der besuchten Schulform deutlich größer aus, als die (nur für die soziale Zusammensetzung im Kanton Wallis) verbleibenden Effekte der Merkmale der Schülerzusammensetzung, was unter Umständen als Hinweis auf die stärkere Rolle institutioneller Unterschiede zwischen den Schulformen zu werten ist. Auch auf nationaler Ebene liegt mittlerweile eine Reihe von Untersuchungen zum Einfluss der Schülerzusammensetzung auf die Leistungsentwicklung vor (Baumert et al., 2006; Bellin, 2009; Bos & Scharenberg, 2010; Ditton & Krüsken, 2006; Stanat, Schwippert & Gröhlich, 2010). Eine der ersten Analysen wurde von Köller und Baumert (2001) auf der Datengrundlage der BIJU-Studie durchgeführt. Die Autoren untersuchten die Leistungsentwicklung in Mathematik zwischen der 7. und 10. Jahrgangsstufe. Im Fokus stand die Frage, inwieweit nach Kontrolle des individuellen Vorwissens zusätzliche Effekte der besuchten Schulform und der auf Schulebene aggregierten Ausgangsleistung (als Merkmal der leistungsbezogenen Komposition) feststellbar waren. Bei simultaner Betrachtung von Schülerkomposition und besuchter Schulform zeigten sich deutliche Effekte der Schulform. Bei gleichen individuellen Ausgangsleistungen fiel der Wissenszuwachs am Gymnasium um mehr als eine halbe Standardabweichung höher aus als an der Realschule und um nahezu eine Standardabweichung höher als an der Hauptschule. Für die aggregierte Ausgangsleistung zeigte sich hingegen nur ein kleiner Effekt, „d. h. innerhalb einer Schulform gab es nur unbedeutende Unterschiede in der Leistungsentwicklung zwischen leistungsstärkeren und -schwächeren Schulen“ (Köller & Baumert, 2002, S. 770). Auch im Rahmen der Hamburger KESS- Untersuchung wurde der Frage des Einflusses der Schülerzusammensetzung auf die Mathematik- und Leseleistungen in der Sekundarstufe I nachgegangen. Dabei zeigten sich nach Kontrolle individueller Eingangsunterschiede und besuchter Schulform sowohl für die Jahrgangsstufen 5 und 6 (vgl. Gröhlich, Scharenberg & Bos, 2009) als auch für die Jahrgangsstufen 7 und 8 (hier nur für Mathematik, vgl. Bos & Scharenberg, 2010) Effekte des auf Klassenebene aggregierten Vorwissens auf die Fachleistungen. Darüber hinausgehende spezifische Effekte der sozialen Zusammensetzung waren nur für die Leseleistungen nachweisbar (Bos & Scharenberg, 2010 für Jahrgangsstufe 8; Stanat et al., 2010 für Jahrgangsstufen 5 und 6). Wie bei Köller und Baumert (2001) fanden sich deutliche Effekte der Schulform. 202 Hanna Dumont et al. Im Hinblick auf die ethnisch-kulturelle Zusammensetzung konnte in mehreren Studien gezeigt werden, dass ein hoher Anteil von Schülerinnen und Schülern mit Migrationshintergrund in Klassen bzw. Schulen zwar mit geringeren Bildungserfolgen einhergeht, dieser Effekt jedoch verschwindet, wenn für die soziale und leistungsbezogene Zusammensetzung kontrolliert wird (Bellin, 2009; Ditton & Krüsken, 2006; Stanat, 2006; Stanat et al., 2010; Walter, 2008; Walter & Stanat, 2008). Zusammenfassend kann damit festgehalten werden, dass in einer Reihe von Studien Kompositionseffekte festgestellt werden konnten. Die für Deutschland vorliegenden Befunde für die gegliederte Sekundarstufe I (vgl. auch die Ergebnisse von Neumann et al., 2007, für die Schweiz) deuten jedoch auch darauf hin, dass die Kompositionseffekte bei Berücksichtigung der Schulform deutlich niedriger ausfallen und institutionellen Unterschieden zwischen den Schulformen somit möglicherweise eine größere Bedeutung für differenzielle Leistungsentwicklungen zuzukommen scheint. Kompositions- und Institutionseffekte sind jedoch in hohem Maße miteinander konfundiert. Die vorliegende Studie Im vorliegenden Beitrag wird die Leistungsentwicklung von Schülerinnen und Schülern an Haupt- und Realschulen in Baden-Württemberg zwischen den Jahrgangsstufen 5 und 6 in den Schuljahren 2008/ 09 und 2009/ 10 untersucht. Der Fokus liegt dabei auf der Untersuchung von Effekten der Klassenkomposition auf die Leistungsentwicklung der Schülerinnen und Schüler in Mathematik und im Leseverständnis. Es wird der Frage nachgegangen, inwieweit die Zusammensetzung der Schülerschaft der Klassen in Jahrgangsstufe 5 nach Berücksichtigung individueller Eingangsvoraussetzungen der Schülerinnen und Schüler und institutioneller Effekte (durch Kontrolle der Schulform) einen zusätzlichen Einfluss auf die Leistungen von Schülerinnen und Schülern in der Jahrgangsstufe 6 ausübt. Dabei wird die leistungsbezogene, soziale und migrationsbezogene Komposition der Schülerschaft der Schulklassen fokussiert. Mit den Domänen Mathematik und Leseverständnis werden zwei Leistungsbereiche betrachtet, für die in der Sekundarstufe zum Teil von einer unterschiedlichen Relevanz schulischer Lerngelegenheiten und damit auch kontextueller Einflüsse der schulischen Lernumgebung ausgegangen wird. Während die Übung und Vertiefung der Lesefähigkeiten in stärkerem Maße auch durch die außerschulische Lern- und Sozialisationsumgebung beeinflusst wird, wird das Vermittlungsmonopol mathematischer Lerninhalte üblicherweise der Schule zugeschrieben (Köller & Baumert, 2002). Folgt man dieser Argumentation, so sollten mögliche Kompositionseffekte in Mathematik stärker ausfallen als für das Leseverständnis. Als Datenbasis dient die Studie Tradition und Innovation: Entwicklungsverläufe an Haupt- und Realschulen in Baden-Württemberg und Mittelschulen in Sachsen (TRAIN; Trautwein, Jonkmann, Wacker & Nagy, 2011). Anhand eines Vergleichs der Haupt- und Realschule des bis vor Kurzem traditionell dreigliedrigen Schulsystems Baden-Württembergs mit der Mittelschule in Sachsen untersucht die TRAIN- Studie die Leistungsentwicklung von Schülerinnen und Schülern in verschiedenen nichtgymnasialen Schulformen. Für den vorliegenden Beitrag werden jedoch nur die Daten aus Baden-Württemberg analysiert. Baden- Württemberg ist hier insofern von besonderer Bedeutung, da zu dem Untersuchungszeitpunkt nach wie vor vergleichsweise substanzielle Anteile der Schülerschaft die Hauptschule besuchten (inzwischen wurden viele Hauptschulen zu sogenannten „Werkrealschulen“ ausgebaut, an denen nach erfolgreichem Erwerb des Hauptschulabschlusses der mittlere Schulabschluss erworben werden kann) und vor diesem Hintergrund unter Umständen eine geringere Bedeutung kritischer Kompositionsmerkmale zu erwarten ist, als dies beispielsweise in Ländern mit geringem Hauptschulanteil der Fall ist (vgl. Baumert et al., 2006). Zur Bedeutung der Klassenkomposition in Haupt- und Realschulen 203 Methode Stichprobe Die Analysen der vorliegenden Untersuchung basieren auf einer Stichprobe von Schülerinnen und Schülern aus Haupt- und Realschulen in Baden- Württemberg. Die Schülerinnen und Schüler stammten aus N = 59 Hauptschulen 1 und N = 24 Realschulen, wobei pro Schule jeweils eine Schulklasse in die Untersuchung aufgenommen wurde. Die Stichprobenziehung folgte einem mehrstufigen Samplingdesign, wobei die schulformspezifischen Teilpopulationen disproportional zu den tatsächlichen Populationsanteilen gezogen wurden. Zudem erfolgte eine gezielte Berücksichtigung von Hauptschulen, die durch eine besonders „ungünstige“ Komposition der Schülerschaft gekennzeichnet sind. Auf der Basis von Bevölkerungsstrukturdaten (insbesondere zur Einkommensstruktur und dem Anteil der Haushalte mit Migrationshintergrund) wurde für jeden schulischen Einzugsbereich ein Belastungsindex gebildet. Aus diesen „problematischen Bezirken“ wurden 20 Hauptschulklassen gezogen. Dem im Vergleich zur Population überproportionalen Hauptschüleranteil sowie dem Oversampling besonders belasteter Schulklassen wurde im Rahmen der Datenauswertung durch entsprechende Gewichtung Rechnung getragen. Nach Ausschluss von Schülerinnen und Schülern, für die ein Ausschlussgrund vorlag (z. B. Schülerinnen und Schüler, die seit weniger als einem Jahr deutsch lernten), oder bei denen es sich um Neuzugänge handelte (z. B. Klassenwiederholer zum zweiten Messzeitpunkt), umfasste die Analysestichprobe insgesamt N = 1892 Schülerinnen und Schüler (46,0 % Mädchen). Darunter waren N = 1232 Hauptschülerinnen und -schüler und N = 660 Realschülerinnen und -schüler. Die Datenerhebungen fanden in den Schuljahren 2008/ 09 und 2009/ 10 jeweils ca. drei Monate nach Schuljahresbeginn statt. Instrumente Schulische Leistungstests Der Leistungstest in Mathematik orientierte sich an der Konzeption der Bildungsstandards Mathematik für den Primarbereich (Granzer, Köller & Bremerich-Vos, 2009) und die Sekundarstufe I (Blum, Drüke-Noe, Hartung & Köller, 2006). Die Testaufgaben wurden zum Großteil dem Aufgabenpool zur Überprüfung der Bildungsstandards entnommen und durch Items aus einschlägigen Schulleistungsstudien wie BIJU (Baumert et al., 1996), ELEMENT (Lehmann & Lenkeit, 2008) und TIMSS (Baumert et al., 1997) ergänzt. Die Auswahl der Testitems orientierte sich an den im Rahmen der Bildungsstandards für die Sekundarstufe I entwickelten Leitideen (Zahl, Messen, Raum und Form, Funktionen sowie Daten und Zufall). Konkret wurde jeder Leitidee eine gleiche Zahl von Items zugeordnet. Der Test umfasste in Klassenstufe 5 50 Items (jeweils 10 Items pro Leitidee) und in Klassenstufe 6 60 Items (jeweils 12 Items pro Leitidee). Die Aufgaben wurden so konstruiert, dass sie typische Unterrichtsinhalte der Jahrgangsstufen 4 und 5 (für den Test der 5. Jahrgangsstufe) sowie 4, 5 und 6 (für den Test der 6. Jahrgangsstufe) an allen Schulformen abdeckten. Zum Einsatz kamen Items mit unterschiedlichen Antwortformaten (Multiple Choice, Kurzantworten und offene Antworten). In Klasse 5 wurden Aufgaben, die den Unterrichtsstoff der Klassenstufen 4 und 5 repräsentieren, eingesetzt. In Klasse 6 wurden hingegen Aufgaben auf allen Anforderungsniveaus verwendet (Stoff der 4., 5. und 6. Klasse). Die Einschätzungen zur Eignung und Passung der Aufgaben wurden mithilfe von Ratings von Lehrplanexperten und von aktiven Lehrkräften aus Baden-Württemberg und Sachsen gewonnen. Zur Etablierung einer gemeinsamen Metrik über die Jahrgangsstufen wurde ein Common- Item-Design (Kolen & Brennan, 2004) umgesetzt, wobei sich 30 Items zwischen den Wellen überlappten. Die Administration des Mathematiktests geschah auf Grundlage eines Matrix-Designs (Mislevy, Beaton, Kaplan, & Sheenhan, 1992) mit neun Testheften. Die Schülerinnen und Schüler bearbeiteten zu jedem Messzeitpunkt jeweils 30 Items. Das Matrix-Design wurde so konstruiert, dass die Schülerinnen und Schüler an den zwei Testzeitpunkten niemals die gleichen Items vorge- 1 Durch die Trennung einer Hauptschulklasse zu T2 hat sich die Anzahl der Hauptschulklassen um 1 erhöht und liegt somit bei 60 aus 59 Schulen. Als „Hauptschulklassen” werden hier auch diejenigen Schulklassen bezeichnet, die zu einer Werkrealschule gehören, an der man nach erfolgreichem Hauptschulabschluss nach dem 9. Schuljahr noch ein 10. Schuljahr absolvieren und den mittleren Bildungsabschluss erreichen kann. 204 Hanna Dumont et al. legt bekamen. Somit konnten itemspezifische Erinnerungs-, Übungs- und andere Testwiederholungseffekte ausgeschlossen werden. Die Auswertung der Mathematikleistungen geschah auf Grundlage sogenannter Plausibler Values (PVs; siehe unten), die eine gute Reliabilität in der 5. Klasse (Rel. = .85) und der 6. Klasse (Rel. = .81) aufwiesen (Reliabilitätssschätzung nach Adams, 2005). Die Erfassung des Leseverständnisses erfolgte ebenfalls in Anlehnung an die Bildungsstandards der Grundschule und der Sekundarstufe I. Entsprechend wurden zu beiden Messzeitpunkten Itemstichproben aus den Bildungsstandards für die Grundschulen (Granzer et al., 2009), dem Hamburger Lesetest (HAMLET 3 - 4; Lehmann, Peek & Poerschke, 1997), der Berliner ELEMENT- Studie (Lehmann & Lenkeit, 2008) und dem Diagnostischen Test Deutsch (DTD; Nauck & Otte, 1980) eingesetzt. Die Texte wurden so ausgewählt, dass ein möglichst breites und gleichzeitig den Jahrgangsstufen und Schulformen angemessenes Fähigkeitsspektrum des sinnverstehenden, stillen Lesens abgedeckt wurde. Die Komplexität der Verständnisfragen reichte von einfacher Informationsentnahme bis hin zu selbstständigen, schlussfolgernden Verständnisleistungen. Die Antworten wurden in unterschiedlichen Formaten erfasst, sowohl offen, halboffen als auch im Multiple- Choice-Format. Auch der Leseverstehenstest wurde mittels eines Matrix-Designs vorgegeben, sodass einzelne Schülerinnen und Schüler jeweils nur einen Teil aller Testaufgaben bearbeitet haben. Insgesamt kam eine Auswahl von neun (5. Klasse) beziehungsweise zehn Texten (6. Klasse) mit jeweils vier bis neun zugehörigen Items zum Einsatz. Jeder Schülerin und jedem Schüler wurde eines von neun Booklets vorgelegt, die für die 5. Klasse jeweils fünf Texte und für die 6. Klasse jeweils vier Texte enthielten. Entsprechend bearbeitete jede Schülerin und jeder Schüler insgesamt zwischen 31 und 33 (5. Klasse) beziehungsweise 21 und 25 Items (6. Klasse). Die längsschnittliche Verlinkung erfolgte über sechs Texte bzw. 30 Items, die zu beiden Messzeitpunkten eingesetzt wurden. Die curriculare Validität der eingesetzten Testaufgaben wurde wie in Mathematik mithilfe einer Einschätzung von Lehrplanexperten und Lehrkräften aus Baden-Württemberg und Sachsen überprüft. Ebenso wie im Fall der Mathematikleistungen geschah die Auswertung des Leseverständnistests auf der Basis von PV-Werten, wobei die Reliabilität der PVs gut ausfiel (Rel. = .86 in Klasse 5 und Rel. = .83 in Klasse 6). Kognitive Grundfähigkeiten Zur Erfassung der kognitiven Grundfähigkeiten wurde der kognitive Fähigkeitstest KFT 4 - 12 + R (Heller & Perleth, 2000) eingesetzt. Aus ökonomischen Gründen wurden in der TRAIN-Studie spezifische Subtests aus den drei Fähigkeitsdomänen des KFT ausgewählt. Im verbalen Teil kam die Skala Wortanalogien zum Einsatz, im quantitativen Teil die Skala Zahlenreihen und im nonverbalen Teil die Skala Figurenanalogien. Die Reliabilitäten der drei Skalen waren für Wortanalogien mit a = .66 bis .77, für Zahlenreihen mit a = .85 bis .90 und für Figurenanalogien mit a = .89 bis .92 ausreichend bis sehr hoch. Die drei KFT-Subtests wurden IRT-skaliert und für die vorliegenden Analysen zu einem Gesamtwert gemittelt und anschließend z-standardisiert. Familiärer Hintergrund Der Bildungshintergrund der Eltern wurde im Elternfragebogen über den schulischen bzw. allgemeinbildenden Abschluss getrennt für Mutter und Vater erhoben. In die Analysen ging jeweils der höhere Abschluss ein. Dabei wurden die Informationen zum Bildungshintergrund der Eltern in drei Kategorien zusammengefasst: (1) Kein Schulabschluss oder Hauptschulabschluss, (2) Realschulabschluss, (3) Fachabitur oder Abitur. In den Analysen diente der Realschulabschluss als Referenzkategorie. Die berufliche Stellung der Eltern wurde anhand des International Socio-Economic Index of Occupational Status (ISEI; Ganzeboom, De Graaf, Treiman, & De Leeuw, 1992) erfasst, der in erster Linie auf Elternangaben zum ausgeübten Beruf beruhte, die bei fehlenden Angaben durch Schülerangaben ergänzt wurden. Je höher der ISEI-Wert einer Person, desto höher ihre berufliche Stellung. In den Fällen, wo sowohl Informationen hinsichtlich des Berufs der Mutter als auch des Vaters vorlagen, wurde der jeweils höhere Wert genommen. Für die Analysen wurde der ISEI-Wert z-standardisiert. Als Indikator für den Besitz von Kulturgütern wurde die Anzahl der im Haushalt vorhandenen Bücher herangezogen. Die Variable wurde im Schülerfragebogen über sieben Ausprägungen erfasst: (1) bis 10 Bücher, (2) 11 - 25 Bücher, (3) 26 - 100 Bücher, (4) 101 - 200 Bücher, (5) 201 - 250 Bücher, Zur Bedeutung der Klassenkomposition in Haupt- und Realschulen 205 (6) 251 - 500 Bücher, (7) über 500 Bücher und ging als z-standardisierte Variable in die Analysen ein. Der Migrationshintergrund der Schülerinnen und Schüler wurde im Schüler- und Elternfragebogen über die Frage nach dem Geburtsland des Kindes, der Mutter und des Vaters erfasst. Die Kategorie Migrationshintergrund wurde vergeben, wenn mindestens ein Elternteil des Kindes im Ausland geboren wurde. Analysestrategie Um zu möglichst unverfälschten Schätzungen der Personenfähigkeiten zu gelangen und dem Multi- Matrix-Design der administrierten Leistungstests Rechnung zu tragen, wurden für die Leistungswerte in Mathematik und im Leseverständnis Plausible Values geschätzt (vgl. Wu, 2005). Plausible-Values (PVs) sind IRT-basierte Schätzungen individueller Fähigkeitsausprägungen, die neben den Itemantworten auch individuelle Hintergrundinformationen berücksichtigen (siehe Rost, 2004). PVs repräsentieren den plausiblen Wertebereich, in dem die Fähigkeit einer Person liegt. Dazu werden für jede Person mehrere, in der vorliegenden Untersuchung fünf, „plausible“ Fähigkeitsausprägungen geschätzt. Die Schätzung der PVs erfolgte jeweils getrennt für die Schulformen. Die resultierenden PVs wurden anschließend an den Testleistungen der Hauptschülerinnen und -schüler zum ersten Messzeitpunkt normiert. Dazu wurden die zum ersten Messzeitpunkt vorliegenden PVs des Mathematik- und des Leseverständnistests in der Gruppe der Hauptschülerinnen und -schüler auf eine Metrik mit einem Mittelwert von M = 50 und eine Standardabweichung von SD = 10 transformiert (T-Metrik). Um die Vergleichbarkeit der Fähigkeitsschätzungen über die Messzeitpunkte zu gewährleisten, wurde die ermittelte Transformationsvorschrift anschließend auf die Daten der Hauptschülerinnen und -schüler zum zweiten Messzeitpunkt und der Realschülerinnen und -schüler zu beiden Messzeitpunkten angewendet. Diese vorgenommene Transformation ermöglicht eine relativ einfache Interpretation von Gruppenunterschieden und Leistungszuwächsen relativ zum anfänglichen Leistungsstand der Hauptschülerinnen und -schüler. Für die Analysemodelle wurden die PVs z-standardisiert. Die Fragestellung nach Effekten der Klassenkomposition auf die Entwicklung der Mathematikleistung und der Leistung im Leseverständnis in den beiden Schulformen wurde mithilfe von Mehrebenenanalysen (Raudenbush & Bryk, 2002) mit Schülerinnen und Schülern auf Ebene 1 und mit Klassen auf Ebene 2 ausgewertet. Eine Dreiebenenmodellierung (Schülerebene, Klassenebene, Schulebene) lässt sich aufgrund des Erhebungsdesigns nicht umsetzen, da pro Schule nur eine Klasse gezogen wurde. In den Analysen wurden für jede Leistungsdomäne separate Modelle spezifiziert, in denen schrittweise Prädiktoren auf Individualebene und auf Klassenebene aufgenommen wurden. Nach der Spezifikation eines Nullmodells wurden in Modell 1 die Testleistungen der Jahrgangsstufe 6 durch individuelle Merkmale der Schülerinnen und Schüler vorhergesagt. In Modell 2 wurde zusätzlich die Schulform mit der Hauptschule als Referenzkategorie auf Ebene 2 aufgenommen, um für schulformbezogene institutionelle Unterschiede zu kontrollieren. In den Modellen 3 a bis 3 d, den für die Fragestellung zentralen Modellen, wurde das vorherige Modell durch die Aufnahme verschiedener Merkmale der Schülerkomposition auf der Klassenebene erweitert: In Modell 3 a wurde auf Ebene 2 die leistungsbezogene (Leistungsmittelwert), in Modell 3 b die fähigkeitsbezogene (mittlere kognitive Fähigkeiten), in Modell 3 c die soziale (mittlerer HISEI) und in Modell 3 d die migrationsbezogene Zusammensetzung der Klassen (prozentualer Anteil der Schülerinnen und Schüler mit Migrationshintergrund) aufgenommen. Die Bildung der Kompositionsmerkmale erfolgte durch Aggregation der entsprechenden Individualmerkmale auf der Klassenebene, wobei die Aggregation der z-standardisierten Individualwerte erfolgte; eine erneute z-Standardisierung auf Klassenebene wurde nicht vorgenommen. Der Anteil fehlender Werte auf den Analysevariablen umfasste eine Spanne von 3 Prozent für die Leistungsdaten und 34 Prozent für die Angaben zum elterlichen Schulabschluss. Die fehlenden Werte wurden mit der multiplen Imputationstechnik (MI, vgl. Lüdtke, Robitzsch, Trautwein & Köller, 2007) des Programm-Pakets Mplus (Version 6.1, Muthén & Muthén, 1998 - 2010) ersetzt. Die Imputation wurde weitgehend vergleichbar zur Schätzung der PVs durchgeführt. Es wurden die gleichen Hintergrundinformationen berücksichtigt und die Imputationen wurden getrennt für die Schulformen durchgeführt. Die Auswertungen basieren auf fünf imputierten Datensätzen, wobei die Ergebnisse gemäß der Formel von Rubin (1987) integriert wurden, die auch im Programmpaket Mplus implementiert ist. 206 Hanna Dumont et al. Ergebnisse Deskriptive Befunde Tabelle 1 gibt zunächst einen Überblick über die in den Jahrgangsstufen 5 und 6 erreichten Lernstände und die zwischen beiden Messzeitpunkten erzielten Leistungszuwächse. In erwartbarer Weise fielen die Leistungen in Klasse 5 und 6 an den Realschulen jeweils deutlich höher aus als an den Hauptschulen. Der mittlere Leistungsvorsprung der Realschülerinnen und -schüler in den Ausgangsleistungen entspricht in Mathematik ca. 1,5 Standardabweichungen und im Leseverständnis mehr als eine Standardabweichung. In den mittleren Lernzuwächsen ließen sich hingegen nur vergleichsweise geringe Unterschiede zwischen den Schulformen ausmachen. Bezogen auf die Leistungsstreuung in der Gesamtstichprobe in Klasse 5 betrugen die Zuwächse in Mathematik d = .42 (Hauptschule) und d = .55 (Realschule) Standardabweichungen. Im Leseverständnis fiel der Zuwachs mit d = .28 (Hauptschule) bzw. d = .31 (Realschule) insgesamt niedriger aus als in Mathematik. In den Tabellen 2 und 3 finden sich die korrelativen Zusammenhänge aller auf Individual- und Klassenebene berücksichtigten Variablen. Auf Individualebene (vgl. Tab. 2) bestanden die größten Zusammenhänge zwischen den Leistungen in Klasse 6 und den Ausgangsleistungen. Mit einer Korrelation von r = .85 fielen die Stabilitäten über ein Schuljahr in Mathematik höher aus als im Leseverständnis r = .71. Auf der Klassenebene (vgl. Tab. 3) zeigten sich substanzielle Korrelationen zwischen den verschiedenen Kompositionsmerkmalen. Die stärksten Zusammenhänge fanden sich zwischen den verschiedenen Leistungsmerkmalen (mittleres Leistungsniveau Mathematik und Leseverständnis, mittleres kognitives Fähigkeitsniveau), während die Zusammenhänge dieser leistungsbezogenen Indikatoren mit den Merkmalen der sozialen und migrationsbezogenen Klassenzusammensetzung etwas niedriger ausfielen. Befunde aus Mehrebenenanalysen Um die Verteilung der Varianz in den Testleistungen in der 6. Jahrgangsstufe auf Individual- und Klassenebene zu bestimmen, wurde in einem ersten Schritt für beide Leistungsdomänen ein Nullmodell spezifiziert (vgl. Tab. 4 und 5). Dabei ergab sich für Mathematik eine Intraklassenkorrelation von ICC = .43, die besagt, dass 43 Prozent der für die Mathematikleistungen insgesamt zu beobachtenden Leistungsunterschiede auf Unterschiede zwischen den Schulklassen (wobei dieser Varianzanteil auch Leistungsunterschiede zwischen den Schulen und Schulformen enthält) und 57 Prozent auf Unterschiede zwischen den Schülerinnen und Schülern innerhalb der Schulklassen zurückzu- Klasse 5 Klasse 6 M SD M SD d 1 Mathematik Hauptschule Realschule 50.00 65.28 10.00 10.64 55.43 72.26 11.41 13.26 .42 .55 Leseverständnis Hauptschule Realschule 50.00 61.25 10.00 9.72 53.13 64.72 11.06 12.40 .28 .31 Tab. 1: Lernstände und Leistungszuwächse zwischen Jahrgangsstufe 5 und 6 in Mathematik und Leseverständnis nach Schulform Anmerkungen: 1 Die Standardisierung der Leistungszuwächse erfolgte an der Standardabweichung der Testleistungen in der Gesamtstichprobe (Hauptschule + Realschule) in Klasse 5 (Mathematik SD = 12,84; Leseverständnis SD = 11,32). Zur Bedeutung der Klassenkomposition in Haupt- und Realschulen 207 führen sind. Für das Leseverständnis resultierte eine ICC von .27. Der auf Leistungsunterschiede zwischen den Schulklassen zurückzuführende Anteil an der Gesamtvarianz fiel im Leseverständnis somit niedriger aus als in Mathematik. In Modell 1 wurden zur Vorhersage der Mathematik- und Leseverständnisleistungen in Klasse 6 die Individualmerkmale der Schülerinnen und Schüler aufgenommen (vgl. Tab. 4 und 5). Die stärksten Effekte zeigten sich wie erwartet für die Ausgangsleistungen in Klasse 5. Ein um eine Standardabweichung höheres Vorwissensniveau führte bei Kontrolle aller anderen Prädiktoren in Klasse 6 zu einem Leistungsvorsprung von 10,15 (Mathematik) bzw. 8,94 (Leseverständnis) Punkten. Zusätzliche statistisch signifikante Effekte für den Wissenszuwachs fanden sich für die kognitiven Grundfähigkeiten und im Leseverständnis auch für das Geschlecht, wobei der Effekt zugunsten der Mädchen ausfiel. Hinweise auf zusätzlich wirkende Effekte der familiären Herkunft auf den Lernzuwachs fanden sich nicht. Die individuellen Schülermerkmale erklärten in Mathematik 65,6 Prozent und im Leseverständnis 46,4 Prozent der Varianz innerhalb der Schulklassen. Gleichzeitig führten die Individualmerkmale aber auch zu einem deutlichen Rückgang der Varianz zwischen den Schulklassen, der in Mathematik 86,2 Prozent und im Leseverständnis 82,6 Prozent betrug. Im Modell 2 wurde auf der Klassenebene die besuchte Schulform aufgenommen. Für das Leseverständnis zeigte sich ein statistisch signifikanter Effekt. Bei gleichen Eingangsvoraussetzungen lernten Schülerinnen und Schüler an Realschulen zwischen der 5. und 6. Jahrgangsstufe 2,5 Punkte und damit - bezogen auf die Leistungsstreuung in Klasse 5 in der Gesamt- Variablen 1 2 3 4 5 6 7 8 9 10 11 1 Realschule 2 Leistung Mathematik Jg. 5 3 Leistung Mathematik Jg. 6 4 Leistung Leseverständnis Jg. 5 5 Leistung Leseverständnis Jg. 6 6 Geschlecht (1 = w) 7 Kognitive Grundfähigkeiten 8 Bildungshintergr.: Hauptschulabschl. 9 Bildungshintergr.: Abitur 10 HISEI 11 Bücher im Haushalt 12 Migrationshintergrund .59 .56 .49 .44 .01 .46 -.28 .18 .25 .27 -.32 .85 .59 .53 -.21 .65 -.22 .12 .17 .24 -.23 .57 .52 -.17 .66 -.21 .14 .18 .26 -.24 .71 .07 .55 -.21 .16 .19 .28 -.28 .15 .49 -.16 .13 .15 .25 -.25 .05 .00 -.04 .01 -.02 -.05 -.14 .10 .15 .17 -.18 -.42 -.33 -.37 .23 .39 .36 -.12 .34 -.34 -.34 Tab. 2: Korrelationen zwischen Schulform und Prädiktoren auf Individualebene Anmerkungen: Signifikante Korrelationen sind kursiv. Variablen 1 2 3 4 5 1 Dummy: Realschule 2 Mittelwert Leistung Mathematik Jg. 5 3 Mittelwert Leistung Leseverständnis Jg. 5 4 Mittelwert KFT 5 Mittelwert HISEI 6 Prozent Migrationshintergrund .87 .85 .85 .65 -.69 .90 .90 .64 -.71 .85 .61 -.68 .63 -.67 -.68 Tab. 3: Korrelationen zwischen Schulform und Prädiktoren auf Klassenebene Anmerkungen: Signifikante Korrelationen sind kursiv. 208 Hanna Dumont et al. Nullmodell Modell 1 Modell 2 Modell 3 a Modell 3 b Modell 3 c Modell 3 d B SE B SE B SE B SE B SE B SE B SE Intercept 59.69 1.09 64.91 0.89 64.09 1.09 64.95 1.25 65.13 1.27 64.98 1.11 64.94 1.95 Ebene 1 Ausgangsleistung Jahrgangsstufe 5 1 10.15 0.73 10.03 0.78 9.99 0.81 10.02 0.78 10.02 0.78 10.02 0.79 Geschlecht (1 = weiblich) -0.73 0.76 -0.79 0.75 -0.80 0.75 -0.79 0.75 -0.80 0.75 -0.79 0.75 Kognitive Grundfähigkeiten 1 2.52 0.55 2.50 0.53 2.50 0.54 2.47 0.53 2.50 0.53 2.50 0.53 Bildungshintergrund: max. Hauptschule 2 -0.18 0.73 -0.14 0.73 -0.13 0.74 -0.14 0.73 -0.11 0.73 -0.13 0.73 Bildungshintergrund: Abitur 2 0.37 0.86 0.36 0.86 0.37 0.85 0.36 0.86 0.36 0.85 0.36 0.86 HISEI 1 -0.16 0.33 -0.18 0.32 -0.18 0.32 -0.18 0.32 -0.22 0.32 -0.18 0.32 Bücher im Haushalt 1 0.28 0.31 0.27 0.31 0.27 0.31 0.27 0.31 0.26 0.31 0.26 0.31 Migrationshintergrund (1 = mind. ein Elternteil im Ausland geboren) -0.90 0.79 -0.83 0.79 -0.83 0.80 -0.83 0.79 -0.80 0.80 -0.80 0.84 Ebene 2 Realschule (Ref. Hauptschule) 2.52 1.57 1.09 1.98 0.67 1.87 0.83 1.58 1.99 1.61 Mittelwert Matheleistung 1.78 1.70 Mittelwert KFT 1.98 1.51 Mittelwert HISEI 3.05 1.74 Prozent Migrationshintergrund -1.68 3.80 Varianzkomponenten Ebene 1 121.43 41.80 41.78 41.78 41.78 41.76 41.78 Ebene 2 92.40 12.74 11.46 11.22 11.16 10.55 11.24 Erklärte Varianz auf Ebene 1 65,6 % 65,6 % 65,6 % 65,6 % 65,6 % 65,6 % Erklärte Varianz auf Ebene 2 86,2 % 87,6 % 87,9 % 87,9 % 88,6 % 87,9 % Tab. 4: Vorhersage der Testleistung in Mathematik in Jahrgangsstufe 6 durch individuelle Schülermerkmale, Schulform und Merkmale der Schülerkomposition (Befunde aus Mehrebenenanalysen) Anmerkungen: B = unstandardisierter Koeffizient. Signifikante Effekte (p < .05) sind kursiv. 1 Die Variable wurde z-standardisiert. 2 Referenzgruppe: Mittlerer Schulabschluss. Zur Bedeutung der Klassenkomposition in Haupt- und Realschulen 209 Nullmodell Modell 1 Modell 2 Modell 3 a Modell 3 b Modell 3 c Modell 3 d B SE B SE B SE B SE B SE B SE B SE Intercept 56.24 0.78 59.68 0.62 58.73 0.76 58.58 1.34 58.86 0.95 59.19 0.84 58.40 1.29 Ebene 1 Ausgangsleistung Jahrgangsstufe 5 1 8.94 0.46 8.80 0.47 8.81 0.47 8.80 0.47 8.79 0.47 8.80 0.47 Geschlecht (1 = weiblich) 2.61 0.63 2.63 0.64 2.62 0.63 2.63 0.64 2.62 0.63 2.62 0.63 Kognitive Grundfähigkeiten 1 1.50 0.31 1.39 0.30 1.39 0.30 1.38 0.30 1.39 0.31 1.39 0.30 Bildungshintergrund: max. Hauptschule 2 0.34 0.51 0.43 0.51 0.42 0.52 0.43 0.51 0.46 0.51 0.42 0.51 Bildungshintergrund: Abitur 2 0.29 0.61 0.28 0.61 0.27 0.61 0.28 0.61 0.28 0.61 0.27 0.61 HISEI 1 -0.28 0.37 -0.30 0.37 -0.30 0.37 -0.30 0.37 -0.35 0.39 -0.30 0.37 Bücher im Haushalt 1 0.52 0.34 0.50 0.34 0.50 0.34 0.50 0.34 0.49 0.34 0.50 0.34 Migrationshintergrund (1 = mind. ein Elternteil im Ausland geboren) -0.45 0.75 -0.31 0.76 -0.32 0.75 -0.31 0.76 -0.29 0.75 -0.34 0.76 Ebene 2 Realschule (Ref. Hauptschule) 2.45 0.82 2.66 1.65 2.22 1.38 1.58 1.01 2.66 1.04 Mittelwert Leseleistung -0.24 1.51 Mittelwert KFT 0.26 1.26 Mittelwert HISEI 1.62 1.20 Prozent Migrationshintergrund 0.68 2.14 Varianzkomponenten Ebene 1 118.01 63.23 63.21 63.21 63.21 63.20 63.21 Ebene 2 42.61 7.41 6.38 6.34 6.36 6.13 6.36 Erklärte Varianz auf Ebene 1 46,4 % 46,4 % 46,4 % 46,4 % 46,4 % 46,4 % Erklärte Varianz auf Ebene 2 82,6 % 85,0 % 85,1 % 85,1 % 85,6 % 85,1 % Tab. 5: Vorhersage der Testleistung im Leseverständnis in Jahrgangsstufe 6 durch individuelle Schülermerkmale, Schulform und Merkmale der Schülerkomposition (Befunde aus Mehrebenenanalysen) Anmerkungen: B = unstandardisierter Koeffizient. Signifikante Effekte (p < .05) sind kursiv. 1 Die Variable wurde z-standardisiert. 2 Referenzgruppe: Mittlerer Schulabschluss. 210 Hanna Dumont et al. stichprobe - etwa eine Fünftel Standardabweichung mehr hinzu als vergleichbare Schülerinnen und Schüler an der Hauptschule. Die auf der Klassenebene erklärte Varianz in den Leseleistungen erhöhte sich um 2,4 Prozent auf 85 Prozent. Für die Mathematikleistungen resultierte zwar ein ähnliches Regressionsgewicht der Schulform wie im Leseverständnis, allerdings verfehlte dieser Effekt das Signifikanzniveau (p = .116). In den zentralen Analysemodellen 3 a bis 3 d wurden auf der Klassenebene neben der Schulform nun die verschiedenen Kompositionsmerkmale in das Modell integriert. Dabei ließ sich für keines der betrachteten Merkmale der Schülerzusammensetzung ein statistisch signifikanter Effekt feststellen, weder in Mathematik noch im Leseverständnis. Es soll jedoch nicht unerwähnt bleiben, dass der Effekt des mittleren sozioökonomischen Status in Mathematik (B = 3.05) das 5-Prozent-Niveau nur relativ knapp verfehlte (p = .079) und sich durch Berücksichtigung dieses Kompositionsmerkmals der Anteil der aufgeklärten Varianz auf Klassenebene im Vergleich zu Modell 2 um ein Prozent auf 88,6 Prozent erhöhte. Um zu überprüfen, ob der Einfluss der betrachteten Kompositionsmerkmale möglicherweise in Abhängigkeit der besuchten Schulform (insbesondere mit Blick auf die Hauptschule) unterschiedlich ausfiel, wurden sämtliche Kompositionsmodelle auch noch einmal getrennt für beide Schulformen berechnet. Es zeigten sich jedoch keine Änderungen im Befundmuster. Darüber hinaus zeigte sich im Einklang mit bisherigen Studien, dass die Kompositionsmerkmale in hohem Maße mit der Schulform konfundiert waren. So war der Effekt der Schulform auf die Leistungsentwicklung im Leseverständnis bei Hinzunahme der Kompositionsmerkmale nicht länger statistisch signifikant. Des Weiteren konnten in zusätzlichen Analysen, in denen die Schulform nicht kontrolliert wurde, Effekte des mittleren Fähigkeits- und Leistungsniveaus sowie des mittleren sozioökonomischen Status auf die Entwicklung im Leseverständnis gefunden werden. In Mathematik war der Effekt des mittleren sozioökonomischen Status in Modellen ohne die Schulform nun auch auf dem 5-Prozent-Niveau statistisch signifikant. Es lässt sich demnach festhalten, dass Institution und Komposition stark miteinander konfundiert waren, reine Effekte der Komposition der Schülerschaft nach Kontrolle der Schulform jedoch nicht mehr gefunden werden konnten. Diskussion Im vorliegenden Beitrag wurde die Leistungsentwicklung in Mathematik und im Leseverständnis zwischen der 5. und 6. Jahrgangsstufe an der Haupt- und Realschule in Baden- Württemberg untersucht. Im Zentrum stand die Frage, ob die Zusammensetzung der Schülerschaft der Schulklasse bei gleichen individuellen Eingangsvoraussetzungen der Schülerinnen und Schüler einen zusätzlichen Einfluss auf den Lernzuwachs ausübt. Um für mögliche institutionelle Unterschiede zu kontrollieren, wurde in den Analysemodellen auch die besuchte Schulform berücksichtigt. Die Ergebnisse lassen sich wie folgt zusammenfassen: Die Unterschiede in den in Jahrgangsstufe 6 erreichten Lernständen zwischen den Schulklassen ließen sich zum überwiegenden Teil durch die individuellen Eingangsvoraussetzungen (einschließlich des Vorwissens) der Schülerinnen und Schüler erklären. Sowohl in Mathematik als auch im Leseverständnis konnten über 80 Prozent der auf Ebene der Schulklassen lokalisierten Leistungsvarianz auf Unterschiede in den individuellen Schülermerkmalen zurückgeführt werden. Für die Leseverständnisleistungen fand sich zudem ein statistisch signifikanter Effekte der Schulform. Schülerinnen und Schüler, die eine Realschule besuchten, lernten in einem Jahr etwa eine Fünftel Standardabweichung mehr hinzu als vergleichbare Schülerinnen und Schüler an der Hauptschule. Die betrachteten Merkmale der Klassenkomposition übten hingegen nach Kontrolle der Schulform kaum einen Einfluss auf die Leistungsentwicklung aus. Es zeigte sich jedoch eine hohe Konfundierung zwischen Schulform und Komposition der Schülerschaft. Zur Bedeutung der Klassenkomposition in Haupt- und Realschulen 211 Wie sind die vorstehenden Ergebnisse einzuordnen? Der Befund, wonach die besuchte Schulform einen zusätzlichen Einfluss auf den Leistungszuwachs im Leseverständnis ausübt, ist anschlussfähig an vorhandene Forschungsbefunde zu Schulformeffekten auf die Leistungsentwicklung (Köller & Baumert, 2001; Bos & Scharenberg, 2010), wenngleich sicherlich etwas überraschend ist, dass sich dieser Befund nur für das Leseverständnis, nicht jedoch für die schulnähere Leistungsdomäne Mathematik zeigte. Ursächlich hierfür könnte unter Umständen auch die vergleichsweise kleine Anzahl an Realschulklassen sein, die dem Aufdecken statistisch signifikanter Unterschiede gewisse Grenzen setzt. Auf den ersten Blick ähnlich überraschend ist das Ausbleiben von Kompositionseffekten nach Kontrolle der Schulform, insbesondere mit Blick auf die Hauptschulen, für die zum Teil von einer besonderen Sensitivität für Unterschiede in der Schülerzusammensetzung ausgegangen wird (vgl. Baumert et al., 2006). Allerdings gilt es hier zu bedenken, dass in der vorliegenden Studie mit Baden-Württemberg ein Bundesland untersucht wurde, in dem ein vergleichsweise hoher Anteil der Schülerinnen und Schüler nach der Grundschule in eine Hauptschule übergeht, sodass hier mit weniger negativen Auswirkungen auf die Schülerzusammensetzung zu rechnen ist als in Bundesländern, in denen die Hauptschule nur eine „Restschule“ darstellt. Eine weitere mögliche Erklärung für das Ausbleiben der Kompositionseffekte nach Kontrolle möglicher Institutionseffekte könnte der kurze Beobachtungszeitraum zwischen der 5. und 6. Jahrgangsstufe sein. So wird unter anderem davon ausgegangen, dass die Zusammensetzung der Schülerschaft ihre Wirkung auf individuelle Schülerleistungen über die Interaktionsprozesse zwischen Lehrerinnen bzw. Lehrern und Schülerinnen bzw. Schülern, d. h. über den Unterricht, entfaltet (Dreeben & Barr, 1988), aber auch durch ihren Einfluss auf die normative Kultur von Schülergruppen (Burns & Mason, 2002). Beide dieser Mechanismen wirken unter Umständen erst nach einem längeren Zeitraum als dem in der vorliegenden Studie untersuchten Schuljahr nach dem Wechsel von der Grundschule. Inwiefern sich Kompositionseffekte über einen längeren Zeitraum nachweisen lassen, wird in zukünftigen Analysen im Rahmen der TRAIN-Studie überprüft werden können, da die Leistungsentwicklung der Schülerinnen und Schüler auch in den Jahrgangsstufen 7 und 8 weiter untersucht wurde. Prinzipiell denkbar ist natürlich auch, dass die verwendeten Untersuchungsinstrumente nicht geeignet waren, tatsächlich vorhandene Kompositionseffekte reliabel zu identifizieren; diese Erklärung erscheint jedoch angesichts der psychometrischen Kennwerte der Leistungstests nicht sehr plausibel. Denkbar, aber mit Daten aus TRAIN nicht zu untersuchen, ist darüber hinaus die Möglichkeit, dass die wesentlichen Unterschiede im Hinblick auf die Leistungsentwicklung und den Einfluss der Klassenkomposition zwischen gymnasialen und nichtgymnasialen Schulformen und nicht zwischen der Haupt- und Realschule liegen. Literatur Adams, R. J. (2005). Reliability as a measurement design effect. Studies in Educational Evaluation, 31, 162 - 172. Alegre, M. A., & Ferrer, G. (2006). School regimes and education equity: some insights based on PISA 2006. British Educational Research Journal, 36 (3), 433 - 461. Baumert, J., Lehmann, R., Lehrke, M., Schmitz, B., Clausen, M., Hosenfeld, I., … Neubrand, J. (1997). TIMSS - Mathematisch-naturwissenschaftlicher Unterricht im internationalen Vergleich: Deskriptive Befunde. Opladen: Leske + Budrich. Baumert, J., Roeder, P. M., Gruehn, S., Heyn, S., Köller, O., Rimmele, R., … Seipp, B. (1996). Bildungsverläufe und psychosoziale Entwicklung im Jugendalter (BIJU). In K. P. Treumann, G. Neubauer, R. Möller & J. Abel (Hrsg.), Methoden und Anwendungen empirischer pädagogischer Forschung (S. 170 - 180). Münster: Waxmann. Baumert, J., Stanat, P. & Watermann, R. (2006). Schulstruktur und die Entstehung differenzieller Lern- und Entwicklungsmilieus. In J. Baumert, P. Stanat & R. Watermann (Hrsg.), Herkunftsbedingte Disparitäten im Bildungswesen: Differenzielle Bildungsprozesse und Probleme der Verteilungsgerechtigkeit (S. 95 - 188). Wiesbaden: VS Verlag für Sozialwissenschaften. Baumert, J., Trautwein, U. & Artelt, C. (2003). Schulumwelten - institutionelle Bedingungen des Lehrens und Lernens. In J. Baumert, C. Artelt, E. Klieme, M. Neubrand, M. Prenzel, U. Schiefele, … M. Weiß (Hrsg.), 212 Hanna Dumont et al. PISA 2000. Ein differenzierter Blick auf die Länder der Bundesrepublik Deutschland (S. 261 - 331). Opladen: Leske + Budrich. Becker, M., Lüdtke, O., Trautwein, U. & Baumert, J. (2006). Leistungszuwachs in Mathematik. Evidenz für einen Schereneffekt im mehrgliedrigen Schulsystem. Zeitschrift für Pädagogische Psychologie, 20 (4), 233 - 242. Bellin, N. (2009). Klassenkomposition, Migrationshintergrund und Leistung. Mehrebenenanalysen zum Sprach- und Leseverständnis von Grundschülern. Wiesbaden: VS Verlag für Sozialwissenschaften. Blum, W., Drüke-Noe, C., Hartung, R. & Köller, O. (2006). Bildungsstandards Mathematik: konkret - Sekundarstufe I: Aufgabenbeispiele, Unterrichtsanregungen, Fortbildungsideen. Berlin: Cornelsen-Scriptor-Verlag. Bos, W. & Scharenberg, K. (2010). Lernentwicklung in leistungshomogenen und -heterogenen Schulklassen. In W. Bos, E. Klieme & O. Köller (Hrsg.), Schulische Lerngelegenheiten und Kompetenzentwicklung. Festschrift für Jürgen Baumert (S. 173 - 194). Münster: Waxmann. Burns, R., & Mason, D. A. (2002). Class Composition and Student Achievement in Elementary Schools. American Educational Research Journal, 39 (1), 207 - 233. Ditton, H. & Krüsken, J. (2006). Sozialer Kontext und schulische Leistungen - zur Bildungsrelevanz segregierter Armut. Zeitschrift für Soziologie der Erziehung und Sozialisation, 26 (2), 135 - 157. Dreeben, R., & Barr, R. (1988). Classroom composition and the design of instruction. Sociology of Education, 61 (3), 129 - 142. Dumont, H., Neumann, M., Maaz, K. & Trautwein, U. (2013). Die Zusammensetzung der Schülerschaft als Einflussfaktor für Schulleistungen: Internationale und nationale Befunde. Psychologie in Erziehung und Unterricht, 60, 163 - 183. Ganzeboom, H. B. G., De Graaf, P. M., Treiman, D. J., & De Leeuw, J. (1992). A standard internation socioeconomic index of occupational status. Social Science Research, 21 (1), 1 - 56. Granzer, D., Köller, O. & Bremerich-Vos, A. (2009). Bildungsstandards Deutsch und Mathematik. Leistungsmessung in der Grundschule. Weinheim: Beltz. Gröhlich, C., Scharenberg, K. & Bos, W. (2009). Die Bedeutung der Leistungsheterogenität von Schulklassen für die Lernentwicklung in der Sekundarstufe. Journal für Bildungsforschung Online, 1 (1), 86 - 105. Harker, R., & Tymms, P. (2004). The effects of student composition on school outcomes. School Effectiveness and School Improvement, 15 (2), 177 - 199. Hattie, J. (2002). Classroom composition and peer effects. International Journal of Educational Research, 37, 449 - 481. Heller, K. A. & Perleth, C. (2000). Kognitiver Fähigkeitstest für 4. bis 12. Klassen, Revision (KFT 4 - 12 + R) - Manual. Göttingen: Hogrefe. Helmke, A. & Weinert, F. E. (1997). Bedingungsfaktoren schulischer Leistungen. In F. E. Weinert (Hrsg.), Enzyklopädie der Psychologie: Themenbereich D Praxisgebiete, Serie I Pädagogische Psychologie, Band 3: Psychologie der Schule und des Unterrichts (S. 71 - 176). Göttingen: Hogrefe. Kolen, M. J., & Brennan, R. L. (2004). Test equating, scaling, and linking: Methods and practices. New York: Springer. Köller, O. & Baumert, J. (2001). Leistungsgruppierungen in der Sekundarstufe I. Ihre Konsequenzen für die Mathematikleistung und das mathematische Selbstkonzept der Begabung. Zeitschrift für Pädagogische Psychologie, 15, 99 - 110. Köller, O. & Baumert, J. (2002). Entwicklung schulischer Leistungen. Kapitel 23. In R. Oerter & L. Montana (Hrsg.), Entwicklungspsychologie (5. vollständig überarbeitete Aufl., S. 756 - 786). Weinheim: Beltz/ PVU. Kunter, M., Baumert, J., Blum, W., Klusmann, U., Krauss, S. & Neubrand, M. (Hrsg.). (2011). Professionelle Kompetenz von Lehrkräften - Ergebnisse des Forschungsprogramms COACTIV. Münster: Waxmann. Lehmann, R. & Lenkeit, J. (2008). Erhebung zum Lese- und Mathematikverständnis: Entwicklungen in den Jahrgangsstufen 4 bis 6 in Berlin. Abschlussbericht über die Untersuchungen 2003, 2004 und 2005 an Berliner Grundschulen und grundständigen Gymnasien. Berlin: Senatsverwaltung für Bildung, Jugend und Sport. Lehmann, R., Peek, R. & Poerschke, J. (1997). Hamburger Lesetest für 3. und 4. Klassen (HAMLET 3 - 4). Weinheim: Beltz. Lüdtke, O., Robitzsch, A., Trautwein, U. & Köller, O. (2007). Umgang mit fehlenden Werten in der psychologischen Forschung: Probleme und Lösungen. Psychologische Rundschau, 58 (2), 103 - 117. Mislevy, R. J., Beaton, A. E., Kaplan, B., & Sheenhan, K. M. (1992). Estimating population characteristics from sparse matrix samples of item responses. Journal of Educational Measurement, 29, 133 - 161. Muthén, L. K., & Muthén, B. O. (1998 - 2010). Mplus User’s Guide (6th ed.). Los Angeles, CA: Muthén & Muthén. Nauck, J. & Otte, R. (1980). Diagnostischer Test Deutsch (DTD 4 - 6). Braunschweig: Westermann. Neumann, M., Schnyder, I., Trautwein, U., Niggli, A., Lüdtke, O. & Cathomas, R. (2007). Schulformen als differenzielle Lernmilieus. Institutionelle und kompositionelle Effekte auf die Leistungsentwicklung im Fach Französisch. Zeitschrift für Erziehungswissenschaft, 10 (3), 399 - 420. Opdenakker, M.-C., & van Damme, J. (2006). Differences between secondary schools: A study about school context, group composition, school practice, and school effects with special attention to public and catholic schools and types of schools. School Effectiveness and School Improvement, 17, 87 - 117. Perry, L. B., & McConney, A. (2010). Does the SES of the school matter? An examination of socioeconomic status and student achievement using PISA 2003. Teachers College Record, 112 (4), 1137-1162. Pfost, M., Karing, C., Lorenz, C. & Artelt, C. (2010). Schereneffekte im ein- und mehrgliedrigen Schulsystem: Differenzielle Entwicklung sprachlicher Kompetenzen am Übergang von der Grundin die weiterführende Schule? Zeitschrift für Pädagogische Psychologie, 24 (3 - 4), 259 - 272. Ramseier, E. & Brühwiler, C. (2003). Zukunft, Leistung und Bildungschancen im gegliederten Bildungssystem. Vertiefte PISA-Analyse unter Einbezug der kognitiven Grundfähigkeiten. Schweizerische Zeitschrift für Bildungswissenschaften, 25 (1), 23 - 58. Raudenbush, S. W., & Bryk, A. S. (2002). Hierarchical Linear Models (2nd ed.). Thousand Oaks: Sage Publications. Rost, J. (2004). Lehrbuch Testtheorie - Testkonstruktion. Bern: Huber. Zur Bedeutung der Klassenkomposition in Haupt- und Realschulen 213 Rubin, D. B. (1987). Multiple imputation for nonresponse in surveys. New York: Wiley & Sons. Rumberger, R. W., & Palardy, G. (2005). Does Segregation still matter? The impact of student composition on academic achievement in high school. Teachers College Record, 107, 1999 - 2045. Stanat, P. (2006). Schulleistungen von Jugendlichen mit Migrationshintergrund: Die Rolle der Zusammensetzung der Schülerschaft. In J. Baumert, P. Stanat & R. Watermann (Hrsg.), Herkunftsbedingte Disparitäten im Bildungswesen: Differenzielle Bildungsprozesse und Probleme der Verteilungsgerechtigkeit (S. 189 - 219). Wiesbaden: VS Verlag für Sozialwissenschaften. Stanat, P., Schwippert, K. & Gröhlich, C. (2010). Der Einfluss des Migrantenanteils in Schulklassen auf den Kompetenzerwerb: Längsschnittliche Überprüfung eines umstrittenen Effekts. Zeitschrift für Pädagogik, 55. Beiheft, 147 - 164. Thrupp, M., Lauder, H., & Robinson, T. (2002). School composition and peer effects. International Journal of Educational Research, 37, 483 - 504. Trautwein, U., Baumert, J. & Maaz, K. (2007). Hauptschulen = Problemschulen? Aus Politik und Zeitgeschichte, 28, 3 - 9. Trautwein, U., Jonkmann, K., Wacker, A. & Nagy, G. (Hrsg.). (2011).Tradition und Innovation: Entwicklungsverläufe an Haupt- und Realschulen in Baden- Württemberg und Mittelschulen in Sachsen - Zweiter Zwischenbericht für die Länder Baden-Württemberg und Sachsen. Unveröffentlichter Projektbericht, Tübingen. Van Ewijk, R., & Sleegers, P. (2010). The effect of peer socioeconomic status on student achievement: A metaanalysis. Educational Research Review, 5, 134 - 150. Walter, O. (2008). Ethno-linguale Kompositionseffekte in neunten Klassen: Befunde aus der Klassenstichprobe von PISA 2006. Zeitschrift für Erziehungswissenschaft, 10, 169 - 184. Walter, O. & Stanat, P. (2008). Der Zusammenhang des Migrantenanteils in Schulen mit der Lesekompetenz: Differenzierte Analysen der erweiterten Migrantenstichprobe von PISA 2003. Zeitschrift für Erziehungswissenschaft, 11 (1), 84 - 105. Wu, M. (2005). The role of plausible values in large-scale surveys. Studies in Educational Evaluation, 31, 114 - 128. Dr. Hanna Dumont Dr. Marko Neumann Dr. Michael Becker Universität Potsdam Department Erziehungswissenschaften Quantitative Methoden in den Bildungswissenschaften Karl-Liebknecht-Str. 24 -25 14476 Potsdam E-Mail: hanna.dumont@uni-potsdam.de E-Mail: marko.neumann@uni-potsdam.de E-Mail: michael.becker.v@uni-potsdam.de Prof. Dr. Gabriel Nagy Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik (IPN) Olshausenstr. 62 24118 Kiel E-Mail: nagy@ipn.uni-kiel.de Dipl.-Psych. Norman Rose Prof. Dr. Ulrich Trautwein Universität Tübingen Abteilung Empirische Bildungsforschung und Pädagogische Psychologie Europastraße 6 72072 Tübingen E-Mail: norman.rose@uni-tuebingen.de E-Mail: ulrich.trautwein@uni-tuebingen.de
