Psychologie in Erziehung und Unterricht
3
0342-183X
Ernst Reinhardt Verlag, GmbH & Co. KG München
10.2378/peu2019.art03d
11
2019
661
Empirische Arbeit: Welche Schulen machen mit beim Jahrgangsübergreifenden Lernen?
11
2019
Katharina Thoren
Bettina Hannover
Martin Brunner
Im Schuljahr 2008/09 war Jahrgangsübergreifendes Lernen (JÜL) in der Berliner Schuleingangsphase verpflichtend eingeführt worden. Doch nicht alle Schulen übernahmen diese Reform. In dieser Studie untersuchen wir, inwiefern Schulen sich in Abhängigkeit davon, wie schnell und umfassend sie JÜL implementiert hatten, in Merkmalen ihrer Schülerschaft voneinander unterscheiden. Wir nahmen an, dass mit dem Ziel von JÜL, Heterogenität produktiv für das Lernen zu nutzen, die Reform für solche Schulen besonders attraktiv war, die eine heterogene Schülerschaft haben. Heterogenität wurde über die Anteile von Kindern mit (a) nichtdeutscher Erstsprache und (b) Lernmittelzuzahlungsbefreiung operationalisiert. Weiter wurde untersucht, ob sich die Leistungen der Kinder in Deutsch und Mathematik zwischen den Schulen unterschieden. Die Ergebnisse zeigen erwartungsgemäß, dass Schulen mit einer heterogenen Schülerschaft JÜL schnell und nachhaltig implementierten. Im zeitlichen Verlauf ließen sich, nach Kontrolle der Heterogenität der Schülerschaft, keine Leistungsunterschiede zwischen den Schulen feststellen. Die Ergebnisse werden hinsichtlich der Frage diskutiert, unter welchen Voraussetzungen Schulen Reformen implementieren und wie sich JÜL auf Bildungsergebnisse auswirken kann.
3_066_2019_1_0005
n Empirische Arbeit Psychologie in Erziehung und Unterricht, 2019, 66, 19 -32 DOI 10.2378/ peu2019.art03d © Ernst Reinhardt Verlag München Basel Welche Schulen machen mit beim Jahrgangsübergreifenden Lernen? Demografische und leistungsbezogene Merkmale unterschiedlich reformbereiter Grundschulen in Berlin Katharina Thoren 1 , Bettina Hannover 1 , Martin Brunner 2 1 Freie Universität Berlin 2 Universität Potsdam Zusammenfassung: Im Schuljahr 2008/ 09 war Jahrgangsübergreifendes Lernen (JÜL) in der Berliner Schuleingangsphase verpflichtend eingeführt worden. Doch nicht alle Schulen übernahmen diese Reform. In dieser Studie untersuchen wir, inwiefern Schulen sich in Abhängigkeit davon, wie schnell und umfassend sie JÜL implementiert hatten, in Merkmalen ihrer Schülerschaft voneinander unterscheiden. Wir nahmen an, dass mit dem Ziel von JÜL, Heterogenität produktiv für das Lernen zu nutzen, die Reform für solche Schulen besonders attraktiv war, die eine heterogene Schülerschaft haben. Heterogenität wurde über die Anteile von Kindern mit (a) nichtdeutscher Erstsprache und (b) Lernmittelzuzahlungsbefreiung operationalisiert. Weiter wurde untersucht, ob sich die Leistungen der Kinder in Deutsch und Mathematik zwischen den Schulen unterschieden. Die Ergebnisse zeigen erwartungsgemäß, dass Schulen mit einer heterogenen Schülerschaft JÜL schnell und nachhaltig implementierten. Im zeitlichen Verlauf ließen sich, nach Kontrolle der Heterogenität der Schülerschaft, keine Leistungsunterschiede zwischen den Schulen feststellen. Die Ergebnisse werden hinsichtlich der Frage diskutiert, unter welchen Voraussetzungen Schulen Reformen implementieren und wie sich JÜL auf Bildungsergebnisse auswirken kann. Schlüsselbegriffe: Jahrgangsübergreifendes Lernen, Implementation von Schulreformen, Reformbereitschaft, Zusammensetzung Schülerschaft hinsichtlich Erstsprache, Zusammensetzung Schülerschaft hinsichtlich Lernmittelzuzahlungsbefreiung Which Schools Engage in Mixed-age Learning? Demographic and Achievement Related Characteristics of Schools According to Their Reform Efforts Summary: Starting in 2008, elementary schools in Berlin, Germany, were obligated to teach children of the first two grades in mixed-age classes. However, not all schools implemented the reform as expected. In this study, we investigate whether schools who differed from each other in the speed and the extent to which they had implemented the reform also differed in their student body. We expected that introducing mixed-age classes would be particularly attractive for schools challenged by a heterogeneous student body. Heterogeneity was operationalized via the proportions of students (a) with non-German first language and (b) from low socioeconomic families. We also investigated whether students’ achievement in German and mathematics differed between the schools. Results show that as expected, schools with a heterogeneous student body implemented the reform quickly and comprehensively. Controlling for heterogeneity, students’ achievement in German and mathematics was the same, irrespective of the implementation of mixed-age learning. We discuss under what circumstances schools implement reforms and whether mixed-age learning can improve student achievement. Keywords: Mixed-age learning, implementation of school reform, openness to reform, ethnic student composition, socioeconomic student composition 20 Katharina Thoren, Bettina Hannover, Martin Brunner Schulreformen stellen für die Weiterentwicklung und Qualitätsentwicklung im Bildungswesen einen wichtigen Motor dar (Goldenbaum, 2012). Dennoch reagieren Schulen auf die Aufforderung, eine Reform in die Tat umzusetzen, häufig mit Widerstand. Dies ist besonders dann wahrscheinlich, wenn die Implementation von den bildungspolitisch Verantwortlichen top-down angeordnet wird, anstatt dass die Schulen in den Implementationsprozess als aktive Partner einbezogen und die besonderen Randbedingungen jeder einzelnen Schule berücksichtigt werden (Gräsel & Parchmann, 2004; Holtappels, 1995). In Berlin wurde zum Schuljahr 2005/ 06 die flexible Schulanfangsphase verpflichtend eingeführt. Dabei wurden die Jahrgangsstufen eins und zwei als pädagogisch curriculare Einheit zusammengefasst und auf Rückstellungen bei der Einschulung verzichtet. Ziel war es, mit der Heterogenität der Schülerschaft verstärkt produktiv arbeiten zu können (SenBWF, 2009; Thoren, 2017). Damit einhergehend wurde zum Schuljahr 2008/ 09 auch das Jahrgangsübergreifende Lernen (JÜL) eingeführt. In einer vorangegangenen Studie konnte aufgezeigt werden, dass Berliner Schulen auf die JÜL-Reformvorgabe unterschiedlich reagierten und sich in vier verschiedene Typen der JÜL-Implementation (betreffend Zeitpunkt und Grad der Implementation) differenzieren ließen (Thoren & Brunner, 2018). Der vorliegende Beitrag knüpft an diese Ergebnisse an und geht der Frage nach, ob sich die Schulen der verschiedenen Typen in demografischen und leistungsbezogenen Merkmalen ihrer Schülerschaft systematisch voneinander unterscheiden. Auf diese Weise wollen wir mögliche Gründe erfahren, warum Schulen JÜL unterschiedlich schnell und umfangreich implementiert oder auch nicht implementiert haben. Wir suchen dabei nach Einflussfaktoren auf der Ebene der Schule, da (a) sie aus Sicht der initiierenden Behörde häufig Adressatin der Reform ist (Fullan, 2000; Goldenbaum, 2012; Hall & Hord, 2015) und (b) die Einzelschule in der Implementationsforschung sowohl theoretisch als auch empirisch als relevante Größe identifiziert worden ist (Goldenbaum, 2012; Gräsel & Parchmann, 2004; Hall & Hord, 2015; Hasselhorn, Köller, Maaz & Zimmer, 2014). Weiterhin wird mit Blick auf den Implementationserfolg geprüft, ob sich die vier Implementationstypen auch hinsichtlich der mittleren Schülerleistung im Verlauf des Reformprozesses unterscheiden, ob also möglicherweise auch der Erfolg einer Reform systematisch mit Merkmalen der Einzelschulen zusammenhängt. JÜL als heterogenitätserzeugende Unterrichtsorganisationsform JÜL ist im Rahmen der Bildungsreformen im 21. Jahrhundert in den bildungspolitischen Fokus gerückt. Insbesondere bei den bundesweit eingeführten Neuerungen zum Schulanfang war JÜL Teil der Diskussion (z. B. in Baden-Württemberg: Frank, 2007; in Brandenburg: Liebers, Prengel & Bieber, 2008). Eines der wesentlichen Merkmale von JÜL ist das Miteinander-Lernen von Kindern aus unterschiedlichen Alters-, Leistungs- und Interessengruppen (Carle, 2013) in einer Klasse, die Schülerinnen und Schüler aus mindestens zwei Jahrgangsstufen umfasst. Mit dieser bewussten Vergrößerung der Heterogenität soll für Lehrkräfte die Notwendigkeit der Individualisierung der Lernprozesse verdeutlicht sowie für die Kinder ein produktiver Umgang mit den Peers ermöglicht werden, die in ihrer Lernentwicklung unterschiedlich weit vorangeschritten sind (Carle & Metzen, 2014; Roßbach & Wellenreuther, 2002). So kann beispielsweise ein Schulanfängerkind nicht mit den gleichen Aufgaben konfrontiert werden wie ein Kind, das bereits im dritten Jahr den Anfangsunterricht besucht. Darüber hinaus kann mit der Individualisierung von Lernprozessen nicht nur auf altersbezogene Heterogenität, sondern auch auf durch andere Faktoren bedingte Heterogenität optimal reagiert werden. Denn Individualisierung bedeutet, dass Kinder mit unterschiedlichen Lernständen mit unterschiedlichen, jeweils für sie angepassten mittelschweren Aufgabenschwierigkeiten konfrontiert werden können und somit in ihrer kognitiven Entwicklung optimal gefördert werden. Welche Schulen machen mit beim Jahrgangsübergreifenden Lernen? 21 Bis zum gegenwärtigen Zeitpunkt ist wenig darüber bekannt, welche Wirkung JÜL tatsächlich auf die Entwicklung der Schülerinnen und Schüler hat. Studien, die sich dieser Frage widmeten, haben in aller Regel korrelative Zusammenhänge zwischen jahrgangsbezogenem oder jahrgangsübergreifend organisiertem Unterricht auf der einen Seite und den Leistungen, Kompetenzständen sowie der motivationalen und sozio-emotionalen Entwicklung der Kinder auf der anderen Seite analysiert. Die Leistungsentwicklung betreffend konnten keine Unterschiede in Abhängigkeit der Art der Unterrichtsorganisation nachgewiesen werden (Gutierrez & Slavin, 1992; Hattie, 2009; Kucharz & Wagener, 2007; Kuhl, Felbrich, Richter, Stanat & Pant, 2013; Thoren, Bröder, Gelke & Brunner, 2016). Weniger einheitlich ist die empirische Evidenz zum Zusammenhang zwischen JÜL und motivationaler und sozio-emotionaler Entwicklung der Kinder. Einige Studien fanden keine Unterschiede hinsichtlich der Lernmotivation bzw. der sozio-emotionalen Entwicklung in Abhängigkeit der Unterrichtsorganisation (Thoren et al., 2016; Veenman, 1995, 1996), während in manchen Studien kleine, positive (korrelative) Zusammenhänge zwischen JÜL und dem psychosozialen Wohlbefinden (Hattie, 2009) sowie der Lernfreude und der Anstrengungsbereitschaft (Kuhl et al., 2013) der Kinder nachgewiesen wurden. Zusammenfassend kann festgestellt werden, dass nur vereinzelt positive Effekte von JÜL nachgewiesen worden sind. Allerdings wurden in den genannten Studien weder das Ausmaß der Implementation von JÜL noch Merkmale der Einzelschulen berücksichtigt; Größen also, von deren Abhängigkeit der Implementationserfolg möglicherweise unterschiedlich stark ausfällt. Wie haben Schulen in Berlin JÜL implementiert? In Berlin sollte JÜL, nachdem einige Grundschulen bereits ab 1992 - aus eigener Initiative heraus - JÜL im Rahmen eines Modellversuchs erprobt hatten, ab dem Schuljahr 2008/ 09 innerhalb der zuvor eingeführten flexiblen Schulanfangsphase verpflichtend für die ersten zwei Schulbesuchsjahre an allen öffentlichen Schulen umgesetzt werden. Die top-down initiierte Reform löste Kontroversen in den Schulen und der Öffentlichkeit aus (vgl. Klesmann, 2011; Vieth-Entus, 2008, 2009), welche auch nach Einführung dieser verbindlichen Regelung nicht abrissen. So veröffentlichten Schulleitungen einen Brandbrief an die amtierende Bildungssenatorin (Vieth-Entus, 2011), in dem sie die künstlich erhöhte Heterogenität und die Überforderung von Lehrkräften, Schülerinnen und Schülern anprangerten. Dem öffentlichen Druck nachgebend wurde ab dem Schuljahr 2012/ 13 den Schulen die Wahl zwischen einer jahrgangsbezogenen oder aber einer jahrgangsübergreifenden Organisation der Schulanfangsphase eröffnet. Thoren und Brunner (2018) vermuteten, dass unter den soeben beschriebenen Bedingungen Schulen die JÜL-Reform in sehr unterschiedlich starkem Ausmaß umsetzten und unterschieden zwischen vier theoretisch hergeleitete Typen der JÜL-Implementation: (a) Die Verweigerer, die die JÜL Reform zu keinem Zeitpunkt umsetzten; (b) die Nicht-Überzeugten, die nach einer ersten Umsetzung von JÜL zur jahrgangsbezogenen Unterrichtsorganisation zurückkehrten; (c) die Überzeugten, die JÜL mit Beginn der Verpflichtung eingeführt und beibehalten haben; (d) die Pioniere, die bereits vor Beginn der Verpflichtung ihre Schulanfangsphase jahrgangsübergreifend organisiert hatten und dabeiblieben. Um die Typisierung empirisch zu prüfen, fassten Thoren und Brunner (2018) Daten der Schulstatistik in einem Längsschnitt zusammen und untersuchten sie mithilfe von Mplus 7.3 (Muthén und Muthén, 1998 - 2014) mit dem Verfahren der latenten Profilanalyse. Als Indikator diente der Anteil an jahrgangsübergreifend unterrichteten Klassen an der Gesamtklassenanzahl der Schulanfangsphase je Schuljahr zu insgesamt neun Messzeitpunkten (für das genaue Vorgehen siehe Thoren & Brunner, 2018). 22 Katharina Thoren, Bettina Hannover, Martin Brunner Die Verweigerer machten 15 % der insgesamt 356 untersuchten Grundschulen aus; sie hatten zu keinem der untersuchten neun Messzeitpunkte in mehr als einer Klasse der Schulanfangsphase JÜL umgesetzt. Jede dritte Grundschule (35 %) hatte zwar mit der Umsetzung von JÜL begonnen, war jedoch noch vor dem letzten Beobachtungszeitpunkt (2015/ 16) zur jahrgangsbezogenen Unterrichtsorganisation zurückgekehrt (Nicht-Überzeugte). Und 20 % der Grundschulen hatten JÜL mit Beginn der Verpflichtung eingeführt und waren bis zum letzten Beobachtungszeitpunkt auch dabeigeblieben (Überzeugte). Weitere 30 % der Schulen hatten bereits vor Beginn der Verpflichtung ihre Schulanfangsphase jahrgangsübergreifend organisiert und waren ebenfalls bis zum Ende der Erhebungen dabeigeblieben (Pioniere). Die Ergebnisse verdeutlichen, dass Schulen in Berlin die JÜL-Reform sehr unterschiedlich umsetzten. Für uns ergab sich daraus die Frage, ob sich Merkmale identifizieren lassen, auf denen sich die Schulen, die JÜL tiefgreifend und langfristig implementiert haben, systematisch von den Schulen der anderen Typen unterscheiden lassen. Wir haben angenommen, dass JÜL für solche Schulen besonders attraktiv ist, die in Hinblick auf die Heterogenität ihrer Schülerschaft herausgefordert sind, wohingegen sich die Relevanz von JÜL für Schulen mit einer wenig herausfordernden Schülerschaft als vergleichsweise gering darstellen sollte. Denn es ist genau das Ziel von JÜL, den Umgang mit Heterogenität in Schule und Unterricht produktiv zu gestalten. Heterogenität der Schülerschaft als für die Implementation von JÜL relevantes Merkmal der Einzelschulen Mit Heterogenität ist das Ausmaß der Verschiedenheit der Schülerinnen und Schüler einer Gesamtstichprobe, einer Untersuchungseinheit (Schule, Klasse) oder zwischen Untersuchungseinheiten gemeint. Heterogenität kann sich auf für Lernen und Leistung unmittelbar relevante individuelle Merkmale wie z. B. kognitive Fähigkeiten, Vorwissen und Motivation oder aber auf Personenmerkmale (z. B. Alter, Geschlecht, Förderstatus) und Merkmale der Herkunft (z. B. nichtdeutsche Erstsprache, Lernmittelzuzahlungsbefreiung als Indikator für sozioökonomischen Status) beziehen, die sich indirekt, nämlich vermittelt über mit ihnen einhergehenden Unterschieden in Lernvoraussetzungen und Lernbedingungen, differenziell auf Leistung auswirken können (Baumert, Maaz, Stanat & Watermann, 2009; Scharenberg, 2012; Zulliger & Tanner, 2013). Heterogenität wird unterschiedlich operationalisiert (vgl. Rjosk, Richter, Lüdtke & Eccles, 2017). Eine häufig genutzte Möglichkeit besteht darin, die Anteile der Lernenden mit einer bestimmten minderheitlichen bzw. mehrheitlichen Merkmalsausprägung innerhalb einer Klasse oder Lerngruppe zu berechnen (z. B. nichtdeutsche vs. deutsche Erstsprache; sog. Mehrheiten-Minderheiten-Ansatz, vgl. Budescu & Budescu, 2012; Rjosk et al., 2017). Die Heterogenität gilt dabei als umso höher, je stärker die Anteile der Schülerinnen und Schüler mit minderheitlicher Merkmalsausprägung sind. Dieser Ansatz ist in der empirischen Bildungsforschung weit verbreitet. Eine andere Möglichkeit bieten Diversitätsmaße. Lieberson (1969) folgend wird Diversität dabei als die Position einer Population entlang eines Homogenitäts- Heterogenitäts-Kontinuums hinsichtlich einer oder mehrerer Variablen definiert (sog. variety diversity, Vielfalts- oder Verschiedenheitsdiversität; vgl. Budescu & Budescu, 2012; Rjosk et al., 2017). Am Beispiel der nichtdeutschen Erstsprache ist die Heterogenität dabei umso stärker, je mehr unterschiedliche Erstsprachen die Schülerinnen und Schüler innerhalb einer Klasse haben. Rjosk et al. (2017) zeigen, dass beide Maße empirisch mit r = .92 extrem hoch korreliert sind. Auch die Zusammenhänge mit verschiedenen Outcome-Variablen unterscheiden sich nur geringfügig in Abhängigkeit davon, ob der Mehrheiten-Minderheiten-Ansatz oder der Diversitätsansatz für die Operationalisierung von Welche Schulen machen mit beim Jahrgangsübergreifenden Lernen? 23 Heterogenität verwendet worden ist. Vor diesem Hintergrund haben wir uns in unserer eigenen Forschung für ein ökonomisches Vorgehen entschieden und entlang des Mehrheiten-Minderheiten-Ansatzes Heterogenität definiert als den Anteil von Schülerinnen und Schülern, für die eine minderheitliche Merkmalsausprägung gilt; und zwar auf den beiden Dimensionen Lehrmittelbefreiung und nichtdeutsche Erstsprache. Besonders häufig untersucht wurde, inwieweit Heterogenität einer Klasse oder Schule in Merkmalen der ethnischen und sozialen Herkunft sich auf Lernergebnisse des individuellen Lernenden und auf Ebene der Klasse oder Schule auswirkt (u. a. Decristan, Fauth, Kunter, Büttner & Klieme, 2017; Dumont, Neumann, Maaz & Trautwein, 2013; van Ewijk & Sleegers, 2010). So fanden beispielsweise Baumert, Stanat und Watermann (2006) in vertiefenden Analysen der PISA-Daten, dass Fähigkeitsunterschiede zwischen Schulen zu 70 % durch die soziale Herkunft der Schülerinnen und Schüler erklärt werden konnten. Solche Zusammenhänge werden damit erklärt, dass in Abhängigkeit der Heterogenität der Lernumgebung der einzelne Lernende mehr bzw. weniger gute Lernergebnisse erzielt, als aufgrund seiner individuellen Lernvoraussetzungen vorhergesagt würde, und dass Heterogenität sich in Interaktion mit weiteren Merkmalen der Schulklasse (z. B. Unterrichtsqualität; Decristan et al., 2017) vorteilig oder nachteilig auf die mittlere Leistung einer Klasse oder Schule auswirken kann. Forschungsfragen Aus der Erkenntnis von Thoren und Brunner (2018), dass Berliner Schulen sich systematisch in der Art und Weise voneinander unterschieden, ob und wie sie JÜL implementiert haben, ergibt sich für uns die Frage nach den Gründen, warum die Reform für Schulen unterschiedlich attraktiv gewesen ist. Die Heterogenität in Hinblick auf Merkmale der Herkunft, mit der eine Schule umzugehen hat, ist eine wichtige Einflussgröße auf Bildungsergebnisse. Gleichzeitig verbindet sich mit JÜL die Hoffnung, dass Heterogenität für das Lernen produktiv genutzt werden kann. Wir haben deshalb vermutet, dass sich die Schulen, die von Thoren und Brunner (2018) den verschiedenen Typen der JÜL-Implementation zugeordnet worden sind, sich in der Heterogenität hinsichtlich Merkmalen der Herkunft ihrer Schülerschaft systematisch voneinander unterscheiden. Als heterogenitätserzeugende Merkmale im Sinne des Mehrheiten-Minderheiten- Ansatzes (Budescu & Budescu, 2012; Rjosk et al., 2017) wurde der Anteil der Schülerinnen und Schüler (a) mit nichtdeutscher Erstsprache und (b) mit Lernmittelzuzahlungsbefreiung gewählt. Im ersten Teil der vorliegenden Studie wird die Annahme geprüft, dass insbesondere Schulen des Typs Pioniere eine höhere Heterogenität auf diesen Merkmalen aufweisen als die Schulen der Typen Nicht-Überzeugte und Verweigerer, aber auch Überzeugte. Im zweiten Teil der Studie prüfen wir dann explorativ, inwieweit die Typen in Abhängigkeit dieser heterogenitätserzeugenden Merkmale ihrer Schülerschaft von der JÜL-Implementation profitieren. Dazu vergleichen wir die Leistungen der Kinder in Mathematik und Deutsch zum Zeitpunkt direkt vor der Aufforderung zur Implementation von JÜL, fünf Jahre später, als die Verpflichtung zu JÜL aufgehoben wurde, und weitere drei Jahre nach Ende der verpflichtenden JÜL- Phase. Methode Datengrundlage Grundlage der Auswertung sind auf Schulebene aggregierte und zu einem Längsschnitt zusammengefügte Datensätze aus den Schuljahren 2007/ 08 (vor der JÜL-Reform), 2012/ 13 (zum Ende der JÜL- Reform) sowie 2015/ 16 (nach der JÜL-Reform). Die Datensätze beziehen sich auf 356 öffentliche Grundschulen bzw. weiterführende Schulen mit Elementarbereich in Berlin, für die Thoren und Brunner (2018) die Typen der JÜL-Implementation identifiziert haben, und setzen sich aus folgenden Quellen zusammen: 24 Katharina Thoren, Bettina Hannover, Martin Brunner (a) Daten der amtlichen Schulstatistik des Landes Berlin (SenBJW, 2016). Diese Daten enthalten Informationen zu Klassenarten, Anzahl der Schülerinnen und Schüler und Klassen sowie zu den Anteilen von Mädchen und Jungen, Anteilen von Kindern mit nichtdeutscher Erstsprache und Anteilen von Kindern mit Lernmittelzuzahlungsbefreiung. Für diesen Teil der Daten waren keine fehlenden Werte zu verzeichnen. (b) Die Ergebnisse der jährlich bundesweit durchgeführten standardisierten Verfahren zur Leistungsmessung (Vergleichsarbeiten 1 , kurz VERA; ISQ, 2017). Die VERA-Tests werden unter Federführung des Instituts zur Qualitätsentwicklung im Bildungswesen (IQB) von Lehrkräften auf Grundlage der Bildungsstandards entwickelt, von Fachdidaktikerinnen und Fachdidaktikern überprüft und von Psychometrikerinnen und Psychometrikern des IQB umfassend auf Eignung und Schwierigkeit in vorgeschalteten Normierungsstudien untersucht. Die untersuchten Teilkompetenzen variieren zwischen den Schuljahren (s. Tab. 1). Die Daten für das Land Berlin werden vom Institut für Schulqualität der Länder Berlin und Brandenburg (ISQ) erfasst und aufbereitet. Die Antworten der Schülerinnen und Schüler bei den VERA-Tests werden im Rahmen der Item Response Theorie auf Basis eines eindimensionalen Raschmodells mit dem TAM-Paket (Robitzsch, Kiefer & Wu, 2018) in R (R Core Team, 2017) skaliert, in dem die Itemparameter auf die Werte aus den Normierungsstudien des IQB fixiert werden. Für die Analysen in diesem Artikel wurde auf Grundlage der wle-Schätzer ein globaler Leistungswert für die Kompetenzbereiche Deutsch und Mathematik gebildet. Hierzu wurde zunächst jeweils auf Schülerebene der Mittelwert über alle fachspezifischen Teilkompetenzen berechnet und im zweiten Schritt der Mittelwert auf Schulebene 1 Vergleichsarbeiten stellen eine der vier Säulen der Gesamtstrategie der Kultusministerkonferenz zum Bildungsmonitoring (KMK, 2006) dar. Sie dienen als Instrument der internen Evaluation, welches den Schulen und ihren Klassen neben einer Bestandsaufnahme der Leistungen ihrer Schülerinnen und Schüler vor allem auch zur Implementation der Bildungsstandards und der Rahmenlehrpläne sowie einer datengestützten Schul- und Unterrichtsentwicklung dienen soll (ISQ, 2017; KMK, 2015). Schuljahr 2007/ 08 2012/ 13 2015/ 16 Schulstatistik N % Mädchen % Nichtdeutsche Erstsprache 378 49,2 % 28,4 % 380 48,9 % 38,5 % 386 48,6 % 41,8 % VERA 3 N % Mädchen % Nichtdeutsche Erstsprache Reliabilitäten der getesteten Teilkompetenzen 1 Deutsch/ Lesen Deutsch/ Sprache und Sprachgebrauch untersuchen Deutsch/ Zuhören Mathematik/ Zahlen und Operationen Mathematik/ Muster und Strukturen Mathematik/ Raum und Form Mathematik/ Größen und Messen 372 48,7 % 27,9 % .82 .91 - .77 .83 .74 - 376 49,1 % 38,6 % .81 - .81 - - .88 .87 380 48,7 % 42,2 % .77 - .76 .76 .69 - - Tab. 1: Übersicht der Einzeldatensätze, Schuljahre 2007/ 08, 2012/ 13 und 2015/ 16 Anmerkungen: N = alle Schulen in öffentlicher Trägerschaft, mit mindestens einer Klasse der Schulanfangsphase, bei der Schulstatistik beziehen sich alle Angaben auf die gesamte Schule, bei VERA 3 beziehen sich alle Angaben auf die Schülerinnen und Schüler, die an VERA 3 teilgenommen haben. 1 Für das Schuljahr 2007/ 08 wird die Reliabilität als Cronbachs Alpha angegeben (Cronbach, 1951); für die Schuljahre 2012/ 13 und 2015/ 16 wurden die Daten IRT-skaliert. Als Reliabilitätsmaß wird daher die EAP/ PV-Reliabilität angegeben, die wie Cronbachs Alpha interpretiert werden kann (Rost, 1996). Welche Schulen machen mit beim Jahrgangsübergreifenden Lernen? 25 aggregiert. Zur besseren Vergleichbarkeit der Ergebnisse über die Domänen und über die Zeit wurden die schulbezogenen Leistungsmittelwerte jeweils pro Schuljahr und Kompetenzbereich über alle Schulen, die an VERA 3 teilgenommen haben, z-standardisiert (mit M = 0 und SD = 1). Eine Übersicht über die zugrunde liegenden Daten ist in Tabelle 1 dargestellt. Bis auf wenige Ausnahmen 2 waren alle Schülerinnen und Schüler der jeweiligen Schulen zur Teilnahme an den VERA-Tests verpflichtet. Gültige VERA-Testwerte lagen somit für 93 - 95 % der Schülerinnen und Schüler vor; fehlende Werte traten nur unsystematisch auf (z. B. aufgrund von Krankheit am Testtag). Aufgrund der geringen Anzahl an fehlenden Werten innerhalb von Schulen und dem unsystematischen (zufallsbedingten) Ausfallprozess wurden fehlende Werte vor Aggregation auf Schulebene nicht imputiert. Nach Aggregation lagen für alle Schulen gültige mittlere Leistungswerte auf Schulebene vor. Analysestrategie Unsere Hypothese, dass insbesondere Schulen des Typs Pioniere, aber auch Schulen des Typs Überzeugte eine heterogenere Schülerschaft betreffend Erstsprache und Lernmittelzuzahlungsbefreiung haben sollten als Schulen der Typen Verweigerer und Nicht-Überzeugte, wurde mittels Regressionsanalysen untersucht. Als unabhängige Variable wurden die vier Typen der JÜL-Implementation und als abhängige Variablen die Anteile von Kindern mit nichtdeutscher Erstsprache und die Anteile von Kindern mit Lernmittelzuzahlungsbefreiung im Schuljahr 2007/ 08 (also ein Schuljahr, bevor JÜL verpflichtend umgesetzt werden sollte) verwendet. Der JÜL-Typ wurde in drei dichotomisierten Variablen in das Modell aufgenommen. Der Annahme folgend, dass es insbesondere Schulen des Typs Pioniere sind, die eine heterogene Schülerschaft haben, wurde dieser Typ als Referenzkategorie festgelegt. Für die Untersuchung unserer Annahme, dass die verschiedenen Implementationstypen sich - bedingt durch die unterschiedliche Heterogenität der Schülerschaft - auch in dem Ausmaß voneinander unterscheiden könnten, in dem ihre Schülerschaft von JÜL profitiert, wurden zu den drei Messzeitpunkten mehrere lineare Regressionsmodelle berechnet. Als abhängige Variable diente dabei jeweils die Leistung der Kinder bei den Vergleichsarbeiten der dritten Jahrgangsstufe (VERA 3) für die Kompetenzbereiche Deutsch und Mathematik. In Modell 1 (M1) wurden als unabhängige Variablen die Typen der JÜL-Implementation aufgenommen. In Modell 2 wurde zusätzlich für die zwei heterogenitätserzeugenden Merkmale (Anteile von Kindern mit nichtdeutscher Erstsprache, Anteile von Kindern mit Lernmittelzuzahlungsbefreiung) aus dem jeweiligen Schuljahr kontrolliert. Für die Spezifikation von Modell 3 wurde Modell 2 erweitert, indem die domänenspezifische Ausgangsleistung zu Beginn der Reform (im Schuljahr 2007/ 08) als weitere Kovariate spezifiziert wurde (folglich konnte Modell 3 nicht für das Schuljahr 2007/ 08 berechnet werden, da hier keine Daten zur Ausgangsleistung vorlagen). Ergebnisse Die in Tabelle 2 dargestellten Ergebnisse der Regressionsanalysen zu Unterschieden zwischen den JÜL-Implementationstypen in der Heterogenität ihrer Schülerschaft (Forschungsfrage 1) zeigen, dass im Schuljahr 2007/ 08 (also ein Jahr, bevor JÜL verpflichtend umgesetzt werden sollte und nur Schulen des Typs Pioniere JÜL umsetzten) Schulen des Referenztyps Pioniere im Mittel einen Anteil von 40 % an Kindern mit nichtdeutscher Erstsprache aufwiesen (b = 0.40, p < .001). Sowohl bei den Schulen des Typs Verweigerer (b = -0.09, p < .05) als auch bei denen des Typs der von der Reform Nicht- Überzeugten (b = -0.13, p < .001) fielen diese Anteile mit 27 bzw. 31 % bedeutsam geringer aus. Demnach unterschieden sich die JÜL- Typen um maximal 13 % in ihren Anteilen an Schülerinnen und Schülern mit nichtdeutscher Erstsprache, wobei die Unterschiede zwischen den Pionieren und Verweigerern nur knapp 2 „Nicht zur Teilnahme verpflichtet sind Schülerinnen und Schüler, die nicht nach dem Rahmenlehrplan der Grundschule unterrichtet werden sowie Schülerinnen und Schüler, die seit weniger als zwölf Monaten in Deutschland leben und die deutsche Sprache nicht ausreichend beherrschen, um dem Unterrichtsgeschehen folgen zu können. Zudem besteht keine Nachschreibepflicht für diejenigen Schülerinnen und Schüler, die am Testtag nicht anwesend sind“ (Vettorazzi, Schilling, Harych & Brunner, 2017, S. 5). 26 Katharina Thoren, Bettina Hannover, Martin Brunner statistisch bedeutsam waren. Für die Schulen des Typs Überzeugte waren keine bedeutsamen Unterschiede zum Referenztyp festzustellen. Insgesamt erklärte die Zugehörigkeit zu den JÜL-Typen R² = 4 % der Varianz zwischen den Schulen bezüglich des Anteils von Kindern mit nichtdeutscher Erstsprache auf. Auch Kinder mit Lernmittelzuzahlungsbefreiung (vgl. Tab. 2) waren an Schulen des Referenztyps Pioniere mit 20 % anteilig stärker vertreten (b = 0.20, p < .001) als an Schulen des Typs Nicht-Überzeugte (b = -0.04, p < .01) und als an Schulen des Typs Überzeugte (b = -0.04, p < .05), wo sie jeweils einen Anteil von jeweils 16 % der Schülerinnen und Schüler ausmachten. Der maximale Unterschied in den Anteilen betrug demnach 4 %. Weiterhin zeigte sich hier der Unterschied zwischen Pionieren und Überzeugten nur knapp statistisch bedeutsam. Kein Unterschied zeigte sich hingegen im Vergleich zu Schulen des Typs Nicht-Überzeugte: Hier war die soziale Heterogenität der Schülerschaft vergleichbar groß wie in Schulen des Typs Pioniere. Insgesamt erklärte die Zugehörigkeit zu den JÜL-Typen R² = 2 % der Varianz zwischen den Schulen bezüglich des Anteils von Kindern mit Lernmittelzuzahlungsbefreiung. Um unsere Annahme zu prüfen, dass sich die mittleren Leistungen in Deutsch und Mathematik zwischen den Typen der JÜL-Implementation unterscheiden, und zu prüfen, ob sich diese Unterschiede drei Jahre nach dem Ende der Reform anders darstellen als zu Beginn (Forschungsfrage 2), wurden erneut Regressionsmodelle spezifiziert. Die Ergebnisse von Modell 1, in dem die vier Implementationstypen als Prädiktoren berücksichtigt wurden (Tab. 3), zeigen zu Beginn der JÜL-Reform in den beiden untersuchten Kompetenzbereichen (Deutsch und Mathematik) bedeutsame Unterschiede zwischen den JÜL-Typen (siehe Spalten zu M1 in Tab. 3): An den Schulen des Typs Pioniere waren die Leistungen sowohl im Kompetenzbereich Deutsch als auch im Kompetenzbereich Mathematik im Mittel schwächer (b Deutsch = -0.12, p < .05; b Mathematik = -0.10, p < .05). Zu diesem Zeitpunkt zeigten sich zudem statistisch bedeutsame Leistungsunterschiede zwischen den Pionieren auf der einen und allen anderen Typen der JÜL-Implementation auf der anderen Seite. Im Kompetenzbereich Deutsch lagen die Leistungen bis zu 0.34 Standardabweichungen (im Vergleich zum Typ Verweigerer) unterhalb derer an den anderen Schultypen. Im Kompetenzbereich Mathematik lagen die Leistungen bis zu 0.28 Standardabweichungen (im Vergleich zum Typ Verweigerer) unterhalb derer an den anderen Schultypen. In den Schuljahren 2012/ 13 und 2015/ 16 wiesen die Pioniere keine statistisch bedeutsamen Leistungsnachteile im Vergleich zu den anderen Typen der JÜL-Implementation mehr auf. Mithilfe der Typen der JÜL-Implementation konnten bis zu R² = 4 % der Leistungsunterschiede zwischen Schulen erklärt werden (vgl. Modell 1 für Deutsch im Schuljahr 2007/ 08). Nichtdeutsche Erstsprache Lernmittelzuzahlungsbefreiung b SE b SE 2007/ 08 Intercept Verweigerer Nicht-Überzeugte Überzeugte 0.40*** -0.09* -0.13*** -0.03 0.03 0.05 0.04 0.04 0.20*** -0.03 -0.04** -0.04* 0.01 0.02 0.01 0.02 R² .04 .02 Tab. 2: Unterschiede der Zusammensetzung der Schülerschaft zwischen JÜL-Implementationstypen. Ergebnisse der Regressionsanalysen Anmerkungen: Der Intercept bezieht sich auf die Referenzkategorie der Pioniere; b = Regressionskoeffizient, SE = Standardfehler. *** p < .001, ** p < .01, * p < .05. Welche Schulen machen mit beim Jahrgangsübergreifenden Lernen? 27 Deutsch Mathematik M1 M2 M3 M1 M2 M3 b SE b SE b SE b SE b SE b SE 2007/ 08 Intercept Verweigerer Nicht-Überzeugte Überzeugte % Nichtdeutsche Erstsprache % Lernmittelzuzahlungsbefreiung -0.12* 0.22** 0.18** 0.11 0.05 0.08 0.07 0.08 0.59*** 0.09 0.00 0.01 -0.62*** -2.30*** 0.04 0.05 0.04 0.05 0.08 0.20 -0.10* 0.18* 0.14* 0.12 0.04 0.07 0.06 0.07 0.49*** 0.08 0.00 0.03 -0.36*** -2.20*** 0.04 0.05 0.04 0.05 0.08 0.21 R² .03 .66 .02 .55 2012/ 13 Intercept Verweigerer Nicht-Überzeugte Überzeugte % Nichtdeutsche Erstsprache % Lernmittelzuzahlungsbefreiung Ausgangsleistung -0.14** 0.14 0.12 0.13 0.05 0.09 0.07 0.08 0.62*** 0.03 -0.04 0.02 -0.34*** -2.91*** 0.04 0.05 0.04 0.04 0.08 0.20 0.49*** 0.00 -0.05 0.01 -0.25** -2.32*** 0.23*** 0.05 0.05 0.04 0.04 0.09 0.23 0.05 -0.13* 0.10 0.11 0.15 0.05 0.09 0.07 0.08 0.57*** -0.01 -0.03 0.05 -0.30** -2.72*** 0.05 0.06 0.05 0.05 0.11 0.24 0.45*** -0.04 -0.04 0.04 -0.26* -2.08*** 0.27*** 0.06 0.06 0.05 0.05 0.10 0.29 0.06 R² .01 .71 .73 .01 .57 .60 2015/ 16 Intercept Verweigerer Nicht-Überzeugte Überzeugte % Nichtdeutsche Erstsprache % Lernmittelzuzahlungsbefreiung Ausgangsleistung -0.08 0.10 0.04 0.07 0.05 0.08 0.07 0.08 0.63*** -0.03 -0.13** -0.05 -0.26** -5.51*** 0.04 0.05 0.04 0.05 0.09 0.41 0.46*** -0.06 -0.13** -0.07 -0.15 -4.13*** 0.27*** 0.05 0.05 0.04 0.04 0.09 0.48 0.05 -0.10* 0.13 0.09 0.11 0.04 0.07 0.06 0.07 0.43*** 0.03 -0.03 0.01 -0.11 -4.50*** 0.05 0.06 0.04 0.05 0.10 0.46 0.30*** 0.00 -0.04 0.00 -0.07 -3.15*** 0.28*** 0.05 0.05 0.04 0.05 0.10 0.53 0.06 R² .00 .65 .67 .01 .47 .50 Tab. 3: Unterschiede der mittleren Leistung zwischen JÜL-Implementationstypen in Deutsch und Mathematik in den Schuljahren 2007/ 08 (vor der Reform), 2012/ 13 (zum Ende der Reform) und 2015/ 16 (nach der Reform). Ergebnisse der Regressionsanalysen Anmerkungen: Der Intercept bezieht sich auf die Referenzkategorie der Pioniere; b = Regressionskoeffizient, SE = Standardfehler. *** p < .001, ** p < .01, * p < .05. 28 Katharina Thoren, Bettina Hannover, Martin Brunner In Modell 2 (Tab. 3) wurden zusätzlich die Anteile der Kinder mit nichtdeutscher Erstsprache und mit Lernmittelzuzahlungsbefreiung als heterogenitätserzeugende Merkmale aufgenommen und für ihren Einfluss kontrolliert (M2 in Tab. 3). Die Ergebnisse zeigen, dass vor der Reform (2007/ 08) und zum Ende der Reform (2012/ 13), unter Kontrolle der beiden Heterogenitätsindikatoren, keine leistungsbezogenen Unterschiede, weder in Deutsch noch in Mathematik, zwischen den JÜL-Schultypen bestanden. Lediglich im Schuljahr 2015/ 16, drei Jahre nach Ende der Reform, zeigten sich leistungsbezogene Nachteile von 0.13 Standardabweichungen für Schulen des Typs Nicht-Überzeugte im Vergleich zu den Pionieren im Kompetenzbereich Deutsch. Insgesamt konnten zwischen R² = 61 % und R² = 65 % der Leistungsvarianz zwischen Schulen im Bereich Deutsch und zwischen R² = 47 % und R² = 57 % der Leistungsvarianz zwischen Schulen im Bereich Mathematik durch die JÜL-Typen und die Merkmale der Klassenzusammensetzung aufgeklärt werden. Ein zu Modell 2 vergleichbares Ergebnismuster zeigte sich auch für Modell 3, in dem zusätzlich für die Ausgangsleistung in Deutsch bzw. in Mathematik im Schuljahr 2007/ 08 kontrolliert wurde. Bei gleicher Ausgangsleistung, gleichen Anteilen von Kindern mit nichtdeutscher Erstsprache und mit Lernmittelzuzahlungsbefreiung unterschied sich die Deutschleistung bzw. die Mathematikleistung, von wenigen Ausnahmen abgesehen, nicht zwischen den JÜL-Schultypen. Lediglich im Schuljahr 2015/ 16 zeigten sich (wie bei M2) leistungsbezogene Nachteile für Schulen des Typs Nicht- Überzeugte von 0.13 Standardabweichungen im Vergleich zu den Pionieren im Kompetenzbereich Deutsch. Insgesamt konnten in diesen Modellen etwa R² = 70 % der Leistungsvarianz in Deutsch und zwischen R² = 50 % und R² = 60 % der Leistungsvarianz in Mathematik durch die JÜL-Typen und die Merkmale der Klassenzusammensetzung erklärt werden. Diskussion Merkmale der Einzelschule sind ein maßgeblicher Faktor, die die Implementation von Reformen befördern oder hemmen können (Gräsel & Parchmann, 2004; Hall & Hord, 2015). In dieser Studie haben wir erstmals auf Grundlage einer großen Stichprobe von Berliner Grundschulen untersucht, inwiefern Schulen, die JÜL in unterschiedlichem Ausmaß und zu unterschiedlichen Zeitpunkten implementiert haben, sich in der (a) Heterogenität ihrer Schülerschaft hinsichtlich Erstsprache und Lernmittelzuzahlungsbefreiung zu Beginn der Reform und (b) dem Leistungsstand der Kinder in Deutsch und Mathematik zu Beginn, zum Ende und drei Jahre nach Ende der Einführung von JÜL unterschieden haben. Da die JÜL-Reform mit der Hoffnung verbunden war, einen produktiven Umgang mit Heterogenität zu unterstützen, hatten wir erwartet, dass Schulen, die besonders früh und besonders umfassend jahrgangsübergreifenden Unterricht eingeführt hatten, die sog. Pioniere, durch eine Schülerschaft charakterisiert sind, die in ihrer kulturellen und sozialen Herkunft besonders heterogen ist: Stärker als andere Schulen sollten sie in JÜL eine Möglichkeit gesehen haben, dieser Herausforderung mit einer systematischen Vergrößerung der Heterogenität durch altersgemischte Lerngruppen zu begegnen. Unsere Ergebnisse zeigten erwartungsgemäß, dass Schulen des Typs Pioniere von anteilig mehr Kindern mit nichtdeutscher Erstsprache besucht wurden, diese Schulen also bzgl. der kulturellen Herkunft ihrer Schülerschaft heterogener waren als Schulen der Typen Nicht- Überzeugte und Verweigerer. Jedoch unterschieden sich die Schulen des Typs der Überzeugten nicht von den Pionieren hinsichtlich dieses heterogenitätserzeugenden Merkmals. In Hinblick auf die Heterogenität der sozialen Herkunft der Schülerschaft, gemessen über die Anteile von Kindern mit Lernmittelzuzahlungsbefreiung, unterschieden sich die Schulen der vier JÜL- Implementationstypen weniger deutlich voneinander, als dies für die Heterogenität der kulturellen Herkunft, gemessen über Erstsprache, Welche Schulen machen mit beim Jahrgangsübergreifenden Lernen? 29 der Fall war. Konsistent mit unseren Vorhersagen war die soziale Heterogenität jedoch an den Pionier-Schulen größer als an Schulen der Typen Nicht-Überzeugte und Überzeugte. Anders als erwartet fanden wir jedoch keinen Unterschied in der sozialen Heterogenität der Schülerschaft zwischen Schulen des Typs Verweigerer und den Pionier-Schulen. Zusammenfassend weisen diese Ergebnisse darauf hin, dass sich insbesondere Schulen mit einer stark heterogenen Schülerschaft für eine frühzeitige und langfristige Umsetzung von JÜL entschieden hatten. Die JÜL-Schulen unserer Stichprobe, insbesondere die Pioniere, haben mit einer stärkeren Heterogenität in ihrer Schülerschaft umzugehen und zeigten sich möglicherweise vor diesem Hintergrund als innovativer und begaben sich eher auf die Suche nach Lösungen (Hermann, 2010; Reynolds et al., 2014). Interessant ist dabei, dass die Schulen der Nicht-Überzeugten im Vergleich zu den Pionier-Schulen eine bedeutsam weniger heterogene Schülerschaft hatten, also geringere Anteile von Kindern mit nichtdeutscher Erstsprache und Lernmittelzuzahlungsbefreiung. Es zeigen sich demnach konsistente Unterschiede zwischen den Pionier-Schulen auf der einen Seite und den Nicht-Überzeugten auf der anderen Seite. Für Überzeugte und Verweigerer hingegen zeigten sich die erwarteten Unterschiede zu den Pionieren nur in jeweils einem der beiden Heterogenitätskriterien und wenn, dann auch nur knapp statistisch bedeutsam. Obwohl die Zugehörigkeit zu einem der JÜL-Typen nur einen eher geringen Teil der Varianz der sozialen und kulturellen Heterogenität der Schülerschaft zwischen Schulen erklären konnte, kann angenommen werden, dass insbesondere die Unterschiede in den Anteilen von Schülerinnen und Schülern mit nichtdeutscher Erstsprache mit bis zu 13 % in der Wahrnehmung der Lehrpersonen, Schülerinnen und Schüler sowie ihrer Eltern einen bedeutsamen Unterschied ausmachen und somit praktische Relevanz haben, also z. B. die Einstellung von Lehrkräften oder Schulleitungen gegenüber der JÜL-Reform beeinflusst haben könnten. Die Unterschiede in den Anteilen von Schülerinnen und Schülern mit Lernmittelzuzahlungsbefreiung fielen mit bis zu 4 % wesentlich geringer aus, sodass dieses Merkmal für JÜL-Implementation einen vergleichsweise geringeren Einfluss zu haben scheint. Unsere zweite Forschungsfrage richtete sich darauf, ob sich die Leistungsstände der Kinder in den Kompetenzbereichen Mathematik und Deutsch in Abhängigkeit davon, wie schnell und umfassend ihre Schule JÜL implementiert hatte, über die Zeit differenziell entwickeln würden. Unsere Ergebnisse zeigen, dass Schulen des Typs Pioniere im Schuljahr 2007/ 08 mit bedeutsam niedrigeren Leistungen in die (verpflichtende) Implementation von JÜL starteten, im Vergleich zu Schulen des Typs Nicht-Überzeugte und Verweigerer. Die Größe dieser Unterschiede war mit rund 0.30 Standardabweichungen als hoch einzustufen (Hill, Bloom, Rebeck Black & Lipsey, 2008). Dennoch zeigte sich auch hier, wie bei den Ergebnissen zur Zusammensetzung der Schülerschaft, dass lediglich ein geringer Anteil der Varianz mithilfe der Zugehörigkeit zu einem der Implementationstypen erklärt werden konnte. Weiterhin zeigt sich, dass sich die Leistungen in Deutsch und Mathematik der Kinder an Schulen des Typs Pioniere zum Ende der Reform im Schuljahr 2012/ 13 nicht mehr bedeutsam von denen der Kinder an Schulen der anderen Typen unterschieden (im Lesen zeigte sich sogar ein Leistungsvorsprung der Pioniere gegenüber den Nicht-Überzeugten). Wurde für die Heterogenität der Schülerschaft sowie für das mittlere Leistungsniveau der Kinder kontrolliert, war der leistungsbezogene Nachteil für Schulen des Typs Pioniere zunächst nicht mehr sichtbar, und zwar auch nicht zum Zeitpunkt vor Einführung der Reform im Jahre 2007/ 08. Lediglich im Schuljahr 2015/ 16 waren für den Kompetenzbereich Deutsch für Schulen des Typs Nicht-Überzeugte auch nach Kontrolle der Zusammensetzung der Schülerschaft leistungsbezogene Nachteile im Vergleich zu Schulen des Typs der Pioniere feststellbar. Die Größe dieser Unterschiede war mit rund 0.13 Standardabweichungen als relativ klein einzu- 30 Katharina Thoren, Bettina Hannover, Martin Brunner stufen (Hill et al., 2008). Dass die Leistungsunterschiede in Mathematik und Deutsch zwischen den Pionier-Schulen und den anderen Schulen weder zum Ende der Reform noch drei Jahre danach statistisch bedeutsam waren, galt unabhängig davon, ob für die Heterogenität der Schülerschaft und die Ausgangsleistung der Kinder kontrolliert worden war oder nicht. Dies bedeutet, dass sich die Leistungen der Kinder an den Schulen der unterschiedlichen JÜL- Implementationstypen über den Verlauf der neun Jahre vom Beginn der Reform bis drei Jahre nach Ende der Reform deutlich angeglichen haben. Diese Angleichung kann als Hinweis darauf verstanden werden, dass die mindestens neunjährige Erfahrung mit JÜL den Schulen dabei geholfen hat, mit ihrer heterogenen Schülerschaft leistungsförderlich zu arbeiten. Eine Prüfung dieser Vermutung würde allerdings eine Analyse der Leistungsdaten für nachfolgende Schuljahre erfordern. Bei der Interpretation unserer Ergebnisse sind einige Limitationen zu beachten: Die der Studie zugrunde liegenden Daten ermöglichten lediglich die Gegenüberstellung von Lernenden mit deutscher vs. nichtdeutscher Erstsprache sowie Lernenden mit und ohne Lernmittelzuzahlungsbefreiung. Zwar lassen die Befunde von Rjosk et al. (2017) vermuten, dass unsere Ergebnisse, die wir unter Verwendung einer dem Mehrheiten-Minderheiten-Ansatz folgenden Operationalisierung von Heterogenität erzielt haben, ähnlich ausgefallen wären, hätten wir eine dem Diversitätsansatz folgende Operationalisierung von Heterogenität gewählt (z. B. die Anzahl verschiedener Erstsprachen innerhalb einer Klasse ermittelt). Einen direkten empirischen Beleg für diese Annahme liefert unsere Studie jedoch nicht. Eine weitere Limitation besteht darin, dass die JÜL-Schultypen auf der Grundlage des Anteils von JÜL-Klassen an der Gesamtklassenanzahl der Schulanfangsphase gebildet worden waren, also einem rein quantitativen Maß, das keine Rückschlüsse über die Qualität der JÜL-Implementation an der jeweiligen Schule erlaubt (siehe dazu auch Thoren & Brunner, 2018). Insgesamt, die zahlreichen Faktoren ergänzend, die sich in früheren Studien als bedeutsam für die Implementation von Schulreformen erwiesen haben (vgl. u. a. Goldenbaum, 2012; Hasselhorn et al., 2014), zeigt unsere Studie, dass die Heterogenität der Schülerschaft hinsichtlich Erstsprache und Lernmittelzuzahlungsbefreiung einen, wenn auch eher kleinen, Einfluss darauf genommen hat, ob und, wenn ja, auf welche Weise Schulen eine Reform implementiert haben, die Heterogenität nicht nur als Herausforderung, sondern auch als Antwort auf diese Herausforderung begreift: den jahrgangsübergreifenden Unterricht. Diese Ergebnisse sprechen dafür, dass umfassende Reformen, wie die Einführung von JÜL, nicht für alle Schulen in gleichem Maße attraktiv sind. Insbesondere bei top-down initiierten Reformen könnte eine Beratung der Schulen, welche Vorteile die Implementation in ihrem Fall mit sich bringt, die Akzeptanz und somit die tatsächliche Umsetzung erhöhen. Die Akzeptanz einer Reform gilt als Grundvoraussetzung für ihre erfolgreiche Umsetzung und damit auch für ihre Wirksamkeit (Coburn, 2003; Gräsel & Parchmann, 2004; Pant, Vock, Pöhlmann & Köller, 2008). Für Schulen, für die eine Reform attraktiv und erfolgversprechend ist, lässt sich eine höhere Wirksamkeit erwarten als für Schulen, die - unvollständig oder zeitverzögert - etwas in die Tat umsetzen, von dem sie nicht überzeugt sind. Abschließend, was das jahrgangsübergreifende Lernen betrifft, kann angenommen werden, dass sich die Attraktivität der Reform mit der Umsetzung der Inklusion in deutschen Schulen weiter erhöhen wird. Literatur Baumert, J., Maaz, K., Stanat, P. & Watermann, R. (2009). Schulkomposition oder Institution: Was zählt? Schulstrukturen und die Entstehung schulformspezifischer Entwicklungsverläufe. Die Deutsche Schule, 101, 33 - 46. Baumert, J., Stanat, P. & Watermann, R. (Hrsg.). (2006). Herkunftsbedingte Disparitäten im Bildungswesen: Differenzielle Bildungsprozesse und Probleme der Verteilungsgerechtigkeit. Vertiefende Analysen im Rahmen von PISA 2000 (1. Aufl.). Wiesbaden: VS Verlag für Sozialwissenschaften. Welche Schulen machen mit beim Jahrgangsübergreifenden Lernen? 31 Budescu, D. V. & Budescu, M. (2012). How to measure diversity when you must. Psychological Methods, 17, 215 - 227. https: / / dx.doi.org/ 10.1037/ a0027129 Carle, U. (2013). Jahrgangsübergreifendes Lernen. Worauf kommt es an? Die Grundschulzeitschrift, 27 (270), 4 - 5. Carle, U. & Metzen, H. (2014). Wie wirkt jahrgangsübergreifendes Lernen? Internationale Literaturübersicht zum Stand der Forschung, der praktischen Expertise und der pädagogischen Theorie. Eine wissenschaftliche Expertise des Grundschulverbandes. Frankfurt a. M.: Grundschulverband. Coburn, C. E. (2003). Rethinking Scale: Moving beyond numbers to deep and lasting change. Educational Researcher, 32 (6), 3 - 12. https: / / dx.doi.org/ 10.3102/ 001 3189X032006003 Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16, 297 - 334. https: / / dx.doi.org/ 10.1007/ BF02310555 Decristan, J., Fauth, B., Kunter, M., Büttner, G. & Klieme, E. (2017). The interplay between class heterogeneity and teaching quality in primary school. International Journal of Educational Research, 86, 109 - 121. https: / / dx.doi.org/ 10.1016/ j.ijer.2017.09.004 Dumont, H., Neumann, M., Maaz, K. & Trautwein, U. (2013). Die Zusammensetzung der Schülerschaft als Einflussfaktor für Schulleistungen. Internationale und nationale Befunde. Psychologie in Erziehung und Unterricht, 60, 163 - 183. https: / / dx.doi.org/ 10.2378/ peu2013.art14d Frank, C. (2007). Auf neuen Wegen. Jahrgangsgemischter Unterricht in einer baden-württembergischen Grundschule. Grundschule, 39 (11), 14 - 16. Fullan, M. (2000). The return of large-scale reform. Journal of Educational Change, 1, 5 - 27. https: / / dx.doi.org/ 10. 1023/ A: 1010068703786 Goldenbaum, A. (2012). Innovationsmanagement in Schulen: Eine empirische Untersuchung zur Implementation eines Sozialen Lernprogramms. Wiesbaden: VS Verlag für Sozialwissenschaften. https: / / dx.doi.org/ 10.1007/ 978-3- 531-19425-7 Gräsel, C. & Parchmann, I. (2004). Implementationsforschung - oder: Der steinige Weg, Unterricht zu verändern. Unterrichtswissenschaft, 32, 196 - 214. Gutierrez, R. & Slavin, R. E. (1992). Achievement effects of the nongraded elementary school. A best evidence synthesis. Review of Educational Research, 62, 333 - 376. https: / / dx.doi.org/ 10.3102/ 00346543062004333 Hall, G. E. & Hord, S. M. (2015). Implementing change. Patterns, principles, and potholes (4th. ed.). Boston, MA: Pearson. Hasselhorn, M., Köller, O., Maaz, K. & Zimmer, K. (2014). Implementation wirksamer Handlungskonzepte im Bildungsbereich als Forschungsaufgabe. Psychologische Rundschau, 65, 140 - 149. https: / / dx.doi.org/ 10.1026/ 0033-3042/ a000216 Hattie, J. A. C. (2009). Visible Learning. A synthesis of over 800 meta-analyses relating to achievement. London: Routledge. Hermann, J. (2010). Abschlussbericht zum Projekt „Schulentwicklung im System - Unterstützung von Schulen in schwieriger Lage“. Hamburg: Landesinstitut. Hill, C. J., Bloom, H. S., Rebeck Black, A. & Lipsey, M. W. (2008). Empirical benchmarks for interpreting effect sizes in research. Child Development Perspectives, 2, 172 - 177. https: / / dx.doi.org/ 10.1111/ j.1750-8606. 2008.00061.x Holtappels, H. G. (1995). Schulkultur und Innovation - Ansätze, Trends und Perspektiven der Schulentwicklung. In H. G. Holtappels (Hrsg.), Entwicklung von Schulkultur: Ansätze und Wege schulischer Erneuerung. Neuwied: Luchterhand. ISQ (2017). Vergleichsarbeiten. Institut für Schulqualität der Länder Berlin und Brandenburg e.V. Klesmann, M. (2011, 17. September). Zwei Schulleiterinnen streiten über das jahrgangsübergreifende Lernen in der Grundschule. Die eine will es ausweiten - die andere will es loswerden: „Von oben herab verordnet“. Berliner Zeitung. Zugriff am 23. 10. 2018 unter https: / / www.berliner-zeitung.de/ zwei-schulleiterinnen-strei ten-ueber-das-jahrgangsuebergreifende-lernen-in-dergrundschule--die-eine-will-es-ausweiten---die-anderewill-es-loswerden--von-oben-herab-verordnet--15151 678 KMK (2006). Gesamtstrategie der Kultusministerkonferenz zum Bildungsmonitoring. Berlin: Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland. KMK (2015). Gesamtstrategie der Kultusministerkonferenz zum Bildungsmonitoring. Beschluss der 350. Kultusministerkonferenz vom 11. 6. 2015. Berlin: Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland. Kucharz, D. & Wagener, M. (2007). Jahrgangsübergreifendes Lernen: Eine empirische Studie zu Lernen, Leistung und Interaktion von Kindern in der Schuleingangsphase (Bd. 4). Baltmannsweiler: Schneider Verlag Hohengehren. Kuhl, P., Felbrich, A., Richter, D., Stanat, P. & Pant, H. A. (2013). Die Jahrgangsmischung auf dem Prüfstand: Effekte jahrgangsübergreifenden Lernens auf Kompetenzen und sozio-emotionales Wohlbefinden von Grundschülerinnen und Grundschülern. In R. Becker & A. Schulze (Hrsg.), Bildungskontexte. Strukturelle Voraussetzungen und Ursachen ungleicher Bildungschancen (S. 299 - 324). Wiesbaden: Springer Fachmedien. https: / / dx.doi.org/ 10.1007/ 978-3-531-18985-7_11 Lieberson, S. (1969). Measuring population diversity. American Sociological Review, 34 (6), 850 - 862. https: / / dx.doi.org/ 10.2307/ 2095977 Liebers, K., Prengel, A. & Bieber, G. (Hrsg.). (2008). Die flexible Schuleingangsphase. Evaluationen zur Neugestaltung des Anfangsunterrichts. Weinheim: Beltz. Muthén, L. K. & Muthén, B. O. (1998 - 2014). Mplus user’s guide. Los Angeles, LA: Muthén & Muthén. Pant, H. A., Vock, M., Pöhlmann, C. & Köller, O. (2008). Eine modellbasierte Erfassung der Auseinandersetzung von Lehrkräften mit den länderübergreifenden Bildungsstandards. In Eva-Maria L. (Hrsg.), Pädagogische Professionalität als Gegenstand empirischer Forschung (S. 245 - 260). Münster: Waxmann. R Core Team (2017). R: A language and environment for statistical computing [Computer software]. Wien: R Foundation for Statistical Computing. Reynolds, D., Sammons, P., Fraine, B. D., van Damme, J., Townsend, T., Teddlie, C. & Stringfield, S. (2014). Educational effectiveness research (EER): A state-ofthe-art review. School Effectiveness and School Improvement, 25, 197 - 230. https: / / dx.doi.org/ 10.1080/ 092 43453.2014.885450 Rjosk, C., Richter, D., Lüdtke, O. & Eccles, J. S. (2017). Ethnic composition and heterogeneity in the classroom: Their measurement and relationship with student outcomes. Journal of Educational Psychology, 109, 1188 - 1204. https: / / dx.doi.org/ 1188.10.1037/ edu0000185 32 Katharina Thoren, Bettina Hannover, Martin Brunner Robitzsch, A., Kiefer, T. & Wu, M. L. (2018). TAM: Test analysis modules. R package version 2.10 - 24. [Computer software]. Roßbach, H.-G. & Wellenreuther, M. (2002). Empirische Forschungen zur Wirksamkeit von Methoden der Leistungsdifferenzierung in der Grundschule. In F. Heinzel & A. Prengel (Hrsg.), Heterogenität, Integration und Differenzierung in der Primarstufe (Jahrbuch Grundschulforschung, Bd. 6, S. 44 - 57). Opladen: Leske + Budrich. Rost, J. (1996). Lehrbuch Testtheorie - Testkonstruktion. Bern: Huber. Scharenberg, K. (2012). Leistungsheterogenität und Kompetenzentwicklung. Zur Relevanz klassenbezogener Kompositionsmerkmale im Rahmen der KESS-Studie (Empirische Erziehungswissenschaft, Bd. 36, 1. Aufl.). Münster: Waxmann. SenBJW. (2016). Bildungsstatistik. Zugriff unter www.ber lin.de/ sen/ bildung/ schule/ bildungsstatistik SenBWF (Hrsg.). (2009). Bildung für Berlin - Die flexible Schulanfangsphase [Broschüre]. Berlin: Senatsverwaltung für Bildung, Wissenschaft und Forschung. Thoren, K. (2017). Implementationserfolg von Schulreformen in der Berliner Schulanfangsphase. Unveröffentlichte Dissertation, Freie Universität Berlin. Zugriff am 23. 10. 2018 unter https: / / refubium.fu-berlin.de/ handle/ fub188/ 6545 Thoren, K., Bröder, C., Gelke, A.-M. & Brunner, M. (2016). Evaluation des Jahrgangsübergreifenden Lernens in der Berliner Schulanfangsphase. Berlin: Freie Universität Berlin, ISQ. Thoren, K. & Brunner, M. (2018). Flächendeckende Implementation des Jahrgangsübergreifenden Lernens: Welche Typen gibt es und zeigen diese Unterschiede in der Schul- und Unterrichtsqualität? Zeitschrift für Erziehungswissenschaft. https: / / dx.doi.org/ 10.1007/ s1 1618-018-0841-z Van Ewijk, R. & Sleegers, P. (2010). Peer ethnicity and achievement. A meta-analysis into the compositional effect. School Effectiveness and School Improvement, 21, 237 - 265. https: / / dx.doi.org/ 10.1080/ 092434510036 12671 Veenman, S. (1995). Cognitive and noncognitive effects of multigrade and multi-age classes. A best-evidence synthesis. Review of Educational Research, 65, 319 - 381. https: / / dx.doi.org/ 10.3102/ 00346543065004319 Veenman, S. (1996). Effects of multigrade and multi-age classes reconsidered. Review of Educational Research, 66, 323 - 340. https: / / dx.doi.org/ 10.3102/ 00346543 066003323 Vettorazzi, K., Schilling, A. L., Harych, P. & Brunner, M. (2017). VERA 3 Vergleichsarbeiten in der Jahrgangsstufe 3 im Schuljahr 2015/ 16. Landesbericht Berlin. Berlin: Institut für Schulqualität der Länder Berlin und Brandenburg e.V. Vieth-Entus, S. (2008, 16. September). Interview: „Das ist nichts für schwierige Kinder“. Der Tagesspiegel. Zugriff am 23. 10. 2018 unter http: / / www.tagesspiegel.de/ berlin/ interview-das-ist-nichts-fuer-schwierige-kin der/ 1325556.html Vieth-Entus, S. (2009, 26. Mai). Grundschulreform: Altersgemischte Klassen bleiben umstritten. Der Tagesspiegel. Zugriff am 23. 10. 2018 unter http: / / www. tagesspiegel.de/ berlin/ schule/ grundschulreformaltersgemischte-klassen-bleiben-umstritten/ 1521500. html Vieth-Entus, S. (2011, 15. September). Brandbrief: Immer mehr Schulen gegen Jahrgangsmischung. Der Tagesspiegel. Zugriff am 23. 10. 2018 unter https: / / www.tages spiegel.de/ berlin/ brandbrief-immer-mehr-schulengegen-jahrgangsmischung/ 4613800.html Zulliger, S. & Tanner, S. (2013). Der Begriff Heterogenität in empirischen Studien. Schweizerische Zeitschrift für Bildungswissenschaften, 35 (1), 37 - 52. Dr. Katharina Thoren Prof. Dr. Bettina Hannover Freie Universität Berlin Fachbereich Erziehungswissenschaft und Psychologie Arbeitsbereich Schul- und Unterrichtsforschung Habelschwerdter Allee 45 D-14195 Berlin E-Mail: katharina.thoren@fu-berlin.de bettina.hannover@fu-berlin.de Prof. Dr. Martin Brunner Universität Potsdam Erziehungswissenschaft Professur Quantitative Methoden in den Bildungswissenschaften Karl-Liebknecht-Str. 24 -25 D-14476 Potsdam E-Mail: mabrunner@uni-potsdam.de
