Psychologie in Erziehung und Unterricht
3
0342-183X
Ernst Reinhardt Verlag, GmbH & Co. KG München
10.2378/peu2018.art01d
3_065_2018_1/3_065_2018_1.pdf11
2018
651
Empirische Arbeit: Eine Mehrebenenanalyse zur Schülerwahrnehmung von Störungen im Unterricht der Klassen- und einer Fachlehrperson
11
2018
Alexander Wettstein
Erich Ramseier
Marion Scherzinger
In einer Studie mit 1290 Schülerinnen und Schülern aus 83 Klassen wurde mittels konfirmatorischer Mehrebenen-Faktorenanalyse untersucht, wie Schülerinnen und Schüler aggressive und nicht aggressive Störungen im Unterricht der Klassenlehrperson und im Unterricht einer Fachlehrperson wahrnehmen. Die Ergebnisse zeigten, dass die Intraklassenkorrelationen der Schülerurteile ausreichend hoch waren, um von einer geteilten Unterrichtswahrnehmung zu sprechen. Die Schülerinnen und Schüler differenzierten vier Dimensionen von Unterrichtsstörungen: nicht aggressive Schülerstörungen, aggressives Schülerverhalten, aggressives Verhalten der Lehrperson sowie Störungen des methodisch-didaktischen Settings. Die Schülerinnen und Schüler berichteten im Unterricht der Fachlehrperson mehr Störungen des methodisch-didaktischen Settings, eine weniger ausgeprägte Beziehung und mehr Schwierigkeiten in der Klassenführung, jedoch weniger Schüleraggression als im Unterricht der Klassenlehrperson. Insgesamt weisen die Ergebnisse auf eine gute Konstruktvalidität hin.
3_065_2018_1_0002
n Empirische Arbeit Psychologie in Erziehung und Unterricht, 2018, 65, 1 -16 DOI 10.2378/ peu2018.art01d © Ernst Reinhardt Verlag München Basel Eine Mehrebenenanalyse zur Schülerwahrnehmung von Störungen im Unterricht der Klassen- und einer Fachlehrperson Alexander Wettstein, Erich Ramseier, Marion Scherzinger Pädagogische Hochschule Bern Zusammenfassung: In einer Studie mit 1290 Schülerinnen und Schülern aus 83 Klassen wurde mittels konfirmatorischer Mehrebenen-Faktorenanalyse untersucht, wie Schülerinnen und Schüler aggressive und nicht aggressive Störungen im Unterricht der Klassenlehrperson und im Unterricht einer Fachlehrperson wahrnehmen. Die Ergebnisse zeigten, dass die Intraklassenkorrelationen der Schülerurteile ausreichend hoch waren, um von einer geteilten Unterrichtswahrnehmung zu sprechen. Die Schülerinnen und Schüler differenzierten vier Dimensionen von Unterrichtsstörungen: nicht aggressive Schülerstörungen, aggressives Schülerverhalten, aggressives Verhalten der Lehrperson sowie Störungen des methodisch-didaktischen Settings. Die Schülerinnen und Schüler berichteten im Unterricht der Fachlehrperson mehr Störungen des methodisch-didaktischen Settings, eine weniger ausgeprägte Beziehung und mehr Schwierigkeiten in der Klassenführung, jedoch weniger Schüleraggression als im Unterricht der Klassenlehrperson. Insgesamt weisen die Ergebnisse auf eine gute Konstruktvalidität hin. Schlüsselbegriffe: Unterrichtsstörungen, Schülerwahrnehmung, Faktorenanalyse, Mehrebenenanalyse A Multilevel Analysis of Student Perceptions of Classroom Disturbances in the Lessons of the Class Teacher and One Subject Teacher Summary: The aim of the present study was to investigate students’ perceptions of aggressive and nonaggressive disturbances in the lessons of the class teacher and a subject teacher. A total of 1290 students from 83 primary school classes participated. The intraclass correlation coefficients of the student ratings were high enough in order to speak of a shared perception. Results of a multilevel confirmatory factor analysis showed that the students differentiated four dimensions of classroom disturbances: non-aggressive student behavior, aggressive student behavior, aggressive teacher behavior, and disturbances of the setting. Students reported more disturbances, a less pronounced relationship, challenges in classroom management and less student aggression in the lessons of the subject teachers than in the lessons of the class teachers. Overall, the results indicate good construct validity. Keywords: Classroom disturbances, student perception, factor analysis, multilevel analysis Unterrichtsstörungen Störungen im Unterricht werden aus einer individuumszentrierten Perspektive meist einseitig Schülerinnen und Schülern zugeschrieben. Doch auch Lehrpersonen können durch mangelnde Unterrichtsorganisation oder herabsetzendes Verhalten zu Störungen beitragen. Aus einer interaktionalen Perspektive können Störungen im Unterricht als relationales Geschehen definiert werden (Wettstein, 2010; Winkel, 2005). Nach dieser Auffassung liegt eine Störung dann vor, wenn der Lehr-Lern-Prozess erschwert oder sogar verhindert wird. Grundsätzlich lassen sich vor dem Hintergrund einer interaktionistischen Sichtweise zahlreiche For- 2 Alexander Wettstein, Erich Ramseier, Marion Scherzinger men von Unterrichtsstörungen unterscheiden. Diese wurden bisher jedoch kaum systematisiert. Wir unterscheiden zwischen nicht aggressiven Störungen der Schülerinnen und Schüler, aggressivem Schülerverhalten, aggressivem Verhalten der Lehrperson sowie Störungen des methodisch-didaktischen Settings. Während sich ein guter Unterricht durch eine hohe Dichte an Lehr-Lern-Prozessen auszeichnet, kommt es im gestörten Unterricht zu zahlreichen Brüchen im Unterrichtsverlauf (Wettstein, 2010). Unterrichtsstörungen stellen sowohl eine Belastung für Schülerinnen und Schüler wie auch für Lehrpersonen dar. Störungen im Unterricht stehen in einem engen Zusammenhang mit Burnout bei Lehrpersonen (Brouwers & Tomic, 1999, 2000; Evers, Tomic & Brouwers, 2004; Friedman, 2006) und werden von diesen als Hauptmotiv für den Berufsausstieg (Herzog, Herzog, Brunner & Müller, 2005; Ingersoll, 2001; Lewis, Romi, Qui & Katz, 2005; Makarova, Herzog & Schönbächler, 2014) sowie Frühpensionierung (Helmke, 2009) genannt. Störungen im Unterricht beeinträchtigen auch die kognitive und soziale Entwicklung der Schülerinnen und Schüler. Eine störungspräventive Klassenführung, eine gute Lehrer- Schüler-Beziehung (Hattie, 2009; Wentzel, 2004) und eine effektiv genutzte Lernzeit (Helmke, 2009) gelten als wesentliche Faktoren für die Lernmotivation und den Lernerfolg von Schülerinnen und Schülern. Unterrichtsstörungen belasten die Lehrer-Schüler-Beziehung, reduzieren die effektiv genutzte Lernzeit (Wettstein, 2010) und können in einigen Fällen sogar zu einem frühzeitigen Schulausschluss führen (Vitaro, Brendgen & Tremblay, 1999). Die Erfassung von Unterrichtsstörungen aus Schülersicht Die Befragung von Schülerinnen und Schülern ist ökonomisch und mit einem geringen Erhebungsaufwand verbunden. Sie hat zudem den konzeptuellen Vorteil, dass sich die Einschätzungen auf eine große Verhaltensstichprobe in der gleichen Unterrichtsumgebung beziehen und sich das Urteil der Schülerinnen und Schüler nicht nur auf eine Lektion bezieht, sondern auf langfristigen Erfahrungen im Unterricht dieser Lehrperson gründen (Wagner, Göllner, Helmke, Trautwein & Lüdtke, 2013). Gleichzeitig stellt sich aber die Frage, inwieweit Schülerinnen und Schüler in ihren Einschätzungen des Unterrichts übereinstimmen und welche möglichen Verzerrungen (Halo-Effekte und mögliche Beeinflussung der Wahrnehmung durch verschiedene Persönlichkeitsmerkmale wie z. B. Störungssensitivität) auftreten können. Bisher wenig beachtet, aber von Interesse ist auch, ob sich in den individuellen Wahrnehmungsunterschieden Muster abzeichnen, die als Personenmerkmale interpretiert werden können. Weiter stellt sich die Frage, welche Dimensionen von Unterrichtsstörungen Schülerinnen und Schüler unterscheiden. Über die Qualität und die Anzahl inhaltlicher Dimensionen des Konstrukts besteht bisher kein Konsens. Methodisch werden bei Schülerbefragungen die individuellen Einschätzungen von Unterrichtsmerkmalen oft zu Klassenmittelwerten zusammengefasst. Damit werden die Unterschiede zwischen den individuellen Einschätzungen einzelner Schülerinnen und Schüler herausgemittelt (Lüdtke, Trautwein, Kunter & Baumert, 2006). Dabei bleibt jedoch unklar, wie reliabel die aggregierten Klassenmittelwerte sind und inwieweit die Schülerinnen und Schüler in ihrer Wahrnehmung des Unterrichts übereinstimmen. Wenn Schülerinnen und Schüler - wie alle Beobachter - in ihrer Einschätzung auch nur zufällig variieren, variieren auch die Klassenmittelwerte, ohne dass dies ein Indiz für systematische Unterschiede zwischen dem Unterricht in verschiedenen Klassen wäre. Um individuelle Wahrnehmungen einzelner Schülerinnen und Schüler von systematischen Unterschieden in der kollektiv geteilten Wahrnehmung einer Klasse zu unterscheiden, müssen in einer Mehrebenenanalyse (z. B. Hox, 2010) die Variation zwischen den Einschätzungen der Schülerinnen und Schüler innerhalb einer Klasse (within-Ebene) wie auch die Variation zwischen den Schulklassen (Klassenebene) einbezo- Schülerwahrnehmung von Störungen im Unterricht 3 gen werden. Nur wenn das Verhältnis zwischen der Varianz auf Klassenebene an der Gesamtvarianz (Intraklassenkorrelation) mindestens 5 % beträgt (Lüdtke, Robitzsch, Trautwein & Kunter, 2009; Lüdtke et al., 2006), kann von einer geteilten Wahrnehmung ausgegangen werden. Da in Schülerbefragungen Unterrichtsmerkmale üblicherweise nicht direkt, sondern über die Einschätzung mehrerer zugehöriger Items erfasst werden, wird idealerweise auch das Ausmaß dieser internen Konsistenz in einer konfirmatorischen Mehrebenen-Faktorenanalyse berücksichtigt (Fauth, Decristan, Rieser, Klieme & Büttner, 2014 a, 2014 b; Lüdtke et al., 2006, 2009; Lüdtke, Trautwein, Schnyder & Niggli, 2007; Wagner 2008). In der Unterrichtsforschung wird in der Regel die Klassenebene als die relevantere betrachtet, auf der auch Vergleiche zwischen Lehrer- und Schülerurteilen vorgenommen werden (Clausen, 2002; Kunter & Baumert, 2006; Marsh et al., 2012). Ohne eine Berücksichtigung der Mehrebenenstruktur bleibt aber offen, ob die gefundene Faktorenstruktur im Wesentlichen Resultat individueller Beurteilertendenzen einzelner Schülerinnen und Schüler ist oder systematische Unterschiede in der geteilten Wahrnehmung darstellt. Individuelle und kollektiv geteilte Wahrnehmungen von Unterrichtsstörungen Wagner (2008) unterscheidet zwischen geteilten (kollektiven) und ungeteilten (individuellen) Wahrnehmungen. Die Schülerinnen und Schüler einer Klasse besuchen den Unterricht bei der gleichen Lehrperson und sind ähnlichen sozialen Situationen ausgesetzt. Das heißt aber keineswegs, dass sie den Unterricht gleich erleben. Während sie in einigen Bereichen über eine geteilte kollektive Wahrnehmung verfügen, können andere Merkmale des Unterrichts individuell sehr unterschiedlich eingeschätzt werden. Die einzelnen Schülerinnen und Schüler befinden sich in einer ähnlichen objektiven Situation, interpretieren diese jedoch vor dem Hintergrund ihrer individuellen Störempfindlichkeit, aktueller motivationaler und emotionaler Zustände und Bedürfnisse, früheren Erfahrungen und sozialen Rollen (z. B. Täter/ Opfer) anders. So zeigt z. B. eine Fragebogenstudie von Pfitzner und Schoppek (2000) zur Bewertung von Unterrichtsstörungen durch Lehrpersonen und Schülerinnen und Schüler, dass der varianzstärkste Faktor eine globale Bewertungsdimension widerspiegelt, die man als individuelle Störempfindlichkeit interpretieren kann. Geteilte Wahrnehmungen können auf drei Gründe zurückgeführt werden. Zum einen können geteilte Wahrnehmungen tatsächlich vorhandene Unterschiede zwischen den Klassen widerspiegeln. Zum anderen können sich Klassen darin unterscheiden, wie viele Schülerinnen und Schüler mit bestimmten Wahrnehmungstendenzen ihnen angehören. So können sie beispielsweise von vielen Mädchen besucht werden, die tendenziell eher milde Beurteilungen abgeben (Haladyna & Hess, 1994; Wagner, 2008). Drittens kann in Gesprächen über den Unterricht und die Lehrperson eine gemeinsame Sichtweise konstruiert werden, die möglicherweise vom tatsächlichen unterrichtlichen Handeln der Lehrperson abweichen kann (Dreesmann, 1982; Wagner, 2008). Durch den wiederholten Austausch unter den Schülerinnen und Schülern können sich kollektive Wahrnehmungen über die Zeit noch verstärken. Die soziale Dynamik der Klasse kann zu einer Homogenisierung der Unterrichtswahrnehmung führen. Dimensionalität Die Frage nach der Dimensionalität des Konstrukts Unterrichtsstörungen ist bisher weitgehend offen. Während aggressive Störungen breit erforscht sind, ist die Befundlage zu nicht aggressiven Störungsformen im Unterricht weitaus weniger klar. Hier stellt sich insbesondere die Frage, zwischen welchen Störungsformen die Schülerinnen und Schüler differenzieren. In der Entwicklung des Fragebogens zur Erfassung von Störungen im Unterricht (Wettstein, Scherzinger & Wyler, 2016) wurden bisher in einer explorativen Faktorenanalyse vier Störungs- 4 Alexander Wettstein, Erich Ramseier, Marion Scherzinger und drei störungspräventive Faktoren identifiziert. Darauf aufbauend stellt sich die Frage, ob diese Dimensionen auch je auf der Klassen- und der within-Ebene identifiziert werden können und ob deren ebenenspezifische Korrelationen einem Muster entsprechen, das als Beitrag zur Konstruktvalidität angesehen werden kann (vgl. Wagner et al., 2013). Die Einschätzung des Unterrichts von Klassen- und Fachlehrpersonen In der deutschsprachigen Schweiz werden die Schülerinnen und Schüler bereits in der Primarstufe (Grundschule) von einer Klassenlehrperson und verschiedenen Fachlehrpersonen unterrichtet. Die Klassenlehrperson trägt die Hauptverantwortung für die Klasse, übernimmt einen Großteil des Unterrichts und ist die erste Ansprechperson für Schülerinnen und Schüler, Eltern und Schulbehörden. Die Schülerinnen und Schüler werden ergänzend von weiteren Lehrpersonen unterrichtet, die nur eines oder einzelne Fächer an dieser Klasse erteilen; sie werden nachfolgend Fachlehrpersonen genannt. Bisher liegen kaum Studien zum Unterricht von Fachlehrpersonen vor. Beobachtungsstudien (Wettstein, 2008, 2010) deuten jedoch darauf hin, dass im Unterricht von Fachlehrpersonen generell mehr Störungen auftreten als im Unterricht von Klassenlehrpersonen. Dieser Befund steht im Einklang mit einer Fragebogenstudie zu Belastungsprofilen einzelner Lehrergruppen (Hüfner, 2003). Fachlehrpersonen berichten mehr Belastungen durch mangelnde Mitarbeit von Schülerinnen und Schülern und Disziplinprobleme im Unterricht als Klassenlehrpersonen. Weiter ist anzunehmen, dass die Lernenden die Klassenführung und Beziehung im Unterricht der Klassenlehrperson positiver einschätzen als im Unterricht der Fachlehrperson. Die Klassenlehrperson ist die Hauptansprechperson für die Schülerinnen und Schüler, sie führt die Klassenregeln ein und verbringt mehr Zeit mit den Schülerinnen und Schülern als die Fachlehrperson. Vergleicht man den Unterricht der Klassenlehrperson und der Fachlehrperson in der gleichen Klasse, so gibt es Gemeinsamkeiten und Unterschiede. Im Unterricht sind die Schülerinnen und Schüler mit der variablen Klassenführung, der Beziehungsgestaltung und den methodisch-didaktischen Unterrichtsdesigns der jeweiligen Lehrperson konfrontiert. Während sich diese Aspekte im Unterricht der Klassenlehrperson und der Fachlehrperson unterscheiden, gibt es durchaus auch Gemeinsamkeiten. Die Schülerin bzw. der Schüler, welche bzw. welcher im Unterricht der einen Lehrperson stört, tut dies mit gewisser Wahrscheinlichkeit auch im Unterricht der anderen Lehrperson. Zu den konstanten Anteilen zählen wir deshalb Störungsformen, welche aus einer individuumszentrierten Sichtweise traditionell „schwierigen“ Schülerinnen bzw. Schülern zugeschrieben werden, während eher interaktional- und lehrpersonenzentrierte Störungsmerkmale Unterschiede zwischen Fach- und Klassenlehrpersonen erwarten lassen. Geschlechtereffekte Die Mädchen einer Klasse stimmen besser in ihren Einschätzungen überein als die Jungen (Wagner, 2008). Bei 13-jährigen Mädchen und Jungen sind die sozialen Netzwerke innerhalb von Klassen fast vollständig nach Geschlechtern getrennt (Lubbers, 2003) und Mädchen sprechen häufiger miteinander als Jungen (Raffaelli & Duckett, 1989). Weiter gibt es empirische Hinweise, dass Mädchen die thematische Motivierung, Beziehung und Klassenführung im Unterricht deutlich milder beurteilen als Jungen (Haladyna & Hess, 1994; Wagner, 2008). Es ist zudem davon auszugehen, dass Mädchen weniger Schüler- und Lehreraggression wahrnehmen als Jungen. Sie sind in ihren geschlechtsspezifischen Netzwerken weniger aggressivem Schülerverhalten ausgesetzt (Card, Stucky, Sawalani & Little, 2008) und nehmen deshalb vermutlich auch weniger Schüleraggression wahr. Sie verfügen zudem über eine höhere Selbstregulationsfähigkeit (Duckworth & Seligman, 2006; Hannover & Kessels, 2011), verstoßen weniger gegen Schulnormen und sind dadurch wahrscheinlich auch weniger aggressivem Verhalten der Lehrperson ausgesetzt. Schülerwahrnehmung von Störungen im Unterricht 5 Jahrgangsgemischte und jahrgangshomogene Klassen In der fünften und sechsten Klasse besuchen die Schülerinnen und Schüler im Kanton Bern entweder jahrgangshomogene oder jahrgangsheterogene Klassen, an welchen Schülerinnen und Schüler der fünften und sechsten Klasse gemeinsam unterrichtet werden. In bisherigen Studien wurden kaum Unterschiede zwischen den beiden Klassentypen identifiziert. Klassenstufe Studien zeigen, dass die Einstellung zur Schule mit zunehmender Dauer der Schule generell negativer wird (Eccles & Midgley, 1989; Fend & Stöckli, 1997). Der Unterricht und die Schüler-Lehrer-Beziehung sind in der sechsten Klasse zudem durch den Selektionsprozess (Zuweisung zu den unterschiedlichen Schularten der Sekundarstufe I ab dem siebten Schuljahr) besonders belastet. Fragestellungen und Hypothesen 1. Gestützt auf die theoretischen Überlegungen stellt sich die Frage, ob die Intraklassenkorrelationen der Schülereinschätzungen innerhalb von Klassen bezüglich verschiedener Items und Faktoren ausreichend hoch sind, um von geteilter Unterrichtswahrnehmung sprechen zu können (Wagner, 2008). Wir erwarten insgesamt ausreichend hohe Intraklassenkorrelationen, um von einer geteilten Schülerwahrnehmung zu sprechen (Hypothese 1). 2. Differenzieren Schülerinnen und Schüler zwischen verschiedenen Dimensionen von Unterrichtsstörungen und lassen sich diese Unterscheidungen sowohl auf withinwie auch auf Klassenebene faktoriell identifizieren? Es wird erwartet, dass die Faktorenstruktur auf within- und Klassenebene übereinstimmt und sich damit je die in der explorativen Faktorenanalyse identifizierte Struktur finden lässt (vgl. z. B. Wagner et al., 2013; Hypothese 2). 3. Welche Korrelationen zwischen den latenten Variablen sind auf Klassen- und auf within- Ebene festzustellen? Auf Klassenebene erwarten wir deutlich negative Korrelationen zwischen den einzelnen Störungsformen und den Variablen Beziehung und Klassenführung sowie positive Korrelationen zwischen den einzelnen Störungsformen (Hypothese 3). Weiter erwarten wir, dass die Korrelationsmuster zwischen der Klassen- und der within-Ebene unterschiedlich ausfallen, da sich reale Unterschiede zwischen Klassen nur auf Klassenebene zeigen können. 4. Unterscheidet sich der Unterricht der Klassen- und der Fachlehrperson in der Schülerwahrnehmung? Es wird erwartet, dass der Unterricht der Klassenlehrperson durchwegs positiver eingeschätzt wird (Hypothese 4). Weiter erwarten wir, dass die Schülereinschätzungen des Unterrichts der Fachbzw. Klassenlehrpersonen auf Klassenebene hohe Interkorrelationen für die latenten Variablen für störendes Schülerverhalten, nicht aber für Klassenführung und Beziehung sowie sozial-interaktionale Merkmale eines methodisch-didaktisch gestörten Unterrichts aufweisen (Hypothese 5). 5. Ergeben sich in der Einschätzung von Störungen im Unterricht Geschlechtereffekte? Es wird erwartet, dass die Mädchen einer Klasse höher in ihren Wahrnehmungen übereinstimmen als die Jungen (Hypothese 6). Weiter wird erwartet, dass Mädchen weniger Lehrer- und Schüleraggression wahrnehmen sowie die Klassenführung und Beziehung zu den Lehrpersonen positiver beurteilen als die Jungen. Für die latenten Variablen nicht aggressive Schülerstörungen und Störungen des methodisch-didaktischen Settings werden keine Geschlechtereffekte erwartet (Hypothese 7). 6. Schließlich wird erwartet, dass sich jahrgangsgemischte Klassen in ihren Unterrichtseinschätzungen nicht von jahrgangshomogenen Klassen unterscheiden (Hypothese 8). Es wird jedoch vermutet, dass Schülerinnen und Schüler der sechsten Klassenstufe die Klassenführung und Beziehung kritischer beurteilen als jene der fünften Klasse (Hypothese 9). 6 Alexander Wettstein, Erich Ramseier, Marion Scherzinger Methode Stichprobe Für die Studie wurden alle deutschsprachigen fünften und sechsten Klassen des Kantons Bern angefragt. Die Kontaktaufnahme erfolgte über die Schulleitungen, welche die Studienteilnahme teilweise für alle Klassen der betreffenden Schulstufe verordneten. In anderen Fällen überließen die Schulleitungen die Teilnahmeentscheidung den Klassenlehrpersonen. Insgesamt erklärten sich 11,8 % der angefragten Klassen bereit, an der Studie teilzunehmen. Die geringe Teilnahmebereitschaft ist darauf zurückzuführen, dass sich die Schulen von vornherein für eine aufwendige Teilnahme an allen drei Studienschritten, Fragebogen, Videobeobachtung und Interviews, verpflichten mussten. Die Teilnahme an der Untersuchung war auch für die Schülerinnen und Schüler freiwillig; 83 % füllten einen Fragebogen aus. Pro Klasse wurde neben der Klassenlehrperson auch eine Fachlehrperson einbezogen. Deren Auswahl war nicht repräsentativ, sondern beruhte auf der Teilnahmebereitschaft. Jedoch wurde darauf geachtet, dass die betreffenden Fachlehrpersonen an der untersuchten Schule kein Klassenlehreramt innehatten. Von den ursprünglich 86 teilnehmenden Klassen mussten drei aus dieser Auswertung ausgeschlossen werden, da für sie keine Informationen zum Unterricht der Fachlehrperson erhoben werden konnte. Alle beteiligten Lehrpersonen, Schülerinnen und Schüler sowie die Eltern gaben schriftlich ihr Einverständnis zur Befragung. Die vorliegende Studie beruht auf einer Stichprobe von insgesamt 1290 Fünftsowie Sechstklässlerinnen und -klässlern (48 % Mädchen, Alter M = 11.5, SD = 0.77) aus 83 Schulklassen aus 43 Schulen des Kantons Bern. Damit wurde die von Marsh et al. (2012) empfohlene Mindeststichprobe von 50 Klassen erreicht. Die Anzahl der Schülerinnen und Schüler, welche an der Studie teilnahmen, variierte zwischen 6 und 24 Schülerinnen und Schülern (M = 15.5) pro Klasse. Die Klassenlehrpersonen unterrichteten im Durchschnitt 19.7 Lektionen zu je 45 Minuten an der Klasse (SD = 4.69) und insgesamt 23.6 Lektionen an der untersuchten Schule (SD = 4.66). Sie waren im Mittel 39.5 Jahre alt (SD = 11.83) und in 65,1 % der Fälle weiblich. 58 % der Klassenlehrpersonen wiesen eine Berufserfahrung von mehr als zehn Jahren auf. Die Fachlehrpersonen unterrichteten im Durchschnitt 6.6 Lektionen an der Klasse (SD = 3.56) und insgesamt 16.6 Lektionen an der untersuchten Schule (SD = 7.23). Die große Streuung deutet darauf hin, dass die Anstellungen der Fachlehrpersonen von einzelnen Lektionen bis hin zu Vollzeitanstellungen variieren. Die Fachlehrpersonen waren im Mittel 42.5 Jahre alt (SD = 11.05), in 75,9 % der Fälle weiblich und 67,5 % weisen eine Berufserfahrung von mehr als zehn Jahren auf. Insgesamt unterrichten die befragten Fachlehrpersonen rund dreimal weniger an der Klasse als die Klassenlehrpersonen. Eine anteilsmäßige Betrachtung zeigt, dass die Fachlehrpersonen mit Ausnahme des Deutschunterrichts auch in den selektionsrelevanten Fächern (Deutsch, Französisch und Mathematik) gut vertreten sind und auch Klassenlehrpersonen nicht selektionsrelevante Fächer wie Gestalten, Musik und Sport unterrichten. Durchführung Die schriftliche Befragung der Schülerinnen und Schüler fand im Unterricht durch die Forschenden statt. Die Schülerinnen und Schüler wurden gebeten, den Unterricht ihrer Klassenlehrperson sowie einer anderen vorgängig bestimmten Fachlehrperson in zwei Spalten allgemein einzuschätzen (Wie oft kommt das im Unterricht dieser Lehrperson vor? nie = 1, selten = 2, oft = 3, sehr oft = 4 bzw. Inwiefern stimmen diese Aussagen? stimmt nicht = 1, stimmt eher nicht = 2, stimmt eher = 3, stimmt = 4). Zudem wurden Geschlecht, Geburtsdatum und Schulmerkmale erhoben. Unterrichtsstörungen wurden mit dem neu entwickelten Fragebogen zur Erfassung von Störungen im Unterricht (Wettstein et al., 2016) erfasst. 1 Vier Skalen erfassen Störungsaspekte. Die Skala nicht aggressives störendes Schülerverhalten beinhaltet sowohl passive (Manche Kinder hören dieser Lehrperson nicht richtig zu) als auch aktive (Einige Kinder schwatzen, während diese Lehrperson etwas erklärt) Störungen. Die Skala Schüleraggression umfasst offen-direkte (Kinder bedrohen andere Kinder) und indirekte (Kinder beschuldigen absichtlich andere Kinder, obwohl diese gar nichts gemacht haben) Formen aggressiven Schülerverhaltens. Die Skala Lehreraggression erfasst mit zwei Items (Kinder werden von dieser Lehrperson heruntergemacht) aggressives Verhalten. Weiter floss mit dem Item Kinder werden von dieser Lehrperson un- 1 Das Instrument umfasst in seiner ursprünglichen Version insgesamt sieben Skalen. Hier beschränken wir uns aus Gründen der Komplexitätsreduktion nach Ausschluss der Skala Peerbeziehungen auf sechs Dimensionen. Schülerwahrnehmung von Störungen im Unterricht 7 gerecht behandelt auch ein Item in diesen Faktor ein, welches keine Aggression im strengen Sinne bezeichnet. Die Skala Störungen des methodisch-didaktischen Settings umfasst Items, welche auf einen allgemein gestörten Unterricht, nicht gelingende Lehr-Lern- Prozesse, viele Unterbrechungen und lange Wechselphasen hinweisen (Beim Wechsel von verschiedenen Arbeiten dauert es bei dieser Lehrperson sehr lange, bis alle Kinder wieder bereit sind). Zwei weitere Skalen stellen abgrenzbare Konstrukte zur Bestimmung der divergenten Validität dar: Die Skala Beziehung umfasst sowohl Aspekte der Beziehungs- (Ich mag diese Lehrperson) als auch der Vermittlungsqualität (Diese Lehrperson unterrichtet interessant). Die Skala Klassenführung umfasst Aspekte von Monitoring und niederschwelligen Interventionen (Bei einer Störung reagiert diese Lehrperson möglichst schnell und passend). Die sechs Skalen haben auf Individualebene eine interne Konsistenz von .66 bis .88 und korrelieren untereinander im Betrag schwach bis mäßig (.09 - .55). Mit Ausnahme der Beziehungsskala sind alle Skalen als reflektive (shared) Klimakonstrukte konzipiert (Lüdtke et al., 2008; Stapleton, Yang & Hancock, 2016). Dabei werden die Schülerinnen und Schüler als weitgehend austauschbare Beobachter eines Konstrukts angesehen, das auf Klassenebene definiert ist. 2 Im Gegensatz dazu stehen formative (configural) Konstrukte, die für das einzelne Klassenmitglied definiert sind (z. B. Geschlecht), die aber aggregiert durchaus auf Klassenebene bedeutsam sein können (z. B. Jungenanteil als potenziell das Störungsausmaß beeinflussender Faktor). Dabei gilt es allerdings zu bedenken, dass die Differenzierung zwischen reflektiven und formativen Konstrukten in erster Linie eine idealtypische Unterscheidung ist, während es sich - gerade wenn es um Schülereinschätzungen geht - vielmehr um die Pole auf einem Kontinuum handelt (Lüdtke et al., 2008). Statistische Modellierung Die statistische Modellierung zielte primär auf eine konfirmatorische Mehrebenen-Faktorenanalyse (MCFA). Sie erfolgte in Anlehnung an Muthén (1994) sowie Grilli und Rampichini (2007) in vier Schritten. Für den ersten Schritt konnte auf die explorative Faktorenanalyse von Wettstein et al. (2016) zurückgegriffen werden. Im zweiten Schritt wurde geprüft, ob mindestens 5 % der Varianz auf die Klassenebene entfällt und so die Minimalvoraussetzungen für eine Mehrebenenanalyse erfüllt sind (Lüdtke et al., 2006, 2009; Fragestellung 1). Drei Items wiesen schwache Intraklassenkorrelationen im Bereich von .06 bis .08 auf und wurden von der weiteren Analyse ausgeschlossen. Drittens wurden auf within- und Klassenebene explorative Faktorenanalysen durchgeführt, welche die Grundlagen zum vierten Schritt, den doppelt latenten MCFA lieferten (Lüdtke et al., 2007). Die Analyse ist in doppeltem Sinne latent, da einerseits statt manifester Skalenwerte latente Variablen modelliert werden, um den Messfehler dieser Konstrukte zu berücksichtigen. Andererseits werden nicht einfach auf Klassenebene aggregierte manifeste Werte verwendet, sondern es wird berücksichtigt, dass diese abhängig von der Klassengröße fehlerbehaftete Schätzwerte eines latenten wahren Wertes auf Klassenebene sind (z. B. Marsh et al., 2009). Die vorgenommene MCFA berücksichtigt, dass nur vierfach abgestufte ordinale Items zugrunde lagen. Dazu geht man davon aus, dass sich der einzelne ordinale Wert eines Items daraus ergibt, wie viele zu schätzende Schwellenwerte auf einer hinter diesem Item angenommenen latenten Variablen überschritten werden (Grilli & Rampichini, 2007). Die MCFA wurde mittels Mplus, Version 7, unter Nutzung des Weighted-Least-Squares-Means-and-Variance (WLSMV)-Schätzers realisiert (Muthén & Muthén, 2012). Die WLSMV-Schätzung (Asparouhov & Muthén, 2007) beruht nur auf dem bivariaten Vergleich der Items und kann auch im vorliegenden Fall mit im Verhältnis zur Parameterzahl beschränkten Fallzahl auf Klassenebene konvergieren. Damit diese Schätzung zu unverzerrten Ergebnissen führt, muss vorausgesetzt werden, dass fehlende Werte völlig zufällig auftreten (missing completely at random [MCAR]). Da im Mittel aller Item-Paare für 98 % der individuellen Fälle und im Paar mit der schwächsten Abdeckung für 95 % die Informationen tatsächlich vorliegen, ist dennoch nicht mit nennenswerten Verzerrungen zu rechnen. Aufgrund der explorativen Faktorenanalysen auf der within- und Klassenebene gingen wir von einer Einfachstruktur und konfiguraler Invarianz zwischen den Ebenen aus (vgl. z. B. Wagner et al., 2013). Diese Modellierung wurde trotz Alternativen (Stapleton 2 Da Unterricht immer eine Ko-Konstruktion der Lehrpersonen und der Lernenden darstellt, ist eine vollständige Austauschbarkeit der Rater nie gegeben. So werden auch typische Lehrermerkmale wie Lehreraggression reziprok durch das Verhalten der Schülerinnen und Schüler beeinflusst. 8 Alexander Wettstein, Erich Ramseier, Marion Scherzinger et al., 2016) bevorzugt, da diese Invarianz im Hinblick auf die beabsichtigten Vergleiche zwischen within- und Klassenebene relevant ist. Im Modell wurden gleichzeitig die Einschätzungen des Unterrichts der Klassen- und der Fachlehrpersonen in den verschiedenen Dimensionen einbezogen und auf der within- Ebene Korrelationen zwischen der Klassenbzw. Fachlehrpersonen-Version der Items zugelassen, da bei solchen parallelen Items ähnlich wie bei Längsschnittstudien mit einer spezifischen Varianz (z. B. verursacht durch die Wortwahl) auszugehen ist. Auch nachdem ergänzend zu diesem Basismodell starke faktorielle Invarianz modelliert wurde, waren akzeptable Fit-Werte festzustellen (RMSEA = .015, CFI = .964, TLI = .962, SRMR within = .047, SRMR between = .117, χ 2 = 2782, df = 2135, p < .0001). Die drei globalen Fit-Indizes und SRMR within sind besser als nach traditionellen Cutoff-Werten erforderlich (Hu & Bentler, 1999), während SRMR between den Grenzwert von .08 überschreitet. Muthén und Muthén (2004) stellen jedoch diesen SRMR-Grenzwert bei ordinalen Variablen und kleinen Stichproben infrage (N ≤ 250 - verglichen mit unseren 83 Klassen) und Fauth et al. (2014 a) betrachten in ihrem Mehrebenenmodell zur Unterrichtsqualität den Fit trotz eines SRMR between -Wertes von .11 als adäquat. Die standardisierten Faktorenladungen aller Items lagen auf der within-Ebene im Mittel bei .70; nur bei Items des methodisch-didaktischen Settings unter .60. Auf Klassenebene waren sie durchgehend höher. Bei der Schätzung mussten die Residualvarianzen von 11 der 48 Items auf null gesetzt werden, da für sie schwach negative Werte geschätzt wurden (Heywood-Fälle, wie sie in Mehrebenenanalysen bekannt sind; Lüdtke et al., 2007). Die doppelt latente MCFA ist zwar für reflektive Konstrukte grundsätzlich der optimale Ansatz. Unter verschiedenen Rahmenbedingungen, gerade wenn wie hier die Klassenzahl beschränkt ist, führen ganz oder teilweise manifeste Verfahren jedoch zu stabileren Ergebnissen und werden deshalb teils dem doppelt-latenten Ansatz auch ganz vorgezogen (Wagner et al., 2016). Wie von Lüdtke, Marsh, Robitzsch & Trautwein (2011) und Marsh et al. (2009) empfohlen, wurden deshalb alle Berechnungen auch mit manifest-latenten und doppelt manifesten Verfahren mit robusten Schätzmethoden in Mplus durchgeführt, um die Spannweite der Schätzungen einzufangen. Aus Platzgründen werden jedoch außer beispielhaft in Tabelle 3 vorwiegend die doppelt latenten Ergebnisse berichtet. Ergebnisse Übereinstimmung der Schülereinschätzungen Die Intraklassenkorrelationen der Schülereinschätzungen beziehen sich, der Modellierung der ordinalen Indikatoren entsprechend, auf die hinter den Indikatoren liegenden itemspezifischen latenten Variablen. Sie betrugen auf Indikatorenebene durchschnittlich .20 und sind alle statistisch signifikant von null verschieden. Die höchsten ICC-Werte der Schülereinschätzung des Unterrichts der Klassenlehrperson bzw. der Fachlehrperson fanden sich für Items, die relativ generelle Sympathieurteile abfragen: Sie ist eine gute Lehrperson (je .37) und Ich mag diese Lehrperson (.33 bzw. .30). Die tiefsten ICCs erreichten Items zur Klassenführung: Bei einer Störung reagiert diese Lehrperson möglichst schnell und passend (.08 bzw. .09). Die Intraklassenkorrelationen der latenten Variablen (vgl. Tab. 1) zeigten, dass durchschnittlich 27 % der interindividuellen Variation der Schülerwahrnehmung zwischen den Klassen lag. Die durchschnittliche ICC der Schülereinschätzungen betrug für den Unterricht der Fachlehrperson .29 und lag damit etwas höher als bei der Klassenlehrperson mit .26. Die Intraklassenkorrelationen erlauben es somit klar, von geteilten Schülerwahrnehmungen zu sprechen (Hypothese 1). Die Berechnung der ebenenspezifischen Reliabilität ergab hohe Werte für die Klassenebene, während die Werte auf within-Ebene etwas niedriger ausfielen (vgl. Tab. 1). Auch die für die Konstrukte der Klassenebene wichtige ICC (2) lag mit Ausnahme der Klassenführung beim Klassenlehrer, ICC (2) = .73, bei allen Faktoren über .80. Faktorenstruktur und -korrelation Die Schülerinnen und Schüler differenzierten auf within- und Klassenebene zwischen den vier Formen von Unterrichtsstörungen, zu denen Items entwickelt wurden: Nicht aggressive Störungen der Schülerinnen und Schüler, aggressi- Schülerwahrnehmung von Störungen im Unterricht 9 ves Schülerverhalten, Aggression der Lehrperson sowie Störungen des methodisch-didaktischen Settings. Für diese und die Konstrukte Beziehung und Klassenführung konnten für Klassen- und Fachlehrpersonen auf beiden Ebenen gleiche Faktorenstrukturen modelliert werden (Hypothese 2). Zwischen den latenten Variablen für die Schülereinschätzungen des Unterrichts der Klassenlehrperson ergaben sich auf Klassenebene durchgehend negative Korrelationen zwischen störungspräventiven (Klassenführung und Beziehung) und störungsbezogenen Konstrukten (vgl. Tab. 2). Die hohe Korrelation zwischen Störungen des methodisch-didaktischen Settings und nicht aggressive Störungen der Schülerinnen und Schüler deutet darauf hin, dass die Schülerinnen und Schüler auf Klassenebene beide Störungsformen einander weitgehend gleichsetzten. Andere Störungsformen, insbesondere aggressive Störungen der Schülerinnen und Schüler bzw. der Lehrpersonen, korrelierten nur schwach. Auf within-Ebene ergaben sich ebenfalls negative Korrelationen zwischen störungspräventiven und störungsbezogenen Konstrukten. Auch die Korrelationen zwischen störungsbezogenen Konstrukten variierten hier deutlich untereinander. Ein Vergleich der within- und der Klassenebene zeigte, dass die Korrelationen auf Klassenebene im Betrag generell etwas höher ausfielen. Dies traf jedoch nicht auf die Einschätzung der Lehrer- und der Schüleraggression zu. Weiter kor- Skalen Anzahl Items Skalenkennwerte ICC der latenten Variablen Reliabilitäten (ω) 1 M SD Schiefe Klassenebene Within- Ebene KL FL KL FL KL FL KL FL KL FL KL FL NON AGS AGL SMS BEZ KLA 4 4 3 4 6 3 2.34 1.83 1.28 2.23 3.52 3.34 2.37 1.78 1.31 2.38 3.27 3.09 0.62 0.57 0.48 0.63 0.56 0.59 0.67 0.58 0.53 0.67 0.67 0.69 0.44 0.79 2.46 0.29 -1.6 -1.09 0.51 0.93 2.45 0.22 -1.07 -0.77 .25 .25 .23 .33 .33 .15 .27 .23 .25 .46 .33 .22 .90 .94 .87 .94 .96 .93 .91 .92 .93 .95 .96 .96 .81 .78 .88 .62 .92 .73 .81 .81 .88 .57 .91 .73 Tab. 1: Mittelwert, Standardabweichung und Schiefe der Skalen, Intraklassenkorrelation und ebenenspezifische Reliabilität 1 der latenten Variablen, jeweils nach Einschätzungen des Unterrichts bei der Klassen- und der Fachlehrperson Anmerkungen: KL = Klassenlehrperson, FL = Fachlehrperson; NON = nicht aggressive Störungen der Schülerinnen und Schüler, AGS = aggressive Störungen der Schülerinnen und Schüler, AGL = aggressives Verhalten der Lehrperson, SMS = Störungen des methodisch-didaktischen Settings, BEZ = Beziehung, KLA = Klassenführung. 1 Ebenenspezifische composite reliability (omega) entsprechend Geldhof, Preacher und Zyphur (2014); da auf Klassenebene einige Residualvarianzen null gesetzt sind, wird die Reliabilität erhöht. Setzt man stattdessen die kleinste sonstige Residualvarianz im entsprechenden Faktor ein, nehmen die Reliabilitäten wenig ab und bleiben in allen Fällen über .83. NON AGS AGL SMS BEZ KLA NON AGS AGL SMS BEZ KLA .63 .44 .67 -.40 -.32 .72 .53 .52 -.33 -.29 .39 .28 .38 -.71 -.56 .94 .56 .36 -.57 -.51 -.66 -.32 -.77 -.63 .76 -.73 -.39 -.44 -.69 .78 Tab. 2: Interkorrelationen der latenten Variablen für die Schülereinschätzungen des Unterrichts der Klassenlehrperson auf Klassenebene (über der Diagonale) und auf within-Ebene (unterhalb der Diagonale) Anmerkungen: NON = nicht aggressive Störungen der Schülerinnen und Schüler, AGS = aggressive Störungen der Schülerinnen und Schüler, AGL = aggressives Verhalten der Lehrperson, SMS = Störungen des methodisch-didaktischen Settings, BEZ = Beziehung, KLA = Klassenführung. Die Standardfehler variieren auf within-Ebene zwischen .02 bis .05 und auf Klassenebene zwischen .04 bis .15. 10 Alexander Wettstein, Erich Ramseier, Marion Scherzinger relierten Störungen des methodisch-didaktischen Settings und nicht aggressive Störungen der Schülerinnen und Schüler auf within-Ebene weitaus weniger hoch als auf Klassenebene. Zusammenfassend kann festgestellt werden, dass der Vergleich der Korrelationen zwischen within- und Klassenebene je nach betrachtetem Konstruktpaar unterschiedlich ausfällt. Die Interkorrelationen zwischen latenten Variablen für die Schülereinschätzungen des Unterrichts der Fachlehrperson ergaben ein ähnliches Korrelationsmuster. Hier korrelierte allerdings die wahrgenommene Lehreraggression auf Klassenebene stärker mit nicht aggressiven (.54) und aggressiven Störungen der Schülerinnen und Schüler (.48) sowie mit Störungen des methodisch-didaktischen Settings (.51) als im Unterricht der Klassenlehrperson. Insgesamt entsprechen die Faktorkorrelationen der Hypothese 3. Klassenlehrperson und Fachlehrperson Vergleicht man die Schülereinschätzungen des gleichen Gegenstandsbereichs bei der Klassenlehrperson mit jenen bei der Fachlehrperson auf Klassenebene (vgl. Tab. 3), so fällt auf, dass die Korrelationen stark schwankten. Am höchsten korrelierten die Einschätzungen des aggressiven Schülerverhaltens im Unterricht der beiden Lehrpersonen (.90), gefolgt von jener des nicht aggressiven Schülerverhaltens (.41). Dies ist insofern plausibel, als einige Schülerinnen und Schüler wahrscheinlich sowohl im Unterricht der Fachlehrperson wie auch der Klassenlehrperson aggressives Verhalten zeigen. Demgegenüber zeigte sich aus Schülersicht kein Zusammenhang zwischen dem aggressiven Verhalten der Lehrpersonen (.09). Dieses ging von der jeweiligen Lehrperson aus und war somit weitgehend unabhängig von der anderen Lehrperson. Ein ähnliches Bild ergab sich für Störungen des methodisch-didaktischen Settings (.05). Auf Klassenebene korrelierten auch die Schülereinschätzungen der Beziehung (-.10) und der Klassenführung (-.27) bei der Klassen- und der Fachlehrperson wenig und es zeichnete sich sogar ein schwacher negativer Zusammenhang ab. Diese Korrelationen entsprechen damit Hypothese 5. Auf within-Ebene korrelierten die Schülereinschätzungen des gleichen Gegenstandsbereichs bei unterschiedlichen Lehrpersonen teilweise hoch. Wer sich im Unterricht der Klassenlehrperson durch nicht aggressive Schülerstörungen (.64) oder aggressives Schülerverhalten (.77) gestört fühlte, fühlte sich auch im Unterricht der Fachlehrperson gestört. Dies galt auch für die Einschätzung von aggressiven Verhaltensweisen der jeweiligen Lehrpersonen. Wer sich bei der Klassenlehrperson gestört fühlte, fühlte sich auch durch aggressives Verhalten der Fachlehrperson gestört (.57). Für die sozialen Beziehungen zur Lehrperson (.16) und die Wahrnehmung der Klassenführung (.27) galt dies nicht in demselben Ausmaß. Die in Ebene NON AGS AGL SMS BEZ KLA Klassenebene latent-latent manifest-latent manifest-manifest .41 (.12) .39 (.12) .43 (.10) .90 (.04) .85 (.04) .83 (.03) .09 (.14) .05 (.15) .16 (.10) .05 (.13) .08 (.13) .14 (.11) -.10 (.13) -.10 (.11) -.06 (.10) -.27 (.14) -.26 (.18) -.12 (.13) Within latent manifest-latent manifest-manifest .64 (.03) .62 (.03) .61 (.03) .77 (.02) .74 (.03) .74 (.03) .57 (.04) .41 (.04) .41 (.04) .35 (.04) .42 (.03) .42 (.03) .16 (.03) .15 (.04) .14 (.04) .27 (.04) .29 (.04) .29 (.04) Tab. 3: Ebenenspezifische Interkorrelationen zwischen den Schülereinschätzungen des Unterrichts der Klassenbzw. Fachlehrpersonen (in Klammern SE), erfasst mit unterschiedlich operationalisierten Konstrukten Anmerkungen: NON = nicht aggressive Störungen der Schülerinnen und Schüler, AGS = aggressive Störungen der Schülerinnen und Schüler, AGL = aggressives Verhalten der Lehrperson, SMS = Störungen des methodisch-didaktischen Settings, BEZ = Beziehung, KLA = Klassenführung; latent-latent = latente Variable, latent aggregiert; manifest-latent = manifeste Skala, latent aggregiert; manifest-manifest = manifeste Skala, manifest aggregiert. Schülerwahrnehmung von Störungen im Unterricht 11 Tabelle 3 beispielhaft ebenfalls dargestellten Korrelationen bei manifest-latenter und doppelt-manifester Modellierung führten bei kleinen Abweichungen in den Zahlen inhaltlich zu den gleichen, eben geschilderten Schlussfolgerungen wie bei doppelt-latenter Modellierung. Es wurde erwartet, dass die Schülerinnen und Schüler den Unterricht der Klassenlehrperson positiver einschätzen als den Unterricht der Fachlehrperson (Hypothese 4). Diese Hypothese konnte weitgehend bestätigt werden. Aus Schülersicht waren Fachlehrpersonen im Vergleich zu Klassenlehrpersonen statistisch signifikant weniger kompetent hinsichtlich Klassenführung (d = -1.15; p < .001). Weiter wurde die Beziehungs- und Vermittlungsqualität kritischer beurteilt (d = -0.82; p < .001) und in ihrem Unterricht wurden mehr Störungen des methodisch-didaktischen Settings wahrgenommen (d = 0.47; p = .002). Hinsichtlich nicht aggressiver Schülerstörungen (d = 0.13) und Aggression der Lehrperson (d = 0.06) wurden dagegen keine statistisch signifikanten Unterschiede wahrgenommen. Die Schülerinnen und Schüler schienen jedoch im Unterricht der Fachlehrperson statistisch signifikant weniger Schüleraggressionen wahrzunehmen (d = -0.26; p = .002). Geschlechtereffekte Ein Vergleich der mittleren Intraklassenkorrelationen der latenten Variablen nach Geschlecht zeigte deskriptiv, dass die Mädchen einer Klasse für den Unterricht der Klassenlehrperson mit einem Mittelwert der ICCs von .33 in ihren Einschätzungen besser übereinstimmten als die Jungen mit einem Mittelwert von .24. Für den Unterricht der Fachlehrperson ergaben sich dagegen kaum Unterschiede (ICC Mädchen = .32; ICC Jungen = .29). Für den Geschlechterunterschied zumindest beim Unterricht der Klassenlehrpersonen spricht auch, dass die Mädchen bei allen sechs Skalen höhere ICCs aufwiesen. Bei doppelt manifester Berechnung fielen sogar alle zwölf ICC-Unterschiede zugunsten der Mädchen aus. Weiter nahmen Mädchen im Unterricht der Klassenlehrperson erwartungsgemäß statistisch signifikant weniger Lehrer- (Effektstärke auf within-Ebene d = 0.31; p < .001) und Schüleraggression (d = 0.37; p < .001) wahr und schätzten die Beziehung zur Klassenlehrperson signifikant besser ein als die Jungen (d = 0.15; p = .017). Im Unterricht der Fachlehrperson nahmen die Mädchen ebenfalls signifikant weniger Lehrer- (d = 0.35; p < .001) und Schüleraggression (d = 0.27; p < .001) wahr und schätzten die Beziehung zur Klassenlehrperson signifikant besser ein als die Jungen (d = 0.22; p < .001). Hinsichtlich nicht aggressiver Schülerstörungen sowie Störungen des methodisch-didaktischen Settings ergaben sich keine statistisch signifikanten Geschlechterunterschiede. In der Einschätzung der Klassenführung ergaben sich wider Erwarten keine Geschlechterunterschiede (Hypothese 7). Jahrgangsgemischte und jahrgangshomogene Klassen Jahrgangsgemischte Klassen unterschieden sich erwartungsgemäß kaum in ihren Unterrichtseinschätzungen von jahrgangshomogenen Klassen. Jahrgangsgemischte Klassen nahmen allerdings im Unterricht der Fachlehrperson statistisch signifikant weniger Störungen des methodischdidaktischen Settings wahr (Effektstärke auf Klassenebene d = -0.58, p = .022; Hypothese 8). Klassenstufe Während sich für den Unterricht der Klassenlehrperson keine Klassenstufeneffekte ergaben, zeigte sich für den Unterricht der Fachlehrperson, dass die Schülerinnen und Schüler der sechsten Klasse statistisch signifikant mehr nicht aggressive Schülerstörungen (Effektstärke auf within-Ebene d = 0.25; p = .009), Lehreraggression (d = 0.31; p = .004) sowie eine schlechtere Beziehung (d = -0.31; p < .001) und Klassenführung (d = -0.26; p = .015) wahrnahmen als jene der fünften Klasse (Hypothese 9). 12 Alexander Wettstein, Erich Ramseier, Marion Scherzinger Diskussion Intraklassenkorrelationen Die Intraklassenkorrelationen der Konstrukte übertrafen das Kriterium von .05 deutlich und wiesen mit durchschnittlich .27 auf eine hohe relative Übereinstimmung zwischen den Schülereinschätzungen hin. Diese Ergebnisse stehen in Einklang zu früheren Befunden zu Schülereinschätzungen von Lernumwelten (Dettmers, Trautwein, Lüdtke, Kunter & Baumert, 2010; Frenzel, Pekrun & Goetz, 2007; Sälzer, Trautwein, Lüdtke & Stamm, 2012; Trautwein, Lüdtke, Schnyder & Niggli, 2006). Hochinferente Items, welche relativ globale Urteile und Beziehungsaspekte erfassen, wiesen die höchsten ICC-Werte auf. Es ist davon auszugehen, dass sich die Schülerinnen und Schüler bei der Bildung ihres globalen Urteils gemeinsam unterhalten und sich so gegenseitig beeinflussen. Rund 73 % der fehlerbereinigten Varianz in den Einschätzungen wurde jedoch nicht durch reale Unterschiede zwischen Klassen, sondern durch die within-Ebene, durch individuelle Wahrnehmungen, nicht geteilte Umwelten, die individuelle Stellung und Beziehungen sowie Persönlichkeitsmerkmale einzelner Schülerinnen und Schüler erklärt. Dies deutet darauf hin, dass die einzelnen Schülerinnen und Schüler den gleichen Unterricht sehr unterschiedlich wahrnahmen. Faktorenstruktur und -korrelation Die konfirmatorische Mehrebenen-Faktorenanalyse ergab eine eindeutige gut interpretierbare Struktur, die ermöglichte, Faktoren und ihre Korrelationen zwischen den Ebenen zu vergleichen. Die starken und plausiblen Kontraste der Interkorrelationen der latenten Variablen zwischen within- und Klassenebene zeigen, dass die Relationen zwischen den Konstrukten auf Klassenebene nicht einfach das geteilte Abbild individueller Beurteilungstendenzen sind. In der Einschätzung aggressiven Verhaltens scheint eine besondere individuelle Sensibilität zum Ausdruck zu kommen. Auch die auf Klassenebene deutlich variierenden Korrelationen zwischen den Schülereinschätzungen des Unterrichts der Klassenbzw. der Fachlehrpersonen deuten auf eine gute Konstruktvalidität hin (vgl. Tab. 3). Sie können als Hinweis gewertet werden, dass die Schülerinnen und Schüler die jeweiligen Unterrichtssituationen sowie die jeweiligen Lehrpersonen differenziert wahrnahmen und somit nicht einfach globalen Wahrnehmungstendenzen unterlagen. Auf within-Ebene zeigte sich: Wer sich an nicht-aggressivem oder aggressivem Schülerverhalten oder an Lehreraggression im Unterricht der einen Lehrperson störte, störte sich auch im Unterricht der anderen Lehrperson daran. Dagegen führte eine ausgezeichnete soziale Beziehung zur einen Lehrperson nicht automatisch auch zu einer guten Beziehung zur anderen Lehrperson. Die Korrelation bei der Wahrnehmung von Störungen des methodisch-didaktischen Settings lag dazwischen, was insofern plausibel erscheint, da dieses Konzept sowohl Aspekte der Störung als auch der Klassenführung enthält. Bei der Einschätzung von Störungen schienen generelle individuelle Wahrnehmungstendenzen im Sinne von Störungsempfindlichkeit vorzuliegen, während in der Einschätzung der Beziehung zur jeweiligen Lehrperson und der Klassenführung kaum eine generelle, objektunabhängige Strenge-Milde-Beurteilungstendenz festzustellen war. Die als Ausdruck von Störungsempfindlichkeit interpretierbaren hohen Korrelationen auf within-Ebene zwischen der Störungswahrnehmung bei wechselnden Lehrpersonen hoben sich auch von den tieferen Korrelationen bei der Wahrnehmung der Unterrichtsqualität in verschiedenen Fächern ab (Wagner et al., 2013; Tab. 5). Klassenlehrpersonen und Fachlehrpersonen Klassenlehrpersonen verbringen rund dreimal mehr Zeit mit den Schülerinnen und Schülern einer Klasse als Fachlehrpersonen und stellen auch primär die Klassenregeln auf. Es ist deshalb nicht erstaunlich, dass ihr Unterricht aus Schülerwahrnehmung von Störungen im Unterricht 13 Schülersicht fast durchwegs besser eingeschätzt wurde als der Unterricht der Fachlehrperson. Die einzige Ausnahme bildete die Einschätzung aggressiven Schülerverhaltens. So schien aus Schülersicht im Unterricht der Fachlehrperson weniger aggressives Schülerverhalten aufzutreten als im Unterricht der Klassenlehrperson. Dieses Ergebnis steht in Widerspruch zu Beobachtungsstudien, welche darauf hindeuten, dass im Unterricht von Fachlehrpersonen deutlich mehr Schüleraggressionen auftreten (Wettstein, 2008, 2010). Hier sind verschiedene Erklärungen denkbar. Schüleraggression könnte im Sinne eines Kontrasteffekts im insgesamt störungsarmen Unterricht der Klassenlehrperson mehr auffallen oder aus Schülersicht einen größeren normativen Verstoß darstellen als im Unterricht der Fachlehrperson. Weiter tritt Schüleraggression gehäuft in nicht beaufsichtigten Pausen auf (Wettstein, 2008), welche aus Schülersicht wohl eher dem Unterricht der Klassenlehrperson zugerechnet werden. Letztendlich können hier zu einem späteren Zeitpunkt erst die Daten aus der systematischen Verhaltensbeobachtung Aufschluss darüber geben, ob es sich hier um einen realen Unterschied oder ein Wahrnehmungsartefakt aufseiten der Schülerinnen und Schüler handelt. Geschlechtereffekte Es kann vermutet werden, dass die höheren Intraklassenkorrelationen der Einschätzungen der Mädchen gegenüber den Jungen auf eine höhere Kommunikation in der Mädchengruppe zurückzuführen sind. Grundsätzlich wäre es aber auch möglich, dass sich Lehrpersonen verschiedener Klassen gegenüber Mädchen einheitlicher verhalten als gegenüber Jungen und so die Varianz des Lehrerverhaltens auf Klassenebene kleiner ist. Weiter schätzten die Mädchen den Unterricht hinsichtlich der Beziehung sowie Lehrer- und Schüleraggression erwartungsgemäß positiver ein als die Jungen, wogegen sich der erwartete Geschlechtereffekt für die Klassenführung nicht einstellte. Stärken und Grenzen der Studie Die vorliegende Studie nutzt neue methodische Ansätze. Die Entwicklung eines doppelt latenten Messmodells und die Überprüfung mittels konfirmatorischer Mehrebenen-Faktorenanalyse erlauben klare Aussagen zu Effekten auf withinwie auch auf Klassenebene. Zusammen mit den konsistenten Ergebnissen zu Geschlecht, Klassenstufe und jahrgangshomogenen bzw. jahrgangsgemischten Klassen passen diese in ein nomologisches Netzwerk und tragen so zur Konstruktvalidität bei (vgl. Wagner et al., 2013). Unsere Analyse berücksichtigt die bloß ordinale Natur der Items und wird damit ihrer Schiefe gerecht, die teils auch in den manifesten Skalen deutlich zum Ausdruck kommt (vgl. Tab. 1). Sie basiert jedoch auf hochparametrisierten Modellen und einer im Verhältnis dazu geringen Klassenzahl. Dies schränkt die Aussagekraft besonders hinsichtlich der Messinvarianz und der Modellpassung ein. Gleichzeitig zeigen die Analysen auf der Basis manifester Skalen, sowohl manifest als auch latent aggregiert, dass die Ergebnisse gegenüber diesen methodischen Varianten insgesamt robust sind. Weiter kann nicht ausgeschlossen werden, dass es sich um eine selektive Stichprobe handelt. Zwar wurde eine Studienbeteiligung teilweise durch einzelne Schulleitungen verordnet, es ist aber davon auszugehen, dass sich die meisten Lehrpersonen freiwillig für eine Studienteilnahme meldeten und deshalb ein positiver Verzerrungseffekt hochmotivierter Lehrpersonen nicht ausgeschlossen werden kann. Die vorliegenden Ergebnisse können deshalb, besonders was Aussagen zum Störungsniveau betrifft, nicht generalisiert werden. Für den Vergleich der Klassen- und der Fachlehrpersonen wurden die Items in zwei Spalten präsentiert. Diese Präsentationsform führt unter Umständen zu einer verstärkten Kontrastierung, welche zu einer Überschätzung zwischen den Unterschieden zwischen Klassen- und Fachlehrpersonen führt. Schließlich muss aus methodischer Sicht berücksichtigt werden, dass die vorgestellte konfirmatorische Mehrebenen-Fak- 14 Alexander Wettstein, Erich Ramseier, Marion Scherzinger torenanalyse zwar formal dem klassischen Vorgehen einer konfirmatorischen Faktorenanalyse entspricht, hier aber eher einen konstituierenden, explorativen als einen hypothesentestenden Charakter hat. Die vorliegenden Ergebnisse müssen deshalb in einem nächsten Schritt an einer unabhängigen Stichprobe validiert werden. Dabei wären auch methodische Vertiefungen wünschenswert. So könnte insbesondere die Erfassung von Störungen des methodisch-didaktischen Settings optimiert und eine vertiefte Auseinandersetzung mit der Frage der Messinvarianz ins Auge gefasst werden (Jak, Oort & Dol, 2014; Wagner et al., 2013; gegenüber Stapleton et al., 2016). Im vorliegenden Beitrag wurde nur die Perspektive der Schülerinnen und Schüler berücksichtigt. Es ist jedoch davon auszugehen, dass Lehrpersonen und Forschende Unterricht anders wahrnehmen als die Schülerinnen und Schüler. Wir werden in zukünftigen Arbeiten weiterführend in einem multimethodalen und mehrperspektivischen Design mittels Videobeobachtung und Interviews auch die Perspektive der Lehrpersonen und außenstehender Beobachter einbeziehen. Literatur Asparouhov, T. & Muthén, B. (2007). Computationally efficient estimation of multilevel high-dimensional latent variable models. Proceedings of the 2007 JSM meeting in Salt Lake City, Utah, Section on Statistics in Epidemiology. Brouwers, A. & Tomic, W. (1999). Teacher burnout, perceived self-efficacy in classroom management, and student disruptive behaviour in secondary education. Curriculum and Teaching, 14 (2), 7-26. http: / / dx.doi. org/ 10.7459/ ct/ 14.2.02 Brouwers, A. & Tomic, W. (2000). A longitudinal study of teacher burnout and perceived self-efficacy in classroom management. Teaching and Teacher Education, 16, 239 - 253. http: / / dx.doi.org/ 10.1016/ S0742-051 X(99)00057-8 Card, N. A., Stucky, B. D., Sawalani, G. M. & Little, T. D. (2008). Direct and indirect aggression during childhood and adolescence: A meta-analytic review of gender differences, intercorrelations, and relations to maladjustment. Child Development, 79, 1185 - 1229. http: / / dx.doi.org/ 10.1111/ j.14678624.2008.01184.x Clausen, M. (2002). Unterrichtsqualität: Eine Frage der Perspektive? Empirische Analysen zur Übereinstimmung, Konstrukt- und Kriteriumsvalidität. Münster: Waxmann. Dettmers, S., Trautwein, U., Lüdtke, O., Kunter, M. & Baumert, J. (2010). Homework works if homework quality is high: Using multilevel modeling to predict the development of achievement in mathematics. Journal of Educational Psychology, 102, 467 - 482. http: / / dx.doi.org/ 10.1037/ a0018453 Dreesmann, H. (1982). Unterrichtsklima - Wie Schüler den Unterricht wahrnehmen. Weinheim: Beltz. Duckworth, A. L. & Seligman, M. E. (2006). Self-discipline gives girls the edge: Gender in self-discipline, grades, and achievement test scores. Journal of Educational Psychology, 98, 198. Eccles, J. S. & Midgley, C. (1989). Stage-environment fit: Developmentally appropriate classrooms for young adolescents. In C. Ames & R. Ames (Eds.), Research on motivation in education. Vol. 3: Goals and cognitions (pp. 139 - 186). San Diego, CA: Academic Press. Evers, W. J. G., Tomic, W. & Brouwers, A. (2004). Burnout among teachers. School Psycholog y International, 25, 131 - 148. http: / / dx.doi.org/ 10.1177/ 014303430404 3670 Fauth, B., Decristan, J., Rieser, S., Klieme, E. & Büttner, G. (2014 a). Student ratings of teaching quality in primary school: Dimensions and prediction of student outcomes. Learning and Instruction, 29, 1 - 9. http: / / dx.doi.org/ 10.1016/ j.learninstruc.2013.07.001 Fauth, B., Decristan, J., Rieser, S., Klieme, E. & Büttner, G. (2014b). Grundschulunterricht aus Schüler-, Lehrer- und Beobachterperspektive: Zusammenhänge und Vorhersage von Lernerfolg. Zeitschrift für Pädagogische Psychologie, 28, 127 - 137. http: / / dx.doi.org/ 10.1024/ 1010-0652/ a000129 Fend, H. & Stöckli, G. (1997). Der Einfluss des Bildungssystems auf die Humanentwicklung: Entwicklungspsychologie der Schulzeit. In F. E. Weinert (Hrsg.), Psychologie des Unterrichts und der Schule. Enzyklopädie der Psychologie: Pädagogische Psychologie (Bd. 3, S. 1 - 35). Göttingen: Hogrefe. Frenzel, A. C., Pekrun, R. & Goetz, T. (2007). Perceived learning environment and students’ emotional experiences: A multilevel analysis of mathematics classrooms. Learning and Instruction, 17, 478 - 493. http: / / dx.doi.org/ 10.1016/ j.learninstruc.2007.09.001 Friedman, I. A. (2006). Classroom management and teacher stress and burnout. In C. M. Evertson & C. S. Weinstein (Eds.), Handbook of classroom management. Research, practice, and contemporary issues (pp. 925 - 944). Mahwah, NJ: Lawrence Erlbaum. Geldhof, G. J., Preacher, K. J. & Zyphur, M. J. (2014). Reliability estimation in a multilevel confirmatory factor analysis framework. Psychological Methods, 19, 72 - 91. Grilli, L. & Rampichini, C. (2007). Multilevel factor models for ordinal variables. Structural Equation Modeling, 14, 1 - 25. http: / / dx.doi.org/ 10.1080/ 10705510709 336734 Haladyna, T. & Hess, R. K. (1994). The detection and correction of bias in student ratings of instruction. Research in Higher Education, 35, 669 - 687. http: / / dx. doi.org/ 10.1007/ BF02497081 Hannover, B. & Kessels, U. (2011). Sind Jungen die neuen Bildungsverlierer? Empirische Evidenz für Geschlechterdisparitäten zuungunsten von Jungen und Erklärungsansätze. Zeitschrift für Pädagogische Psychologie, 25, 89 - 103. http: / / dx.doi.org/ 10.1024/ 1010-0652/ a000039 Schülerwahrnehmung von Störungen im Unterricht 15 Hattie, J. (2009). Visible learning: A synthesis of meta-analyses relating to achievement. London: Routledge. Helmke, A. (2009). Unterrichtsqualität und Lehrerprofessionalität. Diagnose, Evaluation und Verbesserung des Unterrichts. Seelze-Velber: Kallmeyer. Herzog, W., Herzog, S., Brunner, A. & Müller, H. P. (2005). Einmal Lehrer immer Lehrer? Eine vergleichende Untersuchung der Berufskarrieren von (ehemaligen) Primarlehrpersonen. Bern: Haupt. Hox, J. (2010). Multilevel analysis: Techniques and applications (2nd ed.). New York, NY: Routledge. Hu, L.-T. & Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling, 6, 1 - 55. http: / / dx.doi.org/ 10.1080/ 107055 19909540118 Hüfner, G. (2003). Die Belastungsprofile einzelner Lehrergruppen. Bayerischer Lehrer- und Lehrerinnen-Verband (BLLV), 10, 12 - 15. Ingersoll, R. M. (2001). Teacher turnover and teacher shortages: An organizational analysis. American Educational Research Journal, 37, 499 - 534. http: / / dx.doi.org/ 10.3102/ 00028312038003499 Jak, S., Oort, F. J. & Dol, C. V. (2014). Measurement bias in multilevel data. Structural Equation Modeling: A Multidisciplinary Journal, 21, 31 - 39. http: / / dx.doi.org/ 10.1080/ 10705511.2014.882666 Kunter, M. & Baumert, J. (2006). Who is the expert? Construct and criteria validity of student and teacher ratings of instruction. Learning Environments Research, 9, 231 - 251. http: / / dx.doi.org/ 10.1007/ s10984-006- 9015-7 Lewis, R., Romi, S., Qui, X. & Katz, Y. J. (2005). Teacher’s classroom discipline and student misbehavior in Australia, China and Israel. Teaching and Teacher Education, 21, 729 - 741. http: / / dx.doi.org/ 10.1016/ j.tate. 2005.05.008 Lubbers, M. J. (2003). Group composition and network structure in school classes: A multilevel application of the p* model. Social Networks, 25 (4), 309 - 332. http: / / dx.doi.org/ 10.1016/ S0378-8733(03)00013-3 Lüdtke, O., Marsh, H. W., Robitzsch, A. & Trautwein, U. (2011). A 2 x 2 taxonomy of multilevel latent contextual model: Accuracy-bias trade-offs in full and partial error correction models. Psychological Methods, 16, 444 - 467. http: / / dx.doi.org/ 10.1037/ a0024376 Lüdtke, O., Marsh, H. W., Robitzsch, A., Trautwein, U., Asparouhov, T. & Muthén, B. (2008). The multilevel latent covariate model: A new, more reliable approach to group-level effects in contextual studies. Psychological Methods, 13, 203. Lüdtke, O., Robitzsch, A., Trautwein, U. & Kunter, M. (2009). Assessing the impact of learning environments: How to use student ratings of classroom and school characteristics in multilevel modeling. Contemporary Educational Psychology, 34, 120 - 131. http: / / dx. doi.org/ 10.1016/ j.cedpsych.2008.12.001 Lüdtke, O., Trautwein, U., Kunter, M. & Baumert, J. (2006). Analyse von Lernumwelten. Ansätze zur Bestimmung der Reliabilität und Übereinstimmung von Schülerwahrnehmungen. Zeitschrift für Pädagogische Psychologie, 20, 85 - 96. http: / / dx.doi.org/ 10.1024/ 10 10-0652.20.12.85 Lüdtke, O., Trautwein, U., Schnyder, I. & Niggli, A. (2007). Simultane Analysen auf Schüler- und Klassenebene: Eine Demonstration der konfirmatorischen Mehrebenen-Faktorenanalyse zur Analyse von Schülerwahrnehmungen am Beispiel der Hausaufgabenvergabe. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 39, 1 - 11. http: / / dx.doi.org/ 10. 1026/ 0049-8637.39.1.1 Makarova, E., Herzog, W. & Schönbächler, M.-T. (2014). Wahrnehmung und Interpretation von Unterrichtsstörungen aus Schülerperspektive sowie aus Sicht der Lehrpersonen. Psychologie in Erziehung und Unterricht, 61, 127 - 140. http: / / dx.doi.org/ 10.2378/ peu2014.art 11d Marsh, H. W., Lüdtke, O., Nagengast, B., Trautwein, U., Morin, A. J. S., Adbuljabbar, A. & Köller, O. (2012). Classroom climate and contextual effects. Methodological issues in the evaluation of group-level effects. Educational Psychologist, 47, 106 - 124. http: / / dx.doi. org/ 10.1080/ 00461520.2012.670488 Marsh, H. W., Lüdtke, O., Robitzsch, A., Trautwein, U., Asparouhov, T., Muthén, B. & Nagengast, B. (2009). Doubly-latent models of school contextual effects: Integrating multilevel and structural equation approaches to control measurement and sampling error. Multivariate Behavioral Research, 44 (6), 764 - 802. http: / / dx.doi.org/ 10.1080/ 00273170903333665 Muthén, B. O. (1994). Multilevel covariance structure analysis. Sociological Methods and Research, 22, 376 - 398. http: / / dx.doi.org/ 10.1177/ 0049124194022003006 Muthén, L. K. & Muthén, B. O. (2004). Mplus technical appendices. Los Angeles, CA: Muthén & Muthén. Muthén, L. K. & Muthén, B. O. (2012). Mplus user’s guide (7th ed.). Los Angeles, CA: Muthén & Muthén. Pfitzner, M. & Schoppek, W. (2000). Gemeinsamkeiten und Diskrepanzen in der Bewertung von Unterrichtsstörungen durch Lehrer und Schüler - eine empirische Untersuchung. Unterrichtswissenschaft, 28, 350 - 378. Raffaelli, M. & Duckett, E. (1989). “We were just talking …”: Conversation in early adolescence. Journal of Youth and Adolescence, 18, 567 - 582. http: / / dx.doi. org/ 10.1007/ BF02139074 Sälzer, C., Trautwein, U., Lüdtke, O. & Stamm, M. (2012). Predicting adolescent truancy: The importance of distinguishing between different aspects of instructional quality. Learning and Instruction, 22, 311 - 319. http: / / dx.doi.org/ 10.1016/ j.learninstruc.2011.12.001 Stapleton, L. M., Yang, J. S. & Hancock, G. R. (2016). Construct meaning in multilevel settings. Journal of Educational and Behavioral Statistics, 41, 481 - 520. Trautwein, U., Lüdtke, O., Schnyder, I. & Niggli, A. (2006). Predicting homework effort: Support for a domain-specific, multilevel homework model. Journal of Educational Psychology, 98, 438 - 456. http: / / dx.doi. org/ 10.1037/ 0022-0663.98.2.438 Vitaro, F., Brendgen, M. & Tremblay, R. E. (1999). Prevention of school dropout through the reduction of disruptive behaviors and school failure in elementary school. Journal of School Psycholog y, 37, 205 - 226. http: / / dx.doi.org/ 10.1016/ S0022-4405(99)00006-0 Wagner, W. (2008). Methodenprobleme bei der Analyse der Unterrichtswahrnehmung aus Schülersicht - am Beispiel der Studie DESI (Deutsch Englisch Schülerleistungen International) der Kultusministerkonferenz. Dissertation, Universität Koblenz-Landau. Wagner, W., Göllner, R., Helmke, A., Trautwein, U. & Lüdtke, O. (2013). Construct validity of student perceptions of instructional quality is high, but not perfect: Dimensionality and generalizability of domain- 16 Alexander Wettstein, Erich Ramseier, Marion Scherzinger independent assessments. Learning and Instruction, 28, 1 - 11. http: / / dx.doi.org/ 10.1016/ j.learninstruc.2013. 03.003 Wagner, W., Göllner, R., Werth, S., Voss, T., Schmitz, B. & Trautwein, U. (2016). Student and teacher ratings of instructional quality: Consistency of ratings over time, agreement, and predictive power. Journal of Educational Psychology, 108, 705 - 721. http: / / dx.doi.org/ 10.1037/ edu0000075 Wentzel, K. R. (2004). Understanding classroom competence: The role of social-motivational and self-processes. In R. V. Kail (Ed.), Advances in child development and behavior (Vol. 32, pp. 213 - 241). Amsterdam: Elsevier Academic Press. Wettstein, A. (2008). Beobachtungssystem zur Analyse aggressiven Verhaltens in schulischen Settings (BASYS). Bern: Huber. Wettstein, A. (2010). Lehrpersonen in schwierigen Unterrichtssituationen unterstützen. Ein pädagogisch-didaktisches Coaching zur Prävention von Unterrichtsstörungen. Vierteljahresschrift für Heilpädagogik und ihre Nachbargebiete, 2, 145 - 157. http: / / dx.doi.org/ 10.2378/ vhn2010.art12d Wettstein, A., Scherzinger, M. & Wyler, S. (2016). Der Fragebogen zur Erfassung von Störungen im Unterricht. Faktorenstruktur der Schülerinnen- und Schülerversion. Empirische Sonderpädagogik, 2, 189 - 202. Winkel, R. (2005). Der gestörte Unterricht. Diagnostische und therapeutische Möglichkeiten (7. Aufl.). Baltmannsweiler: Schneider Verlag Hohengehren. Prof. Dr. Alexander Wettstein Prof. Dr. Erich Ramseier Dr. Marion Scherzinger Pädagogische Hochschule Bern Fabrikstraße 8 CH-3012 Bern E-Mail: alexander.wettstein@phbern.ch
