eJournals Psychologie in Erziehung und Unterricht 65/1

Psychologie in Erziehung und Unterricht
3
0342-183X
Ernst Reinhardt Verlag, GmbH & Co. KG München
11
2018
651

Empirische Arbeit: Unterrichtsstörungen, Beziehung und Klassenführung aus Lehrer-, Schüler- und Beobachterperspektive

11
2018
Alexander Wettstein
Marion Scherzinger
Prof. Dr. Erich Ramseier
In einer multimethodalen Studie wurde untersucht, wie Lehrpersonen, Schülerinnen und Schüler und außenstehende Beobachter Unterrichtsstörungen, Beziehung und Klassenführung wahrnehmen. An 18 Klassen wurden die Schüler- und Lehrereinschätzungen mit den niedrig inferenten Kodierungen einer außenstehenden geschulten Beobachterin verglichen. Die Ergebnisse zeigen, dass die Schülerwahrnehmung von Störungen mit r = .62 sehr gut mit den niedrig inferenten Kodierungen der externen Beobachterin übereinstimmen. Die Störungswahrnehmung der Fachlehrpersonen korreliert mit .48, die der Klassenlehrpersonen nur zu .17 mit den niedrig inferenten Kodierungen der Beobachterin. Auch in der Einschätzung von Beziehung und Klassenführung stimmt die Beobachterin besser mit den Schüler- als mit den Lehrereinschätzungen überein.
3_065_2018_001_0058
n Empirische Arbeit Psychologie in Erziehung und Unterricht, 2018, 65, 58 -74 DOI 10.2378/ peu2018.art04d © Ernst Reinhardt Verlag München Basel Unterrichtsstörungen, Beziehung und Klassenführung aus Lehrer-, Schüler- und Beobachterperspektive Alexander Wettstein, Marion Scherzinger, Erich Ramseier Pädagogische Hochschule Bern Zusammenfassung: In einer multimethodalen Studie wurde untersucht, wie Lehrpersonen, Schülerinnen und Schüler und außenstehende Beobachter Unterrichtsstörungen, Beziehung und Klassenführung wahrnehmen. An 18 Klassen wurden die Schüler- und Lehrereinschätzungen mit den niedrig inferenten Kodierungen einer außenstehenden geschulten Beobachterin verglichen. Die Ergebnisse zeigen, dass die Schülerwahrnehmung von Störungen mit r = .62 sehr gut mit den niedrig inferenten Kodierungen der externen Beobachterin übereinstimmen. Die Störungswahrnehmung der Fachlehrpersonen korreliert mit .48, die der Klassenlehrpersonen nur zu .17 mit den niedrig inferenten Kodierungen der Beobachterin. Auch in der Einschätzung von Beziehung und Klassenführung stimmt die Beobachterin besser mit den Schülerals mit den Lehrereinschätzungen überein. Schlüsselbegriffe: Unterrichtsstörungen, Beziehung, Klassenführung, Schülerwahrnehmung, Lehrerwahrnehmung, Verhaltensbeobachtung Classroom Disturbances, Relationship and Classroom Management From the Perspective of Teachers, Students and External Observers Summary: How teachers, students and external observers perceive classroom disturbances, relationship and classroom management was investigated in a multi-methods study. In 18 classes, students’ und teachers’ ratings were compared with the low inferent codings of an external observer. The findings revealed that students’ perceptions of classroom disturbances correlated with r = .62 with the observer’s low inferent codings. While subject teachers’ perceptions of classroom disturbances correlated with .48, class teachers’ perceptions resulted only in a correlation of .17 with the observer’s low inferent codings. The correlation of the observer’s assessment of relationship and classroom management showed a similar result. The observer’s assessment correlation was higher with students’ ratings than with teachers’ ratings. Keywords: Classroom disturbances, relationship, classroom management, student perceptions, teacher perception, behavior observation Die mehrperspektivische Erfassung von Unterrichtsstörungen Während sich gelingender Unterricht durch eine hohe Dichte an Lehr-Lern-Prozessen sowie anerkennende und vertrauensvolle Interaktionen auszeichnet, kommt es im gestörten Unterricht zu zahlreichen Unterbrüchen, langwierigen Aushandlungen und Störungen des Lehr-Lern-Prozesses (Winkel, 2009). Wettstein, Scherzinger und Wyler (2016) identifizierten in einer explorativen Faktorenanalyse vier abgrenzbare Formen von Störungen im Unterricht: 1. nicht aggressives störendes Verhalten der Schülerinnen und Schüler. Dieser Faktor umfasst sowohl passive (tagträumen) als auch aktive (schwatzen) Störungen. 2. Offendirekte (bedrohen, schlagen und beschimpfen) und indirekte Formen (absichtlich beschuldigen, Gerüchte verbreiten und ausschließen) Unterrichtsstörungen, Beziehung und Klassenführung aus verschiedenen Perspektiven 59 aggressiven Schülerinnen- und Schülerverhaltens. 3. Aggressives Verhalten der Lehrperson gegen Schülerinnen und Schüler und 4. Störungen des methodisch-didaktischen Settings. Dieser Faktor umfasst Items, welche auf einen allgemein gestörten Unterricht hinweisen. Hier ist es für die Lehrperson schwierig, das geplante methodisch-didaktische Setting durchzusetzen und gute Voraussetzungen für Lehr-Lern-Prozesse zu schaffen. Der Unterricht wird durch viele Unterbrüche und lange Wechselphasen gestört. Störungen im Unterricht können folglich sowohl von Schülerinnen und Schülern wie auch von der Lehrperson ausgehen und sich auf das gesamte methodisch-didaktische Setting ausweiten und zu einer Arbeitsatmosphäre führen, die durch viele Unterbrüche und Unruhe geprägt ist. Eine gute Lehrer-Schüler-Beziehung, eine adaptive Klassenführung und eine anregende Unterrichtsgestaltung beugen Störungen vor (Wettstein, 2010). Eine gute Beziehung zur Lehrperson korreliert mit der Lernmotivation der Schülerinnen und Schüler (Wentzel, 2010) und der Schulleistung (Pianta, Hamre & Stuhlman, 2003). Weiter reduziert eine gute Lehrer- Schüler-Beziehung aggressives Schülerverhalten und fördert prosoziales Schülerverhalten (Obsuth et al., 2016). Eine adaptive Klassenführung umfasst u. a. ein effektives Monitoring, niederschwellige Interventionen, Regelklarheit und eine effiziente Zeitnutzung und erhöht die aktiv genutzte Lernzeit und damit auch den Lernerfolg (Carroll, 1989; Helmke, 2009). Weiter geht eine anregende, individualisierende und kognitiv aktivierende Unterrichtsgestaltung mit einer tiefen Störungsfrequenz einher (Wettstein, Thommen & Eggert, 2010). Unterschiedliche Rollen und Asymmetrie der Wahrnehmbarkeit Unterrichtsstörungen belasten sowohl Lehrpersonen wie auch die Schülerinnen und Schüler. Es ist jedoch davon auszugehen, dass Schülerinnen und Schüler und Lehrpersonen den Unterricht aufgrund ihrer unterschiedlichen Rollen anders wahrnehmen und andere Dinge als störend empfinden (Tillmann, 2004). Aufgabe der Lehrperson ist es, Lernprozesse auszulösen und zu begleiten. Aufgabe der Schülerinnen und Schüler ist es, dieses Unterrichtsangebot aktiv zu nutzen. Doch Schülerinnen und Schüler verfolgen im Unterricht nicht nur schulische Ziele. Gerade in der frühen Adoleszenz bietet der Unterricht auch eine willkommene Gelegenheit, sich mit Gleichaltrigen auszutauschen. Dadurch können Zielkonflikte zwischen Lehrpersonen und Schülerinnen und Schülern entstehen. Die Lehrperson möchte den Stoff vermitteln, während sich die Lernenden untereinander austauschen möchten. Zwischen der Lehrperson und den Schülerinnen und Schülern besteht zudem eine Asymmetrie der Wahrnehmbarkeit (Lortie, 1975; Wettstein, 2013). Die Lehrperson ist im Unterricht mit einer hohen sozialen Dichte, unstrukturierten Problembereichen, dynamischen Situationen und vielfältigen Anforderungen konfrontiert und handelt unter Druck. Sie muss die einzelnen Schülerinnen und Schüler so gut als möglich nach individualisierenden Prinzipien fördern und dabei auch noch die ganze Klasse im Auge behalten und allgemeine Regeln durchsetzen. Gleichzeitig beobachten 25 Schülerinnen und Schüler ihre Lehrperson aus einer weitgehend handlungsentlasteten Situation. Sie erleben zudem als Zuschauer, wie die Lehrperson mit anderen Schülerinnen und Schülern umgeht. Zwischen der Lehrperson und den Schülerinnen und Schülern besteht folglich eine Asymmetrie der Wahrnehmbarkeit (Lortie, 1975; Wettstein, 2013). Eine solche Asymmetrie ist auch zwischen der Lehrperson und außenstehenden Beobachtenden zu erwarten. Studien zur Unterrichtsqualität deuten allgemein auf eine geringe relative Übereinstimmung zwischen Schüler- und Lehrereinschätzungen des Unterrichts hin (Clausen, 2002; Desimone, 2009; Fauth, Decristan, Rieser, Klieme & Büttner, 2014 a, 2014 b; Kunter & Baumert, 2006; Wagner et al., 2016). Für Skalen wie Klassenführung, welche sich in den 60 Alexander Wettstein, Marion Scherzinger, Erich Ramseier meisten Studien im weitesten Sinne auf Störungen im Unterricht beziehen („…hat keiner den Unterricht gestört“), finden sich hingegen teilweise beträchtliche Übereinstimmungen zwischen Lehrer- und Schülereinschätzungen. Fauth et al. (2014 b) identifizierten mit Korrelationen von .45 bis .54 substanzielle Zusammenhänge zwischen der Lehrer-, Schüler- und Beobachterperspektive. Kunter und Baumert (2006) untersuchten u. a. Merkmale einer ineffizienten Klassenführung (z. B. „…teaching is very often interrupted“) aus Schüler- und Lehrerperspektive und identifizierten für diese Skala eine mittlere Übereinstimmung von .64 zwischen der Lehrer- und Schülerperspektive. Wagner et al. (2016) erfragten zu drei Messzeitpunkten Klassenführung, Zielklarheit und Autonomieunterstützung. Für die Skala Klassenführung, mit welcher Disziplinprobleme erfasst wurden (z. B. „In dieser Klasse wird der Unterricht kaum gestört“), fanden sich mit einer mittleren Korrelation über die drei Messzeitpunkte von .69 die höchsten Übereinstimmungen zwischen Lehrerpersonen und Schülerinnen und Schülern. Ein etwas anderes Bild zeigte sich bei Clausen (2002). Er fand für die Skalen Monitoring (z. B. „… weiß immer genau, was in der Klasse vor sich geht“) und Disziplin (z. B. „… wird der Unterricht oft sehr gestört“) mit Korrelationen von .07 und -.04 keine bzw. für die Skala Sozialorientierung der Lehrperson (z. B. „… kümmert sich um die Probleme der Schüler“) mit .34 mittlere Übereinstimmungen zwischen der Lehrer- und Schülerperspektive. Die geringen Übereinstimmungen für die Skalen Monitoring und Sozialorientierung könnten darauf zurückgeführt werden, dass hier nicht manifestes Verhalten, sondern Hypothesen über eigene bzw. fremde psychische Zustände abgefragt wurden. Die geringen Übereinstimmungen in der Skala Disziplin, welche in erster Linie manifeste Störungen erfasst, sind jedoch konträr zu den oben berichteten Befunden. Als Fazit lässt sich festhalten, dass in den genannten Studien die Skala Klassenführung in erster Linie Disziplinprobleme und Unterrichtsstörungen erfasst und für dieses Merkmal, mit Ausnahme der Studie von Clausen (2002), hohe Übereinstimmungen zwischen der Lehrer- und Schülerperspektive identifiziert wurden. Helmke und Lenske (2013) fordern, bei der Unterrichtsdiagnostik ausdrücklich unterschiedliche Sichtweisen einzubeziehen und verstärkt auf Perspektivenabweichungen zu fokussieren. In der Erfassung von Unterrichtsstörungen müssen deshalb die rollenspezifischen Sichtweisen der Lehrpersonen wie auch der Lernenden berücksichtigt werden. Dabei ist davon auszugehen, dass mit jeder Perspektive spezifische Vor- und Nachteile verbunden sind. Die Perspektive der Lehrperson Lehrpersonen verfügen aufgrund ihrer Ausbildung und ihrer Berufserfahrung potenziell über pädagogisch-didaktische Expertise zur validen Einschätzung von Unterricht (Fauth et al., 2014 a, 2014 b). Die Komplexität und Gleichzeitigkeit der im Unterricht ablaufenden Prozesse erschweren jedoch eine korrekte Selbsteinschätzung. „Eine korrekte Selbsteinschätzung würde ja voraussetzen, dass man parallel zum unterrichtlichen Handeln von einer Metaebene aus ein kontinuierliches Monitoring des eigenen Handelns durchführt, dass man also ständig das eigene Verhalten und dessen Auswirkungen beobachtet und bilanziert. Damit wären Lehrer angesichts der Komplexität des Lehr-Lern-Geschehens im Klassenzimmer jedoch vollkommen überfordert“ (Helmke et al., 2011, S. 2). Es ist zudem nicht auszuschließen, dass die Lehrerurteile selbstwertdienlichen Verzerrungen unterliegen, welche den Unterricht in einem positiven Licht erscheinen lassen (Wubbels, Brekelmans & Hooymayers, 1992). Wir unterscheiden im Folgenden zwei Gruppen von Lehrpersonen: Klassen- und Fachlehrpersonen. In der deutschsprachigen Schweiz werden die Schülerinnen und Schüler bereits in der Primarstufe (Grundschule) von einer Klassenlehrperson und verschiedenen Fachlehrperso- Unterrichtsstörungen, Beziehung und Klassenführung aus verschiedenen Perspektiven 61 nen unterrichtet. In der Primarstufe findet sich im Gegensatz zur Sekundarstufe I und II eine stärkere rollenspezifische Aufteilung zwischen Klassen- und Fachlehrpersonen. Die Klassenlehrperson trägt die Hauptverantwortung für ihre Klasse, führt Klassenregeln ein, übernimmt einen Großteil des Unterrichts und ist primäre Ansprechperson für Schülerinnen und Schüler, Eltern sowie Schulbehörden. Die Schülerinnen und Schüler werden ergänzend von sogenannten Fachlehrpersonen unterrichtet, die nur einzelne Fächer an dieser Klasse erteilen. Bisher liegen nur vereinzelte Studien zum Unterricht von Fachlehrpersonen auf der Primarstufe vor. Beobachtungs- (Wettstein, 2008, 2010) und Fragebogenstudien (Wettstein, Ramseier, Scherzinger & Gasser, 2016) deuten darauf hin, dass im Unterricht von Fachlehrpersonen generell mehr Störungen auftreten als im Unterricht von Klassenlehrpersonen. Diese Befunde gehen mit einer Fragebogenstudie zu Belastungsprofilen einzelner Lehrergruppen (Hüfner, 2003) einher, bei welcher Fachim Vergleich zu Klassenlehrpersonen erhöhte Belastungen durch mangelnde Mitarbeit von Schülerinnen und Schülern und Disziplinprobleme im Unterricht berichten. Die Schülerinnen- und Schülerperspektive Die Schülerperspektive birgt eine Reihe von Vorteilen. Die Schülerinnen und Schüler beobachten den Unterricht aus einer weitgehend handlungsentlasteten Situation und sind somit im Gegensatz zur Lehrperson im Beobachtungsvorteil (Wettstein, 2013). Ihre Urteile stützen sich auf eine breite Basis an Erfahrungen über viele Unterrichtstunden hinweg (Baumert et al., 2004). Doch nicht alle Schülerinnen und Schüler einer Klasse stimmen in ihren Einschätzungen des Unterrichts überein. Wagner (2008) unterscheidet zwischen einer geteilten (kollektiven) und einer ungeteilten (individuellen) Wahrnehmung. Dabei spiegeln ungeteilte Wahrnehmungen die individuelle Sichtweise der einzelnen Schülerinnen und Schüler wider, welche auf unterschiedliche Rollen innerhalb des Klassengefüges (z. B. Täter oder Opfer), unterschiedliche Behandlung durch die Lehrperson und individuelle Werte, Normen und Bedürfnisse der Lernenden zurückgeführt werden können. Um die ungeteilten, individuellen Wahrnehmungen von geteilten, kollektiven Wahrnehmungen der Schülerinnen und Schüler auf Klassenebene zu unterscheiden, müssen die Daten mehrebenenanalytisch ausgewertet und die Intraklassenkorrelationen bestimmt werden (Lüdtke, Trautwein, Kunter & Baumert, 2006). In einer Fragebogenstudie zur Erfassung von Unterrichtsstörungen aus Schülersicht (Wettstein, Ramseier & Scherzinger, in diesem Heft) wurde mittels einer doppelt latenten konfirmatorischen Mehrebenen-Faktorenanalyse (Marsh et al., 2009) untersucht, wie Schülerinnen und Schüler aggressive und nicht aggressive Störungen im Unterricht der Klassenlehrperson und im Unterricht einer Fachlehrperson wahrnehmen. Die Analyse ist in doppeltem Sinne latent, da einerseits statt manifester Skalenwerte latente Variablen modelliert werden, um den Messfehler dieser Konstrukte zu berücksichtigen. Andererseits werden nicht einfach auf Klassenebene aggregierte manifeste Werte verwendet, sondern berücksichtigt, dass diese abhängig von der Klassengröße fehlerbehaftete Schätzwerte eines latenten wahren Wertes auf Klassenebene sind (z. B. Marsh et al., 2009). Die Ergebnisse deuten darauf hin, dass die Schülerinnen und Schüler einer Klasse den Unterricht nicht nur aufgrund individueller Maßstäbe einschätzen, sondern über eine ausreichend hohe geteilte Unterrichtswahrnehmung verfügen. Die Intraklassenkorrelationen der Schülereinschätzungen betrugen auf Indikatorenebene durchschnittlich .19 (.18 für den Unterricht der Klassen- und .20 für den Unterricht der Fachlehrperson) und auf Ebene der latenten Skalen durchschnittlich .28 (.26 für die Klassen- und .30 für die Fachlehrperson). Die Beurteilungsunterschiede sind somit nicht nur individuellen Schülerwahrnehmungen, sondern auch realen Unterschieden zwischen den Klassen zuzuschreiben. 62 Alexander Wettstein, Marion Scherzinger, Erich Ramseier Nebst den eingangs genannten Vorteilen sind mit der Schülerperspektive auch Nachteile verbunden. So ist es denkbar, dass die Schülerinnen und Schüler aufgrund ihres fehlenden methodisch-didaktischen Wissens in der Unterrichtsbeurteilung die didaktischen Absichten der Lehrperson möglicherweise missverstehen (Wagner, 2008). Man könnte deshalb geneigt sein, das Schülerurteil aufgrund fehlender didaktischer Kompetenz anzuzweifeln. Doch die Schülerinnen und Schüler handeln nicht aufgrund objektiver Umweltgegebenheiten, sondern aufgrund ihrer Wahrnehmung, welche wiederum ihr Verhalten und ihre Entwicklung bestimmt. Deshalb sind diese Wahrnehmungen wahrscheinlich die besseren Prädiktoren für ihr Verhalten als die Einschätzungen der Lehrperson oder die Erfassung manifester Indikatoren durch externe Beobachter (De Jong & Westerhof, 2001). Die Perspektive außenstehender Beobachter Die Lehrer- und Schülersicht auf den Unterricht kann durch eine weitere Perspektive, die geschulter außenstehender Beobachterinnen und Beobachter, ergänzt werden. Helmke (2009, S. 288) bezeichnet die systematische Videobeobachtung des Unterrichts „als Königsweg zur Beschreibung und Bewertung des Unterrichts“. Externe Beobachterinnen und Beobachter können viele verschiedene Klassen vergleichen, sie entscheiden regelgeleitet und nachvollziehbar, sie sind nicht in die Interaktion involviert und können daher eher eine objektive Außenperspektive einnehmen (Praetorius, Lenske & Helmke, 2012). Die Videobeobachtung ist jedoch auch mit Nachteilen verbunden. Da Videobeobachtung sehr zeitaufwendig ist, kann meist nur ein kurzer Ausschnitt des Unterrichts beobachtet werden. Die Beobachtung stellt folglich nur eine Momentaufnahme des Geschehens im Klassenzimmer dar, was ihre Validität infrage stellt. Weiter fehlen außenstehenden Beobachterinnen und Beobachtern teilweise wichtige Kontextinformationen; insbesondere zur Beziehung zwischen den verschiedenen Interaktionsteilnehmenden. Zudem kann Videografie Reaktivität auf Seiten der Lehrperson und der Lernenden auslösen. Sowohl die Lehrperson wie auch die Schülerinnen und Schüler verhalten sich anders, wenn sie wissen, dass sie gefilmt werden. Videografierte Einzellektionen könnten somit als „(a) somewhat idealized version of what the teacher normally does in the classroom“ (Stigler, 1998, S. 141; zitiert nach Praetorius, 2013, S. 181) bezeichnet werden. „Helmke hingegen verweist darauf, dass sich bestimmte Verhaltensweisen von Lehrkräften, insbesondere Routinen, kurzfristig kaum verändern lassen und daher auch beobachteter Unterricht einen guten Einblick in den regulären Unterricht bieten sollte“ (Praetorius, 2013, S. 181). Die Beobachter bewegen sich im Spannungsfeld hoch und niedrig inferenter Beobachtung (Clausen, Reusser & Klieme, 2003; Pauli & Reusser, 2006). Niedrig inferente Beobachtungen beschränken sich auf die Erfassung des manifesten Verhaltens (z. B. Kinder schlagen andere Kinder), das einfach und objektiv zu kodieren ist und nur ein geringes Maß an Interpretation erfordert. Hoch inferente Beobachtungskategorien (z. B. gute Beziehung) gehen dagegen über das manifest beobachtbare Verhalten hinaus und erfordern ein hohes Maß an Schlussfolgerungen. So kann eine gute Lehrer-Schüler- Beziehung nicht direkt aus dem manifesten Verhalten der Interaktionsteilnehmenden abgelesen werden, sondern erfordert den Einbezug vieler Indikatoren und weitreichende Interpretationen. Der Beobachter bzw. die Beobachterin steht bei der Wahl des Inferenzgrads vor einem Übereinstimmungs-Bedeutsamkeits-Dilemma (Clausen, 2002). Die niedrig inferente Beobachtung von Oberflächenmerkmalen führt zwar zu einer hohen Objektivität, erfasst aber unter Umständen die für den Unterricht bedeutsamen Tiefenstrukturen nur ungenügend (Clausen et al., 2003). Hoch inferente Merkmale haben eine größere Erklärungskraft, sind jedoch weitaus anfälliger für Beurteilungsfehler. Im Idealfall gilt es deshalb, gegenstandsabhängig sowohl auf hoch wie auch niedrig inferente Beobachtungskategorien zurückzugreifen. Unterrichtsstörungen, Beziehung und Klassenführung aus verschiedenen Perspektiven 63 Allgemeine versus lektionsspezifische Einschätzungen Einzelne Fragebogenstudien unterscheiden sich darin, ob ein spezifischer Beurteilungszeitraum für die Einschätzung angegeben wird oder ob die Ergebnisse allgemein über den Messzeitpunkt hinaus generalisiert erhoben werden. Bei einer allgemeinen Einschätzung könnte der Fall auftreten, dass sich einige Schülerinnen und Schüler in ihrer Beurteilung auf das bereits vergangene Schuljahr beziehen, während andere wiederum ihr Urteil auf den letzten salienten Eindruck stützen. Dadurch können sehr unterschiedliche Beurteilungsergebnisse resultieren (Göllner et al., 2016). Weiter gehen Studien, die auf allgemeine Einschätzungen ohne Angabe eines Referenzzeitraumes zurückgreifen, implizit davon aus, dass unterschiedliche Unterrichtsstunden einer Lehrperson vergleichbar sind. Damit wird die Unterrichtsqualität als eine statische Größe betrachtet und temporalen sowie situationalen Schwankungen wenig Rechnung getragen (Göllner et al., 2016). Das tatsächliche Lehrerhandeln kann jedoch in hohem Ausmaß durch situative Merkmale der Lektion beeinflusst werden (Praetorius, 2013). Schließlich ist die Stabilität bzw. Variabilität der Urteile gegenstandsabhängig. So scheinen die Dimensionen Klassenführung und Schülerorientierung eher stabil über mehrere Unterrichtsstunden zu sein, während z. B. die Dimension kognitive Aktivierung variabler ist (Praetorius, 2012). Zusammenfassend lassen sich aus methodischer Sicht höhere relative Übereinstimmungen zwischen Lehrer- und den auf Klassenebene aggregierten Schülerurteilen dort erwarten, wo (a) in der Schüler- und Lehrerversion eine möglichst äquivalente Itemformulierung gewählt wird, (b) sich die Einschätzungen auf niedrig inferente Merkmale beziehen, (c) ein klar umrissener Referenzzeitraum für die Beurteilung festgelegt wird und (d) die Beurteilenden ausreichende Kenntnisse über den zu beurteilenden Gegenstand verfügen (vgl. Kunter & Baumert, 2006; Wagner et al., 2016). Unterrichtsstörungen aus Lehrer-, Schüler- und Beobachterperspektive Bisher liegen bereits einige Studien vor, welche die Merkmale der Unterrichtsqualität aus Schüler- und Lehrerperspektive (Kunter & Baumert, 2006; Wagner et al., 2016) bzw. aus Schüler-, Lehrer- und Beobachterperspektive (Clausen, 2002; Fauth et al., 2014 a, 2014 b) erfassen. In diesen Studien wurden Störungen über das Konstrukt der Klassenführung oder Disziplinprobleme erfasst. Dabei wurden für Störungen im Unterricht beträchtliche Übereinstimmungen zwischen der Lehrer- und Schülerperspektive identifiziert. Die vorliegende Studie unterscheidet sich von bisherigen Untersuchungen, indem sie unterschiedliche Formen nicht aggressiver und aggressiver Unterrichtsstörungen differenziert erfasst und dabei konzeptuell berücksichtigt, dass Störungen sowohl von den Schülerinnen und Schülern wie auch der Lehrperson ausgehen können. Weiter wird auf ein innovatives multimethodales Design mit Fragebogen und Videobeobachtung zurückgegriffen und Störungen aus Perspektive der Lehrpersonen, der Schülerinnen und Schüler sowie außenstehender Beobachter erfasst. Dabei werden insbesondere auch die unterschiedlichen Rollen von Klassen- und Fachlehrpersonen berücksichtigt. Während bereits Publikationen zur Schülerperspektive (Wettstein et al., in diesem Heft) und zum Vergleich der Lehrer- und Schülerperspektive (Wettstein, Ramseier et al., 2016) vorliegen, bezieht nun der vorliegende Beitrag neu auch die Perspektive einer außenstehenden Beobachterin ein. Fragestellungen und Hypothesen 1. Lehrer-, Schüler- und Beobachterperspektive: Inwieweit stimmen die Lehrer-, Schüler- und Beobachterurteile in der Einschätzung von Unterrichtsstörungen, Beziehung und Klassenführung des Unterrichts der Klassenlehrperson und einer Fachlehrperson überein? Wir erwarten höhere Übereinstimmungen zwischen den Schüler- und 64 Alexander Wettstein, Marion Scherzinger, Erich Ramseier Beobachterurteilen (Hypothese 1). Sowohl die externe Beobachterin wie auch die Schülerinnen und Schüler stehen im Gegensatz zur Lehrperson nicht unter Handlungsdruck und befinden sich gegenüber der Lehrperson in einer privilegierten Beobachterposition. Zudem werden über die Aggregation Idiosynkrasien der individuellen Schülerurteile herausgemittelt. 2. Inferenzgrad: Wir erwarten jedoch beträchtliche Unterschiede im Hinblick auf die Beurteilung unterschiedlicher Konstrukte. Die höchsten Übereinstimmungen werden für niedrig inferente Unterrichtsmerkmale wie nicht aggressive und aggressive Schülerstörungen und Störungen des methodischdidaktischen Settings erwartet, während in der Beurteilung hoch inferenter Merkmale wie Beziehung und Klassenführung weit geringere Beobachterübereinstimmungen erwartet werden (Hypothese 2). 3. Allgemeine versus lektionsspezifische Einschätzung: Weiter wird erwartet, dass die Lehrpersonen und die Lernenden in ihren spezifischen Einschätzungen der videografierten Lektionen besser übereinstimmen als in ihren allgemeinen Unterrichtseinschätzungen und dass diese Lektionen sowohl vonseiten der Lehrpersonen wie auch der Schülerinnen und Schüler signifikant positiver eingeschätzt werden als der alltägliche Unterricht (Hypothese 3). Methode Stichprobe und Design In der Studie Die Wahrnehmung sozialer Interaktionen im Unterricht wurden Unterrichtsstörungen, Beziehung und Klassenführung aus der Sicht von Klassen-, Fachlehrpersonen, der Schülerinnen und Schüler sowie einer außenstehenden Beobachterin multimethodal in drei Schritten mittels Fragebogen, Videobeobachtung und Interviews 1 erhoben. Dabei wurde der Frage nachgegangen, welche Zusammenhänge zwischen den Beurteilerperspektiven auftreten. Eine Besonderheit des Designs ist, dass die Lehrpersonen wie auch die Schülerinnen und Schüler den Unterricht zweimal einschätzten. In einem ersten Schritt mit einem allgemeinen Fragebogen und nach der Videobeobachtung mit einem lektionsspezifischen Fragebogen. Insgesamt nahmen an der Studie N = 83 fünfte und sechste Klassen aus dem deutschsprachigen Kanton Bern teil - 29 fünfte Klassen, 26 sechste Klassen und 28 Mehrjahrgangsklassen, in welchen die Schülerinnen und Schüler der fünften und sechsten Klasse gemeinsam unterrichtet werden. In allen untersuchten Klassen wurden die Fünftklässler zum Untersuchungszeitpunkt seit einem halben Jahr und die Sechstklässler seit anderthalb Jahren von ihren Lehrpersonen unterrichtet. Insgesamt unterrichten die befragten Fachlehrpersonen rund dreimal weniger an der Klasse als die Klassenlehrpersonen. Eine anteilsmäßige Betrachtung zeigt jedoch, dass beide Lehrergruppen sowohl in selektionsrelevanten Fächern wie auch in sprachlichen, mathematischen und naturwissenschaftlichen Fächern in vergleichbarer Weise vertreten sind. Fragebogenstudie Im ersten Teil füllten N = 1290 Schülerinnen und Schüler (48,2 % Mädchen, M = 11.47 Jahre alt, SD = 0.77), deren Klassenlehrpersonen (n = 83, 65,1 % weiblich, M = 39.5 Jahre alt, SD = 11.78) sowie Fachlehrpersonen (n = 83, 75,9 % weiblich, M = 42.5 Jahre alt, SD = 11.05) einen allgemeinen Fragebogen ohne Angabe eines Referenzzeitraums zur Erfassung von Unterrichtsstörungen, Beziehung und Klassenführung aus. Videostudie Für die Identifikation der Videostichprobe wurden anschließend in einem zweistufigen Rankingverfahren aufgrund der Differenz der Schülereinschätzungen und der Einschätzungen der Klassenlehrperson sowie der Summe des eingeschätzten Störungsausmaßes vier Gruppen gebildet: Die Auswahl der Videostichprobe weist zwar Ähnlichkeiten zu einer stratifizierten Stichprobenziehung auf. Da die einzelnen Klassen allerdings nicht zufällig, sondern u. a. auch aufgrund der Teilnahmebereitschaft ausgewählt wurden, handelt es sich nicht um eine stratifizierte Stichprobe im strengen Sinn. Aus der Gesamtstichprobe 1 Auf die Interviews wird in diesem Beitrag nicht weiter eingegangen. Interessierte Leserinnen und Leser seien auf Scherzinger, Wettstein und Wyler (2017) verwiesen. Unterrichtsstörungen, Beziehung und Klassenführung aus verschiedenen Perspektiven 65 wurde eine Teilstichprobe von 18 Klassen ausgewählt: (a) zwei Klassen, in welchen der Unterricht sowohl von der Lehrperson wie auch den Schülerinnen und Schülern konvergent positiv eingeschätzt wurde. (b) Sechs Klassen, in welchen der Unterricht sowohl von der Lehrperson wie auch den Schülerinnen und Schülern konvergent negativ eingeschätzt wurde. (c) Fünf Klassen, in welchen die Lehrperson deutlich mehr Unterrichtsstörungen wahrnahm als die Schülerinnen und Schüler (divergent I) und (d) fünf Klassen, in welchen die Schülerinnen und Schüler mehr Störungen wahrnahmen als die Lehrperson (divergent II). Die konvergent-positiven Klassen sind somit in der Stichprobenauswahl untervertreten. Dies ist darauf zurückzuführen, dass Videokodierung aufwendig ist und das Hauptinteresse der Studie bei Klassen mit hohen Störeinschätzungen lag. Deshalb wurden bei den konvergent positiven Klassen Ressourcen eingespart. Die Korrelationen zwischen Lehrer- und Schülerurteilen der Videostichprobe unterscheiden sich nicht signifikant von der Gesamtstichprobe, sodass hinsichtlich der Korrelationsmuster von einer vergleichbaren Stichprobe gesprochen werden kann. Die Videostichprobe setzte sich aus fünf fünften Klassen, sieben sechsten Klassen und sechs Mehrjahrgangsklassen mit insgesamt 272 Schülerinnen und Schülern, 18 Klassen- und 17 Fachlehrpersonen zusammen. Die Videostichprobe unterschied sich in den einzelnen Skalen im Mittel nicht signifikant von der ursprünglichen Stichprobe und auch die Korrelationsmuster zwischen Lehrer- und Schülerurteilen waren in beiden Stichproben vergleichbar. Aufgrund eines technischen Ausfalls liegen bei einer Fachlehrperson keine Videoaufnahmen vor. Alle Lehrpersonen, Schülerinnen und Schüler sowie deren gesetzliche Vertreter wurden um Einwilligung in die Videostudie ersucht. Die Klassenzimmer wurden mit zwei GoPro-Kameras sowie einem Diktafon ausgerüstet. Nach einer Eingewöhnungszeit von drei Tagen wurden an jeder Klasse der Unterricht der Klassenlehrperson sowie der ausgewählten Fachlehrperson während zwei bis drei Lektionen videografiert. Im Anschluss an die Videoaufnahmen verließ die Lehrperson das Klassenzimmer und die Schülerinnen und Schüler schätzten unter Anleitung der Forschungsassistentin das Störungsausmaß der videografierten Lektionen mit einer lektionsspezifischen Version des Fragebogens ein (vgl. Tab. 1). Die Lehrpersonen füllten die Lehrerversion des Fragebogens zur selben Zeit in einem anderen Zimmer aus. Im vorliegenden Beitrag liegt der Fokus auf den Ergebnissen der zweiten Projektphase, insbesondere auf dem Vergleich der Lehrer-, Schüler- und Beobachtereinschätzungen der videografierten Lektionen. Dabei wird untersucht, inwieweit Klassen-, Fachlehrer, Schülerinnen und Schüler sowie die Beobachterin in ihrer Wahrnehmung von Störungen im Unterricht, Beziehung und Klassenführung übereinstimmen. Instrumente Fragebogen zur Erfassung von Störungen im Unterricht Unterrichtsstörungen, Beziehung und Klassenführung wurden mit dem neu entwickelten Fragebogen zur Erfassung von Störungen im Unterricht (Wettstein, Scherzinger et al., 2016) erfasst. Das Instrument liegt in einer Lehrer- und einer Schülerversion vor und umfasst in seiner ursprünglichen Version sieben Skalen: Nicht aggressives Schülerverhalten, aggressives Schülerverhalten, aggressives Verhalten der Lehrperson, Störungen des methodisch-didaktischen Settings, Beziehung, Klassenführung und Peerbeziehungen. Die Entwicklung der Skalen sowie die explorative Faktorenanalyse sind in Wettstein, Scherzinger et al. (2016) und die vollständigen Lehrer- und Schüleritems in Wettstein, Ramseier et al. (2016) dokumentiert. Nachfolgend werden die Skalen anhand exemplarischer Beispielitems vorgestellt (vgl. Tab. 1). Die Skala nicht aggressives störendes Schülerverhalten beinhaltet sowohl passive (z. B. „Manche Schülerinnen und Schüler hören mir nicht richtig zu“) als auch aktive Störungen (z. B. „Einige Schülerinnen und Schüler schwatzen während Erklärungsphasen“). Die Skala Schüleraggression umfasst offen-direkte (z. B. „Kinder bedrohen andere Kinder“) und indirekte Formen aggressiven Schülerverhaltens (z. B. „Kinder beschuldigen absichtlich andere Kinder, obwohl diese gar nichts gemacht haben“). Die Skala aggressives Verhalten der Lehrperson wurde nur den Schülerinnen und Schülern vorgelegt und erfasst aggressives Verhalten der Lehrperson gegen Schülerinnen und Schüler. Während die Items „lächerlich machen“ und „heruntermachen“ definitorisch eindeutig aggressivem Verhalten zuzuordnen sind, floss mit „ungerechter Behandlung“ auch ein Item in diesen Faktor ein, welches keine Aggression im strengen Sinne bezeichnet. Die Skala Störungen des metho- 66 Alexander Wettstein, Marion Scherzinger, Erich Ramseier disch-didaktischen Settings umfasst Items, welche auf einen allgemein gestörten Unterricht hinweisen (z. B. „Beim Wechsel von verschiedenen Arbeiten dauert es sehr lange, bis alle Schülerinnen und Schüler wieder bereit sind“, „Ich muss oft eingreifen, um Aufmerksamkeit zu bekommen“). Hier ist es für die Lehrperson schwierig, das geplante methodisch-didaktische Setting durchzusetzen und gute Voraussetzungen für Lehr-Lern-Prozesse zu schaffen. Der Unterricht wird durch viele Unterbrüche und lange Wechselphasen gestört. Zwei weitere Skalen stellen abgrenzbare Konstrukte zur Bestimmung der Konstruktvalidität dar: Die Skala Beziehung umfasst sowohl Aspekte der Beziehungsals auch der Vermittlungsqualität. Zwei Items „Ich mag meine Klasse“, „Ich habe eine gute Beziehung zu meinen Schülerinnen und Schülern“ erfassen Beziehungsaspekte. Andere Items wurden faktoriell zwar der Beziehung zugeordnet, erfassen aber eher Aspekte der Vermittlungsqualität: „Meine Schülerinnen und Schüler finden, ich unterrichte interessant“ und „Ich unterrichte so, dass die Kinder aufmerksam sind und gut mitmachen“ (vgl. Wettstein, Scherzinger et al., 2016). Die Skala Klassenführung umfasst Aspekte niederschwelliger Interventionen „Bei einer Störung reagiere ich möglichst schnell und passend“ und Monitoring „Ich habe den Überblick über das, was in dieser Klasse geschieht“. Eine korrelationsbasierte Überprüfung der Konstruktvalidität (Wettstein, Ramseier et al., 2016) ergab distinktive negative Korrelationsmuster zwischen den drei Störungsformen (nicht aggressives störendes Schülerverhalten, aggressives Schülerverhalten und Störungen des methodisch-didaktischen Settings) und den zwei störungspräventiven Skalen (Beziehung und Klassenführung). In der gesamten Fragebogenentwicklung wurde eine möglichst ähnliche Itemformulierung zwischen der Lehrer- und Schülerversion angestrebt. Während drei Items zur Schüleraggression in der Lehrer- und Schülerversion identisch formuliert wurden, ergaben sich bei den anderen Skalen kleine Abweichungen. So wurden in der Schülerversion u. a. der Ausdruck „Schülerinnen und Schüler“ durch den Kurzausdruck „Kinder“ ersetzt und didaktische Fachbegriffe wie „Erklärungsphasen“ umschrieben mit „während die Lehrperson etwas erklärt“. Für die Skala Beziehung waren jedoch tiefergehende Änderungen notwendig (vgl. Tab. 1). Hier schätzen die Lehrpersonen die Klasse und die Schülerinnen und Schüler ihre Lehrperson ein (z. B. „Ich mag diese Lehrperson“ vs. „Ich mag meine Klasse“). Die Items weisen eine unterschiedliche Referenz auf und erfassen somit nicht dasselbe Konstrukt: Beziehungen - wie etwa auch unerwiderte Liebe, Anerkennung, Wertschätzung und Respekt - können asymmetrisch sein. Skala Anzahl Items Lehrerversion Schülerversion α N = 83 α n = 18 NON 4 Einige Schülerinnen und Schüler schwatzen während Erklärungsphasen. Einige Kinder schwatzen, während diese Lehrperson etwas erklärt. .88 .79 AGS 4 Kinder schlagen oder treten andere Kinder. Kinder schlagen oder treten (mit den Füßen) andere Kinder. .88 .74 AGL 3 - Kinder werden von dieser Lehrperson heruntergemacht. .88 .84 SMS 4 In meinem Unterricht gibt es viele Störungen. Im Unterricht dieser Lehrperson gibt es viele Störungen. .87 .53 BEZ 6 Ich mag meine Klasse. Ich mag diese Lehrperson. .95 .79 KLA 3 Ich habe den Überblick über das, was in dieser Klasse geschieht. Diese Lehrperson hat den Überblick über das, was in der Klasse geschieht. .82 .55 Tab. 1: Skalen mit Beispielitems aus der Schüler- und Lehrerperspektive mit Angabe der internen Konsistenz für die Gesamt- (N = 83) und die Videostichprobe (n = 18) Anmerkungen: NON = nicht aggressive Störungen der Schülerinnen und Schüler, AGS = aggressive Störungen der Schülerinnen und Schüler, AGL = aggressives Verhalten der Lehrperson, SMS = Störungen des methodisch-didaktischen Settings, BEZ = Beziehung, KLA = Klassenführung. Unterrichtsstörungen, Beziehung und Klassenführung aus verschiedenen Perspektiven 67 Alle Items der Schüler- und Lehrerversion wurden auf einer vierstufigen Likert-Skala eingeschätzt. Es wurde untersucht, inwieweit die Schülerinnen und Schüler bzw. die Lehrpersonen den Aussagen zustimmen (1 = stimmt nicht, 2 = stimmt eher nicht, 3 = stimmt eher, 4 = stimmt) bzw. wie oft bestimmte Situationen im Unterricht auftreten (1 = nie, 2 = selten, 3 = oft, 4 = sehr oft). Zudem wurden Geschlecht, Geburtsdatum und Schulstufe erhoben. Kategoriensystem Videobeobachtung In einem ersten Schritt wurde die außenstehende Beobachterin in das Kategoriensystem eingeführt und anhand von Videoaufnahmen trainiert. Das Kategoriensystem umfasste u. a. folgende klar operationalisierte und trennscharfe Suprakategorien: (a) nicht aggressives störendes Schülerverhalten (passive und aktive Formen), (b) aggressives Schülerverhalten (direkte und indirekte Formen), (c) aggressives Lehrerverhalten und (d) Störungen des methodisch-didaktischen Settings. Nach Abschluss des Beobachtertrainings lag die Beobachterübereinstimmung zwischen dem Trainer und der Beobachterin bei einem Cohens Kappa von .81. Die Videokodierung erfolgte im Event-Sampling-Verfahren in MAXQDA 11. Unklare Stellen wurden immer wieder mit dem Trainer gesichtet. Zur Bestimmung der Intraraterreliabilität wurden 11 % des kodierten Videomaterials (6,7 Stunden) nach einigen Monaten ein zweites Mal durch die Beobachterin kodiert, wobei Cohens Kappa .85 betrug. Nach Abschluss der niedrig inferenten Kodierungen schätzte die Beobachterin in einem hoch inferenten Rating zusätzlich die Dimensionen Beziehung und Klassenführung ein. Auswertung Lektionsspezifischer Fragebogen: Die Schüleritems wurden auf Klassenebene aggregiert und für jede Klasse für den Unterricht der Klassenlehrperson und der Fachlehrperson manifeste Skalenmittelwerte für die Schüler, Lehrer- und Beobachtereinschätzungen gebildet und die drei Perspektiven für den jeweiligen Unterricht miteinander korreliert. Ergänzend wurden Mittelwertvergleiche durchgeführt. Videobeobachtung: Die niedrig inferenten Kodierungen der Störfrequenzen wurden zwecks Vergleichbarkeit in Perzentile umgerechnet und in einen mit der Schülerversion identischen lektionsspezifischen Fragebogen zur Erfassung von Störungen im Unterricht übertragen. Durch die gleiche Skalierung wurden so die Daten und Mittelwerte der Beobachterin mit den Schüler- und Lehrerurteilen direkt vergleichbar. Ergebnisse Übereinstimmung der Lehrer-, Schüler- und Beobachterurteile Wie erwartet fanden sich unter der lektionsspezifischen Bedingung mit einer mittleren Korrelation über alle Skalen von .53 für den Unterricht der Klassenlehrperson und .59 für den Unterricht der Fachlehrpersonen die höchsten Übereinstimmungen zwischen den Schüler- und Beobachterurteilen (vgl. Tab. 2). Die Einschätzung der Klassenlehrperson und der Beobachterin wiesen mit einer mittleren Korrelation über alle Skalen von .10 kaum Übereinstimmungen auf. Fachlehrpersonen und Beobachterin wiesen mit einer mittleren Korrelation über alle Skalen von .40 mittlere Übereinstimmungen auf (Hypothese 1). Die Störungswahrnehmung der Schülerinnen und Schüler stimmte mit r = .62 sehr gut mit den niedrig inferenten Kodierungen der externen Beobachterin überein. Die Störungswahrnehmung der Fachlehrpersonen korrelierte mit .48, die der Klassenlehrpersonen nur zu .17 mit den niedrig inferenten Kodierungen der Beobachterin. Auch in der Einschätzung von Beziehung und Klassenführung stimmte die Beobachterin besser mit den Schülerals mit den Lehrereinschätzungen überein. Inferenzgrad Finden sich für niedrig inferente Merkmale höhere Übereinstimmungen als für hoch inferente Unterrichtsbeurteilungen? In der Beurteilung unterschiedlicher Skalen ergaben sich beträchtliche Unterschiede. Die höchsten Übereinstimmungen wurden für die Beobachterin und Schülerinnen und Schüler für niedrig inferente Unterrichtsmerkmale wie nicht aggressive und aggressive Schülerstörungen und Störungen des 68 Alexander Wettstein, Marion Scherzinger, Erich Ramseier methodisch-didaktischen Settings erwartet, während in der Beurteilung hoch inferenter Merkmale wie Beziehung und Klassenführung weit geringere Übereinstimmungen erwartet wurden (Hypothese 2). Die höchste Übereinstimmung zeigte sich erwartungsgemäß in der Einschätzung von niedrig inferenten Merkmalen wie Störungen des methodisch-didaktischen Settings (.72 und .89), gefolgt von der Einschätzung von Lehreraggression (.56 und .59), nicht aggressiver Schülerstörungen (.59 und .58) und Schüleraggression (.61 und .41). Überraschenderweise korrelierten die Beobachter- und Schülerurteile in ihrer Einschätzung der Beziehung (.44 und .67) relativ hoch. Dagegen korrelierten die Beobachter- und Schülereinschätzungen zur Klassenführung erwartungsgemäß nur schwach (.25 und .40). Die Einschätzungen der Klassenlehrpersonen stimmten mit einer mittleren Korrelation von .10 kaum mit den Einschätzungen der Beobachterin überein. Hier fanden sich schwache Übereinstimmungen für Störungen des methodisch-didaktischen Settings (.36) und nicht aggressives Schülerverhalten (.22). Die Einschätzungen von Schüleraggression, Beziehung und Klassenführung korrelierten nahe null. Im Gegensatz dazu wiesen die Einschätzungen der Fachlehrpersonen und der Beobachterin mit einer mittleren Korrelation von .40 moderate Übereinstimmungen auf. Hier fanden sich gute Übereinstimmungen für Störungen des methodisch-didaktischen Settings (.66), Schüleraggression (.55) und eine moderate Übereinstimmung für Beziehung (.40). Dagegen korrelierten die Einschätzungen von nicht aggressiven Schülerstörungen (.23) und Klassenführung (.18) kaum. Die Einschätzungen der Klassenlehrpersonen und Schülerinnen und Schüler stimmten mit einer mittleren Korrelation von .33 nur schwach überein. Die höchsten Korrelationen fanden sich für Störungen des methodisch-didaktischen Settings (.67), gefolgt von nicht aggressiven Schülerstörungen (.55). Die Einschätzungen von Klassenführung (.33) und Beziehung (.27) korrelierten nur schwach und für Schüleraggression sogar negativ (-.16). Fachlehrpersonen und Schülerinnen und Schüler stimmten mit einer mittleren Korrelation von .48 recht gut überein. Die höchsten Korrelationen fanden sich wiederum für Störungen des methodisch-didaktischen Settings (.83), gefolgt von Schüleraggression (.54) und Klassenführung (.48). In ihrer Einschätzung nicht aggressiver Schülerstörungen (.31) und Beziehung (.25) korrelierten die Urteile der Fachlehrpersonen und der Schülerinnen und Schüler nur schwach. Unterricht der Klassenlehrperson Unterricht der Fachlehrperson B - S B - KL KL - S B - S B - FL FL - S Störungen (M über alle Formen) NON AGS AGL SMS BEZ KLA .62** .59** .61** .56* .72** .44 .25 .17 .22 -.08 - .36 .08 -.16 .35 .55* -.16 - .67** .27 .33 .62** .58** .41 .59* .89** .67** .40 .48 .23 .55* - .66** .40 .18 .56* .31 .54* - .83** .25 .48 Tab. 2: Unkorrigierte Korrelationen zwischen den Beobachter-, Lehrer- und Schülerurteilen unter der lektionsspezifischen Bedingung im Unterricht der Klassenlehrperson und der Fachlehrperson der Teilstichprobe (n = 18) Anmerkungen: B-S = Beobachterin - Schüler, B-KL = Beobachterin - Klassenlehrperson, B-FL = Beobachterin - Fachlehrperson, L-S = Lehrperson - Schüler; NON = nicht aggressive Störungen der Schülerinnen und Schüler, AGS = aggressive Störungen der Schülerinnen und Schüler, AGL = aggressives Verhalten der Lehrperson, SMS = Störungen des methodischdidaktischen Settings, BEZ = Beziehung, KLA = Klassenführung. Die Signifikanzberechnung basiert auf den unkorrigierten Korrelationen. * p < .05. ** p < .01. Unterrichtsstörungen, Beziehung und Klassenführung aus verschiedenen Perspektiven 69 Allgemeine versus lektionsspezifische Einschätzungen Unter der lektionsspezifischen Bedingung mit Angabe eines klar definierten Referenzzeitraums stimmten sowohl die Klassenlehrpersonen mit einer mittleren Korrelation von r = .35 wie auch die Fachlehrpersonen mit r = .54 besser mit den Schülerurteilen überein, als wenn kein Referenzzeitraum genannt wurde (r = .19 für den Unterricht der Klassenbzw. r = .15 für den Unterricht der Fachlehrperson; Hypothese 3). Dieser Effekt ist jedoch nicht für alle Skalen gleich (vgl. Tab. 3). Für den Unterricht der Klassenlehrperson führte die lektionsspezifische gegenüber der allgemeinen Einschätzung zu etwas größeren Übereinstimmungen in der Skala nicht aggressiver Schülerstörungen, während die anderen Skalen nur moderat von der allgemeinen Bedingung abwichen. Für den Unterricht der Fachlehrperson führte die lektionsspezifische gegenüber der allgemeinen Einschätzung zu signifikant höheren Übereinstimmungen in den Skalen Klassenführung und Störungen des methodisch-didaktischen Settings sowie etwas größeren Übereinstimmungen in der Skala Schüleraggression. Betrachtet man die transsituationale und temporale Stabilität der Urteile über die beiden Messzeitpunkte und Messbedingungen, so zeigt sich, dass die Schülerurteile etwas weniger variieren als die Lehrerurteile (vgl. Tab. 4). Unterricht der Klassenlehrperson Unterricht der Fachlehrperson allgemein Lektion Diff allgemein Lektion Diff NON AGS SMS KLA Mittelwert .13 .02 .54* .07 .19 .55* -.16 .67** .33 .35 .42 -.18 .13 .26 .16 .39 .14 .31 -.24 .15 .31 .54* .83** .48 .54 -.08 .40 .52* .72** .39 Tab. 3: Unkorrigierte Korrelationen zwischen den Lehrer- und Schülerurteilen unter der allgemeinen und der lektionsspezifischen Bedingung im Unterricht der Klassenlehrperson und der Fachlehrperson der Teilstichprobe (n = 18) Anmerkungen: NON = nicht aggressive Störungen der Schülerinnen und Schüler, AGS = aggressive Störungen der Schülerinnen und Schüler, SMS = Störungen des methodisch-didaktischen Settings, KLA = Klassenführung. Beziehung wurde nur einmal unter der allgemeinen Bedingung erhoben. Die Signifikanzberechnung basiert auf den unkorrigierten Korrelationen. * p < .05. ** p < .01. Unterricht der Klassenlehrperson Unterricht der Fachlehrperson Klassenlehrperson Schülerinnen und Schüler Fachlehrperson Schülerinnen und Schüler NON AGS AGL SMS KLA Mittelwert .56* .37 - .47* .25 .42 .71* .36 .34 .53* .59** .51 -.10 .59* - .31 .16 .24 .75** .39 .73** .66** .69** .64 Tab. 4: Temporale und transsituationale Stabilität der Lehrer und Schülerurteile zwischen der allgemeinen und spezifischen Einschätzung zu beiden Messzeitpunkten (n = 18) Anmerkungen: NON = nicht aggressive Störungen der Schülerinnen und Schüler, AGS = aggressive Störungen der Schülerinnen und Schüler, AGL = aggressives Verhalten der Lehrperson, SMS = Störungen des methodisch-didaktischen Settings, KLA = Klassenführung. Beziehung wurde nur einmal unter der allgemeinen Bedingung erhoben. Die Signifikanzberechnung basiert auf den unkorrigierten Korrelationen. * p < .05. ** p < .01. 70 Alexander Wettstein, Marion Scherzinger, Erich Ramseier Hohe Stabilitäten ergaben sich auf Schülerseite vor allem in der Einschätzung der Skalen nichtaggressive Schülerstörungen, Klassenführung und Störungen des methodisch-didaktischen Settings sowie in der Einschätzung der Lehreraggression im Unterricht der Fachlehrperson. Klassenlehrpersonen schätzten nicht aggressive Schülerstörungen sowie Störungen des methodisch-didaktischen Settings als relativ stabil ein. Die höchste Variabilität fand sich bei Fachlehrpersonen, welche mit Ausnahme der Schüleraggression alle Skalen zwischen den beiden Messzeitpunkten und Bedingungen sehr variabel einschätzten. In einem nächsten Schritt wurden die lektionsspezifischen Lehrer- und Schülereinschätzungen der videografierten Unterrichtsstunden mit den allgemeinen Unterrichtseinschätzungen der Fragebogenerhebung aus der ersten Projektphase verglichen. Die Mittelwerte des allgemeinen (Messzeitpunkt 1) und des lektionsspezifischen Fragebogens (Messzeitpunkt 2) wurden mit einem U-Test für verbundene Stichproben überprüft und Differenzen, Effektstärken sowie zweiseitige Signifikanzen berechnet. Klassenlehrpersonen nahmen in den videografierten Lektionen statistisch signifikant weniger Schüleraggression (d = -1.94), Störungen des methodisch-didaktischen Settings (d = -0.59) und weniger nicht aggressive Schülerstörungen (d = -0.53) wahr und schätzten ihre Klassenführung etwas positiver ein (d = 0.27) als im alltäglichen Unterricht. Die Schülerinnen und Schüler nahmen in den videografierten Lektionen der Klassenlehrperson statistisch signifikant weniger Schüleraggression (d = -1.84), Störungen des methodisch-didaktischen Settings (d = -1.32), Lehreraggression (d = -0.94) und weniger nicht aggressive Schülerstörungen (d = -.66) wahr. Sie schätzten aber im Gegensatz zur Klassenlehrperson die Klassenführung deutlich kritischer ein (d = -0.80) als in ihrer allgemeinen Unterrichtseinschätzung. Fachlehrpersonen berichteten dagegen in den videografierten Lektionen statistisch signifikant mehr nicht aggressive Schülerstörungen (d = 0.50), jedoch weniger Schüleraggression (d = -0.37). Für die Skalen Störungen des methodisch-didaktischen Settings und Klassenführung ergaben sich aus Sicht der Fachlehrpersonen keine Unterschiede zwischen den videografierten Lektionen und ihrem normalen Unterrichtsalltag. Die Schülerinnen und Schüler nahmen in den videografierten Lektionen der Fachlehrpersonen statistisch signifikant weniger Störungen des methodisch-didaktischen Settings (d = -0.63) und Schüleraggression (d = -0.61) wahr. Aus Schülersicht unterschieden sich jedoch in den videografierten Lektionen nicht aggressive Schülerstörungen, aggressives Verhalten der Lehrperson und Klassenführung statistisch nicht signifikant vom normalen Schulalltag. Insgesamt wurden also die videografierten Lektionen im Unterricht der Klassenlehrperson sowohl aus Lehrerwie auch aus Schülersicht positiver eingeschätzt. Dies scheint jedoch für den Unterricht der Fachlehrperson nicht im selben Ausmaß zuzutreffen. Diskussion In der vorliegenden Studie wurde untersucht, inwieweit Lehrer-, Schüler- und Beobachterurteile in der Einschätzung von Unterrichtsstörungen, Beziehung und Klassenführung im Unterricht der Klassenlehrperson und einer Fachlehrperson übereinstimmen. Dabei zeigte sich, dass die Einschätzungen der Beobachterin deutlich besser mit den Einschätzungen der Schülerinnen- und Schüler als mit jenen der Lehrpersonen konvergieren. Schüler- und Beobachterperspektive: Die niedrig inferenten Kodierungen von vier Störungsformen durch eine externe Beobachterin stimmen mit einer mittleren Korrelation von .62 in hohem Maße mit den aggregierten Schülerurteilen überein. Diese vergleichsweise hohen Korrelationen sind wahrscheinlich auch darauf zurückzuführen, dass in unserer Studie die Beobachterübereinstimmungen innerhalb einzelner Unterrichtsstunden geprüft wurden, wäh- Unterrichtsstörungen, Beziehung und Klassenführung aus verschiedenen Perspektiven 71 rend sich bei anderen Studien wie z. B. bei Kunter und Baumert (2006) der Vergleich auf ein ganzes Schuljahr bezieht. Die höchsten mittleren Übereinstimmungen für den Unterricht der Klassen- und der Fachlehrperson fanden sich für Störungen des methodisch-didaktischen Settings (.81), gefolgt von nicht aggressiven Schülerstörungen (.59), Lehreraggression (.58) und Schüleraggression (.51). Die hohen Zusammenhänge zwischen Schüler- und Beobachterperspektive könnten darauf zurückgeführt werden, dass die Schülerinnen und Schüler wie auch die Beobachterin den Unterricht aus einer weitgehend handlungsentlasteten Perspektive erleben und somit gegenüber der Lehrperson über einen Beobachtungsvorteil verfügen, während diese unter Handlungsdruck steht. Weiter handelt es sich bei den Schülereinschätzungen um gemittelte Klassenwerte, in welchen die individuellen Idiosynkrasien der einzelnen Einschätzenden herausgemittelt wurden. Für eine möglichst objektive Erfassung von Unterrichtsstörungen scheint es deshalb sinnvoll, sich eher auf die Einschätzungen der Schülerinnen und Schüler als auf das Urteil der Lehrperson zu stützen. In der Einschätzung der Beziehung ergaben sich wider Erwarten mit .56 deutliche Übereinstimmungen zwischen den Urteilen der Beobachterin und jenen der Schülerinnen und Schüler. Dieser Befund ist insofern erstaunlich, da es sich hier um ein hochinferentes Merkmal handelt. Die Beobachterin ist nicht mit der Beziehungsgeschichte vertraut und urteilt aufgrund einer Momentaufnahme der drei beobachteten Lektionen. Wie erwartet korrespondierten die Beobachter- und Schülerurteile zur Klassenführung mit .33 nur schwach. Dieser Befund scheint auf den ersten Blick in Widerspruch zu früheren Studien (z. B. Fauth et al., 2014 a, 2014 b; Kunter & Baumert, 2006) zu stehen, welche für das Merkmal der Klassenführung jeweils die höchsten Zusammenhänge zwischen den Beobachterperspektiven identifizierten. Ein genauerer Blick zeigt allerdings, dass in diesen Studien in erster Linie Störungsitems auf dem Faktor Klassenführung laden, während unsere Skala der Klassenführung eher auf Monitoring und Regelklarheit abzielt. Die Items zur Erfassung dieses Konstrukts zielen zudem weniger auf offensichtliche Aspekte der Klassenführung ab (wie z. B. „Pünktlicher Unterrichtsbeginn“ bei Kunter & Baumert, 2006), sondern stärker auf komplexe und interpretationsbedürftige Aspekte (wie z. B. „Überblick über das Klassengeschehen“). Mit der verwendeten Skala zur Klassenführung werden also weniger spezifische verhaltensnahe Indikatoren des Unterrichts, sondern eher das Selbstbild der Lehrperson bzw. die Fremdbilder der Schülerinnen und Schüler bzw. der Beobachterin erfasst („Diese Lehrperson hat den Überblick über das, was in der Klasse geschieht“). Damit verschiebt sich der Fokus weg von der Wahrnehmung spezifischer Unterrichtsereignisse hin zu Überzeugungen über die eigene bzw. eine fremde Person. Wenn die Skala Klassenführung in erster Linie Selbst- und Fremdbilder erfasst, ist es auch nicht erstaunlich, dass sich für diese Skala die geringsten Übereinstimmungen zwischen Beobachter-, Lehrer- und Schülerurteilen finden. Lehrer- und Schülerperspektive: Lehrpersonen und Schülerinnen und Schüler zeigten mit einer mittleren Korrelation von .75 hohe Übereinstimmungen in der Beurteilung von Störungen des methodisch-didaktischen Settings (z. B. „Im Unterricht dieser Lehrperson gibt es viele Störungen“). Dieser Befund steht in Einklang mit früheren Studienbefunden (Fauth et al., 2014 a; Kunter & Baumert, 2006; Wagner, 2008). In der Beurteilung nicht aggressiver und aggressiver Schülerstörungen, Beziehung und Klassenführung stimmten die Lehrer- und Schülerurteile jedoch weitaus weniger gut überein. Dieser Befund ist möglicherweise darauf zurückzuführen, dass es sich bei Störungen des methodisch-didaktischen Settings um eine relativ generalisierte Störungsform handelt, die das gesamte Unterrichtssetting und alle Beteiligten betrifft, während eine einzelne Schülerstörung den Unterricht nicht in demselben Ausmaß beeinträchtigt. 72 Alexander Wettstein, Marion Scherzinger, Erich Ramseier Lehrer- und Beobachterperspektive: Die Einschätzungen der Klassenlehrperson korrespondierten mit einer mittleren Korrelation von .10 über alle Skalen kaum mit den Einschätzungen der geschulten Beobachterin. Wir gehen zwar davon aus, dass auch das Urteil der außenstehenden Beobachterin trotz intensiver Schulung nicht frei von Fehlern und Verzerrungen ist und auch die systematische Verhaltensbeobachtung nicht einfach die Realität abbildet. Da sich die Beobachterin aber ausschließlich auf die Beobachtung konzentrieren konnte und kriteriengeleitet vorging, stellt die große Diskrepanz zwischen der Beobachter- und Lehrereinschätzung die Validität von Lehrerurteilen zu ihrem eigenen Unterricht grundsätzlich infrage. Dagegen wiesen die Einschätzungen der Fachlehrpersonen mit .40 zumindest ansatzweise Übereinstimmungen zu den Kodierungen der externen Beobachterin auf. Hier fanden sich zumindest mittlere Korrelationen für Störungen des methodisch-didaktischen Settings (.66), aggressives Schülerverhalten (.55) und Beziehung (.40). Die Übereinstimmungen zu nicht aggressiven Schülerstörungen (.23) und Klassenführung (.18) sind allerdings gering. Die geringe Korrespondenz der Beobachter- und Lehrerurteile ist vermutlich auf die anspruchsvollen Aufgaben der Lehrpersonen im Unterricht zurückzuführen. Sie stehen unter Handlungsdruck, müssen eine Vielzahl von Entscheidungen treffen und gleichzeitig den Überblick über das komplexe Klassengeschehen behalten. So dürfte es für Lehrpersonen insbesondere schwierig sein, auch weniger offensichtliche Formen von Unterrichtsstörungen wie z. B. passive Schülerstörungen und indirekte Aggressionen zu erkennen. Dies mag mit ein Grund sein, weshalb Fachlehrpersonen besser mit den Einschätzungen der externen Beobachterin übereinstimmen als die Klassenlehrpersonen. Im Unterricht der Fachlehrperson könnten sich die Schülerinnen und Schüler weniger darum bemühen, störendes Verhalten zu verstecken und deshalb auch offensichtlichere, für die Lehrperson gut erkennbare Störformen wählen als im Unterricht der Klassenlehrperson. Allgemeine versus lektionsspezifische Einschätzungen Der Befund, dass Lehrpersonen und Schülerinnen und Schüler besser in ihren Einschätzungen übereinstimmen, wenn ein klar umrissener Referenzzeitraum für die Beurteilung definiert ist, ist keineswegs überraschend und steht im Einklang mit bisherigen Studien (Kunter & Baumert, 2006; Wagner et al., 2016). Weiter könnte die höhere temporale und transsituationale Stabilität der Schülergegenüber den Lehrerurteilen darauf hindeuten, dass die Lehrpersonen den Unterricht situationsspezifischer einschätzen. Der Effekt, dass die videografierten Lektionen besser eingeschätzt wurden als der alltägliche Unterricht, könnte möglicherweise auch darauf zurückgeführt werden, dass sich die Lehrpersonen bemühten, für die Erhebung eine möglichst optimale Unterrichtssituation zu gestalten. Aus diagnostischer Sicht legen die Ergebnisse zur Beobachterübereinstimmung nahe, bei der Erfassung von Störungen im Unterricht eher auf die Perspektive der Schülerinnen und Schüler zu setzen. Lehrpersonen sind im Unterricht in vielfältiger Weise herausgefordert und nehmen nur einen Bruchteil der ablaufenden sozialen Prozesse wahr. Dagegen zeigen sich deutlich bessere Übereinstimmungen zwischen den niedrig inferenten Beobachtungen und den Einschätzungen der Schülerinnen und Schüler, welche untereinander beträchtlich hohe Korrelationen aufweisen. Aus pädagogischer Sicht scheint es wichtig, Lehrpersonen darin zu unterstützen, die Perspektive der Schülerinnen und Schüler einzunehmen und nachzuvollziehen, wie die Lernenden den Unterricht erleben. Hier wäre es denkbar, den Fragebogen zur Erfassung von Störungen im Unterricht als Checkliste für Lehrpersonen weiterzuentwickeln und somit die Perspektivenübernahme bei Lehrpersonen anzuregen und die Unterrichtsentwicklung zu fördern. Zum anderen scheint es sinnvoll, Lehrpersonen für auftretende Störungen in ihrem Unterricht zu sensibilisieren. Dies kann z. B. über bestehende diagnostische Systeme wie das Beobachtungssystem zur Analyse aggressiven Unterrichtsstörungen, Beziehung und Klassenführung aus verschiedenen Perspektiven 73 Verhaltens in schulischen Settings (BASYS; Wettstein, 2008) erreicht werden. Solche Systeme unterstützen Lehrpersonen, Störungen differenziert zu erkennen und einen störungspräventiven Unterricht zu gestalten. Chancen und Grenzen der Studie Die vorliegende Studie zu Unterrichtsstörungen erschließt ein bisher wenig beforschtes Feld, indem verschiedene Formen von Unterrichtsstörungen sowie die Beziehung und Klassenführung aus Sicht von Lehrpersonen, Schülerinnen und Schülern sowie einer externen Beobachterin erfasst werden. Selbstverständlich weist die Studie auch einige Schwächen auf. Die vorliegende Studie umfasst nur 18 Klassen. Die berichteten Befunde müssen deshalb entsprechend zurückhaltend interpretiert werden. Zudem kann nicht ausgeschlossen werden, dass es sich um eine selektive Stichprobe handelt. Zwar wurde eine Studienbeteiligung teilweise durch einzelne Schulleitungen verordnet, es ist aber davon auszugehen, dass sich die meisten Lehrpersonen freiwillig für eine Studienteilnahme meldeten und deshalb ein positiver Verzerrungseffekt hochmotivierter Lehrpersonen nicht ausgeschlossen werden kann. Die vorliegenden Ergebnisse können deshalb, insbesondere im Hinblick auf Aussagen zu Störungsausprägungen, nicht generalisiert werden. Literatur Baumert, J., Kunter, M., Brunner, M., Krauss, S., Blum, W. & Neubrand, M. (2004). Mathematikunterricht aus Sicht der PISA-Schülerinnen und -Schüler und ihrer Lehrkräfte. In M. Prenzel, J. Baumert, W. Blum, R. Lehmann, D. Leutner, M. Neubrand, … U. Schiefele (Hrsg.), PISA 2003: Der Bildungsstand der Jugendlichen in Deutschland (S. 314 - 354). Münster: Waxmann. Carroll, J. B. (1989). The Carroll model: A 25-year retrospective and prospective view. Educational Researcher, 18 (1), 26 - 31. http: / / dx.doi.org/ 10.3102/ 0013189X 018001026 Clausen, M. (2002). Unterrichtsqualität: Eine Frage der Perspektive? Empirische Analysen zur Übereinstimmung, Konstrukt- und Kriteriumsvalidität. Münster: Waxmann. Clausen, M., Reusser, K. & Klieme, E. (2003). Unterrichtsqualität auf der Basis hoch-inferenter Unterrichtsbeurteilungen. Ein Vergleich zwischen Deutschland und der deutschsprachigen Schweiz. Unterrichtswissenschaft, 31, 122 - 141. De Jong, R. & Westerhof, K. J. (2001). The quality of student ratings of teacher behaviour. Learning Environments Research, 4 (1), 51 - 85. http: / / dx.doi.org/ 10.10 23/ A: 1011402608575 Desimone, L. M. (2009). Improving impact studies of teachers’ professional development: Toward better conceptualizations and measures. Educational Researcher, 38, 181 - 199. http: / / dx.doi.org/ 10.3102/ 0013189X 08331140 Fauth, B., Decristan, J., Rieser, S., Klieme, E. & Büttner, G. (2014 a). Student ratings of teaching quality in primary school: Dimensions and prediction of student outcomes. Learning and Instruction, 29, 1 - 9. http: / / dx.doi.org/ 10.1016/ j.learninstruc.2013.07.001 Fauth, B., Decristan, J., Rieser, S., Klieme, E. & Büttner, G. (2014 b). Grundschulunterricht aus Schüler-, Lehrer- und Beobachterperspektive: Zusammenhänge und Vorhersage von Lernerfolg. Zeitschrift für Pädagogische Psychologie, 28, 127 - 137. Göllner, R., Wagner, W., Klieme, E., Lüdtke, O., Nagengast, B. & Trautwein, U. (2016). Erfassung der Unterrichtsqualität mithilfe von Schülerurteilen: Chancen, Grenzen und Forschungsperspektiven. In Bundesministerium für Bildung und Forschung (Hrsg.), Forschungsvorhaben in Ankopplung an Large-Scale-Assessments (Bildungsforschung, Bd. 44, S. 63 - 82). Bielefeld: W. Bertelsmann. Helmke, A. (2009). Unterrichtsqualität und Lehrerprofessionalität. Diagnose, Evaluation und Verbesserung des Unterrichts. Seelze-Velber: Klett Kallmeyer. Helmke, A. & Lenske, G. (2013). Unterrichtsdiagnostik als Voraussetzung für Unterrichtsentwicklung. Beiträge zur Lehrerbildung, 31 (2), 214 - 233. Helmke, A., Helmke, T., Lenske, G., Pham, G., Praetorius, A.-K., Schrader, F.-W. & Ade-Thurow, M. (2011). Unterrichtsdiagnostik - Voraussetzung für die Verbesserung der Unterrichtsqualität. In A. Bartz, M. Dammann, S. Huber, C. Kloft & M. Schreiner (Hrsg.), PraxisWissen SchulLeitung, AL 28, 2011 (Kap. 30.71, S. 1 - 13). Köln: Wolters Kluwer. Hüfner, G. (2003). Die Belastungsprofile einzelner Lehrergruppen. Bayerische Schule, 56 (10), 12 - 15. Kunter, M. & Baumert, J. (2006). Who is the expert? Construct and criteria validity of student and teacher ratings of instruction. Learning Environments Research, 9, 231 - 251. http: / / dx.doi.org/ 10.1007/ s10984-006- 9015-7 Lortie, D. C. (1975). Schoolteacher: A sociological study. Chicago, IL: University of Chicago Press. Lüdtke, O., Trautwein, U., Kunter, M. & Baumert, J. (2006). Analyse von Lernumwelten: Ansätze zur Bestimmung der Reliabilität und Übereinstimmung von Schülerwahrnehmungen. Zeitschrift für Pädagogische Psychologie, 20, 85 - 96. http: / / dx.doi.org/ 10.1024/ 10 10-0652.20.12.85 Marsh, H. W., Lüdtke, O., Robitzsch, A., Trautwein, U., Asparouhov, T., Muthén, B. & Nagengast, B. (2009). Doubly-latent models of school contextual effects: Integrating multilevel and structural equation approaches to control measurement and sampling error. Multivariate Behavioral Research, 44, 764 - 802. http: / / dx. doi.org/ 10.1080/ 00273170903333665 74 Alexander Wettstein, Marion Scherzinger, Erich Ramseier Obsuth, I., Murray, A. L., Malti, T., Sulger, P., Ribeaud, D. & Eisner, M. (2016). A non-bipartite propensity score analysis of the effects of teacher-student relationships on adolescent problem and prosocial behavior. Journal of Youth and Adolescence, 46, 1661 - 1687. http: / / dx. doi.org/ 10.1007/ s10964-016-0534-y Pauli, C. & Reusser, K. (2006). Von international vergleichenden Video Surveys zur videobasierten Unterrichtsforschung und -entwicklung. Zeitschrift für Pädagogik, 52, 774 - 797. Pianta, R. C., Hamre, B. & Stuhlman, M. (2003). Relationships between teachers and children. In W. M. Reynolds & G. E. Miller (Eds.), Handbook of psychology. Vol. 7: Educational psychology (pp. 199 - 234). Hoboken, NJ: Wiley & Sons. http: / / dx.doi.org/ 10.1002/ 04 71264385.wei0710 Praetorius, A.-K. (2012). Eignung von hoch-inferenten Beobachterratings zur Messung von Unterrichtsqualität. Dissertation, Universität Koblenz-Landau. Praetorius, A.-K. (2013). Einschätzung von Unterrichtsqualität durch externe Beobachterinnen und Beobachter - Eine kritische Betrachtung der aktuellen Vorgehensweise in der Schulpraxis. Beiträge zur Lehrerbildung, 31, 174 - 185. Praetorius, A.-K., Lenske, G. & Helmke, A. (2012). Observer ratings of instructional quality: Do they fulfill what they promise? Learning and Instruction, 6, 387 - 400. http: / / dx.doi.org/ 10.1016/ j.learninstruc.2012. 03.002 Scherzinger, M., Wettstein, A. & Wyler, S. (2017). Unterrichtsstörungen aus der Sicht von Schülerinnen und Schülern und ihren Lehrpersonen. Ergebnisse einer Interviewstudie zum subjektiven Erleben von Störungen. Vierteljahresschrift für Heilpädagogik und ihre Nachbargebiete, 86, 70 - 83. http: / / dx.doi.org/ 10.2378/ vhn 2017.art06d Stigler, J. (1998). Video surveys: New data for the improvement of classroom instruction. In S. G. Paris & H. M. Wellman (Eds.), Global prospects for education. Development, culture and schooling (pp. 129 - 168). Washington, DC: American Psychological Association. http: / / dx.doi.org/ 10.1037/ 10294-005 Tillmann, K.-J. (2004). Sozialisationstheorien. Eine Einführung in den Zusammenhang von Gesellschaft, Institution und Subjektwerdung (13. Aufl.). Reinbek: Rowohlt. Wagner, W. (2008). Methodenprobleme bei der Analyse der Unterrichtswahrnehmung aus Schülersicht - am Beispiel der Studie DESI (Deutsch Englisch Schülerleistungen International) der Kultusministerkonferenz. Dissertation, Universität Koblenz-Landau. Wagner, W., Göllner, R., Werth, S., Voss, T., Schmitz, B. & Trautwein, U. (2016). Student and teacher ratings of instructional quality: Consistency of ratings over time, agreement, and predictive power. Journal of Educational Psychology, 108, 705 - 721. Wentzel, K. R. (2010). Students’ relationships with teachers. In J. L. Meece & J. S. Eccles (Eds.), Handbook of research on schools, schooling, and human development (pp. 75 - 91). New York, NY: Routledge. Wettstein, A. (2008). Beobachtungssystem zur Analyse aggressiven Verhaltens in schulischen Settings (BASYS). Bern: Huber. Wettstein, A. (2010). Lehrpersonen in schwierigen Unterrichtssituationen unterstützen. Ein pädagogisch-didaktisches Coaching zur Prävention von Unterrichtsstörungen. Vierteljahresschrift für Heilpädagogik und ihre Nachbargebiete, 2, 145 - 157. http: / / dx.doi.org/ 10. 2378/ vhn2010.art12d Wettstein, A. (2013). Die Wahrnehmung sozialer Prozesse im Unterricht. Schweizerische Zeitschrift für Heilpädagogik, 7/ 8, 5 - 13. Wettstein, A., Ramseier, E., Scherzinger, M. & Gasser, L. (2016). Unterrichtsstörungen aus Lehrer- und Schülersicht. Aggressive und nicht aggressive Störungen im Unterricht aus der Sicht der Klassen-, einer Fachlehrperson und der Schülerinnen und Schüler. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 48, 171 - 183. http: / / dx.doi.org/ 10.1026/ 0049- 8637/ a000159 Wettstein, A., Scherzinger, M. & Wyler, S. (2016). Der Fragebogen zur Erfassung von Störungen im Unterricht: die Faktorenstruktur der Schülerinnen- und Schülerversion. Empirische Sonderpädagogik, 2, 189 - 202. Wettstein, A., Thommen, B. & Eggert, A. (2010). Die Bedeutung didaktischer Aspekte in der Aggressionsprävention - drei Videostudien. Psychologie in Erziehung und Unterricht, 57, 88 - 106. http: / / dx.doi.org/ 10.23 78/ peu2010.art07d Winkel, R. (2009). Der gestörte Unterricht. Baltmannsweiler: Schneider Verlag Hohengehren. Wubbels, T., Brekelmans, M. & Hooymayers, H. P. (1992). Do teacher ideals distort the selfreports of their interpersonal behavior? Teaching and Teacher Education, 8, 47 - 58. http: / / dx.doi.org/ 10.1016/ 0742-051X(92)90 039-6 Prof. Dr. Alexander Wettstein Dr. Marion Scherzinger Prof. Dr. Erich Ramseier Pädagogische Hochschule Bern Fabrikstr. 8 CH-3012 Bern E-Mail: alexander.wettstein@phbern.ch