eJournals Vierteljahresschrift für Heilpädagogik und ihre Nachbargebiete 93/1

Vierteljahresschrift für Heilpädagogik und ihre Nachbargebiete
5
0017-9655
Ernst Reinhardt Verlag, GmbH & Co. KG München
10.2378/vhn2024.art03d
11
2024
931

Fachbeitrag: Explorative Analyse eines Fragebogens zur Messung von Lehrkraftfeedback aus Perspektive der Feedbackempfangenden

11
2024
Markus Spilles
Philipp Nicolay
Christian Huber
Der vorliegende Beitrag überprüft die Validität eines Instruments zur Messung von Lehrkraftfeedback (LF) aus Perspektive der Feedbackempfangenden (FE) (LF-FE-Fragebogen). Hierzu wurden n=358 Schüler/innen (51% männlich) aus fünf dritten und 15 vierten Grundschulklassen 47 Items vorgelegt. Eine explorative Faktorenanalyse legt für das positive LF vier Faktoren à drei Items (Sozialverhalten, Lernverhalten, Schulleistung, Organisation) und für das negative LF drei Faktoren à vier Items (Sozialverhalten, Lernverhalten und Schulleistung, Störverhalten) nahe. In einer Regressionsanalyse, in der alle Dimensionen des LF-FE-Fragebogens als unabhängige Variablen einflossen, zeigten sich im Hinblick auf die selbstwahrgenommene soziale Integration schwache bis mittlere Zusammenhänge mit positivem wie negativem LF zum Sozialverhalten. Hinsichtlich der selbstwahrgenommenen Beziehung zur Lehrkraft ergab sich ein schwacher Zusammenhang mit negativem LF zum Störverhalten.
5_093_2024_1_0004
22 VHN, 93. Jg., S. 22 -34 (2024) DOI 10.2378/ vhn2024.art03d © Ernst Reinhardt Verlag Explorative Analyse eines Fragebogens zur Messung von Lehrkraftfeedback aus Perspektive der Feedbackempfangenden Markus Spilles, Philipp Nicolay, Christian Huber Bergische Universität Wuppertal Zusammenfassung: Der vorliegende Beitrag überprüft die Validität eines Instruments zur Messung von Lehrkraftfeedback (LF) aus Perspektive der Feedbackempfangenden (FE) (LF-FE-Fragebogen). Hierzu wurden n = 358 Schüler/ innen (51 % männlich) aus fünf dritten und 15 vierten Grundschulklassen 47 Items vorgelegt. Eine explorative Faktorenanalyse legt für das positive LF vier Faktoren à drei Items (Sozialverhalten, Lernverhalten, Schulleistung, Organisation) und für das negative LF drei Faktoren à vier Items (Sozialverhalten, Lernverhalten und Schulleistung, Störverhalten) nahe. In einer Regressionsanalyse, in der alle Dimensionen des LF-FE-Fragebogens als unabhängige Variablen einflossen, zeigten sich im Hinblick auf die selbstwahrgenommene soziale Integration schwache bis mittlere Zusammenhänge mit positivem wie negativem LF zum Sozialverhalten. Hinsichtlich der selbstwahrgenommenen Beziehung zur Lehrkraft ergab sich ein schwacher Zusammenhang mit negativem LF zum Störverhalten. Schlüsselbegriffe: Lehrkraftfeedback, Selbstwahrnehmung, soziale Integration, Lehrkraftbeziehung, Grundschule Exploratory Analysis of a Questionnaire for Measuring Teacher Feedback from the Perspective of Feedback Recipients Summary: The present paper examines the validity of a questionnaire to measure teacherfeedback (TF) from the perspective of feedback recipients. For this purpose, n = 358 students (51 % male) from five third and 15 fourth elementary school classes answered 47 items. An explorative factor analysis suggested four factors of three items each (social behavior, learning behavior, school performance, organization) for positive TF and three factors of four items each (social behavior, learning behavior and school performance, disruptive behavior) for negative TF. A regression analysis, in which all TF dimensions were included as independent variables, indicated weak to moderate correlations with positive and negative TF on social behavior with regard to self-perceived social integration. With regard to self-perceived student-teacher relationship, a weak correlation was found with negative TF on disruptive behavior. Keywords: Teacher-feedback, self-perception, social integration, student-teacher relationship, elementary school FACH B E ITR AG 1 Lehrkraftfeedback Lehrkraftfeedback (LF) ist nach wie vor ein aktuelles und zentrales Thema der Bildungsforschung. Empirische Untersuchungen bestätigen, dass LF unter anderem in Zusammenhang mit Lernleistungen (Wisniewski, Zierer & Hattie, 2020), selbstbezogenen Kognitionen (O’Mara, Marsh, Craven & Debus, 2006) oder sozialen Beziehungen zwischen Schüler/ innen und Lehrkräften (Skipper & Douglas, 2015) sowie zwischen den Schüler/ innen untereinander (Wullschleger, Garrote, Schnepel, Jaquiéry & Moser Opitz, 2020) steht. In der aktuellen Studie VHN 1 | 2024 23 MARKUS SPILLES, PHILIPP NICOLAY, CHRISTIAN HUBER Messung von Lehrkraftfeedback FACH B E ITR AG wird die explorative Faktorenanalyse eines Fragebogens zur Messung von LF aus Perspektive der Feedbackempfangenden (FE) vorgestellt. Die zentrale Leitfrage ist dabei, welche inhaltlichen Dimensionen des LF (bspw. LF zu Lernleistungen oder zum Sozialverhalten) die adressierten Schüler/ innen selbst wahrnehmen. Mit Blick auf die Lernförderung definiert Hattie (2009) Feedback als eine „Information, die in Folge einer erbrachten Leistung von einer beurteilenden Person (z. B. Eltern, Lehrkräften oder Mitschüler/ innen) an ein Individuum zurückgemeldet wird“ (Übersetzung von Hoya, 2018, S. 6) und kann in schriftlicher, mündlicher oder computer-basierter Form erfolgen. Ein vielzitiertes theoretisches Rahmenkonzept stellt das Modell von Hattie und Timperley (2007) dar, das lernförderliches LF auf Ebene der Aufgabe, des Lernprozesses, der Selbstregulation und der Person umfasst und dabei drei Leitfragen fokussiert (Was sind die Lernziele? Welcher Lernfortschritt wird dabei gemacht? Wie kann ich den Lernfortschritt noch verbessern? ). In der vielzitierten Metaanalyse von Hattie (2009) sowie den meisten aktuelleren Arbeiten (z. B. Mapplebeck & Dunlop, 2021; de Kleijn, 2023) geht es inhaltlich um die Frage, wie spezifische LF-Techniken (bspw. attributionales Feedback zu den Ursachen von Lernerfolgen oder Misserfolgen) zu einem Lernfortschritt oder einer Motivationssteigerung von Schüler/ innen beitragen. Neben einem stark lernbezogenen Fokus kann es jedoch auch sinnvoll sein, LF auf einer eher globaleren Ebene zu erfassen, um bspw. Zusammenhänge verschiedener Feedback-Dimensionen (bspw. LF zum Sozialverhalten oder zu Schulleistungen, vgl. Wullschleger et al., 2020) mit nicht-lernbezogenen Indikatoren zu erörtern. Vergangene Studien konnten z. B. zeigen, dass LF in Zusammenhang mit den Beziehungen der Schüler/ innen untereinander (Wullschleger et al., 2020) oder der wahrgenommenen Beziehung zur Lehrkraft (Skipper & Douglas, 2015) steht. Für Lehrkräfte wäre es daher wichtig zu erfahren, in welchen Bereichen sie nach der Wahrnehmung ihrer Schüler/ innen besonders viel positives bzw. negatives LF aussprechen und welche Folgen dies haben könnte. Im aktuellen Beitrag möchten wir daher konkret erörtern, welche Dimensionen des verbalen LF von FE wahrgenommen werden. 2 Messung von Lehrkraftfeedback aus Perspektive der Feedbackempfangenden In der Vergangenheit wurde LF auf sehr verschiedene Art und Weise erfasst. Um nur einige Beispiele zu geben: Bei Wullschleger et al. (2020) wurde LF anhand systematischer Verhaltensbeobachtungen gemessen. Die Forschenden filmten hierfür eine standardisierte Mathematikstunde, identifizierten anschließend LF-Sequenzen und kodierten diese (LF zu schulischen Leistungen und zum Sozialverhalten). Bei Spilles, Huber, Nicolay, König und Hennemann (2023) beurteilten Kinder anhand eines Peer-Rating-Verfahrens, wie häufig jede(r) ihrer Mitschüler/ innen von ihrer Klassenlehrkraft im Unterricht gelobt bzw. getadelt wird. Die Peer-Ratings wurden für die Auswertung zu einem Mittelwert je Kind aggregiert. Bei Núñez et al. (2015) kam ein psychometrischer Fragebogen zum Einsatz, bei dem Schüler/ innen das LF übergreifend zu allen Schüler/ innen einer Klasse, jedoch ohne individuellen Bezug bewerteten. In der vorliegenden Studie wird die Entwicklung eines mehrdimensionalen Fragebogens zur Messung von verbalem LF aus Perspektive der FE angestrebt. Verfahren zur Messung von LF aus Perspektive der FE eignen sich dazu, LF differenziert anhand von umfangreicheren Fragebögen zu erfassen, was bei Peer-Ratings (bspw. Spilles et al., 2023) oder systematischen Verhaltensbeobachtungen (bspw. Wullschleger VHN 1 | 2024 24 MARKUS SPILLES, PHILIPP NICOLAY, CHRISTIAN HUBER Messung von Lehrkraftfeedback FACH B E ITR AG et al., 2020) aus Ökonomiegründen kaum möglich ist. Darüber hinaus wird in Abgrenzung zur Vorgehensweise bei Núñez et al. (2015) das LF auf der Ebene der individuellen Schüler/ innen messbar. Nachteilhaft ist - wie bei allen Beurteilungsverfahren - vor allem die mangelnde Objektivität. Bislang eingesetzte Verfahren zur Messung des LF aus Perspektive der FE wurden systematisch recherchiert. Hierzu erfolgte eine Datenbankrecherche via EBSCO-Host (Globalsuche in allen Datenbanken der Psychologie) mit folgenden Begrifflichkeiten in den Titeln, Abstracts und Schlagwörtern der Artikel: („perceived“ OR „perception“) AND „teacher“ AND „feedback“. Die Ergebnisdarstellung wurde auf Beiträge mit Peer-Review, in denen Kinder und Jugendliche im Schulalter befragt wurden, eingegrenzt. Außerdem wurde durch eine manuelle Suche ergänzt. Über diesen Weg wurden rund 60 Publikationen identifiziert. Nachfolgend werden nur exemplarische Studien aufgeführt, da eine vollständige Darstellung keinen zusätzlichen Erkenntnisgewinn bringen würde. Bei der Ergebnissichtung zeigte sich, dass LF aus Perspektive der FE in der Vergangenheit meist in Bezug auf sehr konkrete Bereiche erhoben wurde. In einer Untersuchung von Hoya (2021) wurde aus Sicht der FE das wahrgenommene positive (α = .86) und negative (α = .81) LF mit jeweils sechs Items anhand einer eigenen Übersetzung der Skalen von Burnett (2002) erhoben. Der Fragebogen bezog sich auf lernleistungsbezogenes Feedback im Bereich Lesen und differenzierte in die beiden Valenzbereiche positives LF (bspw. „Wie oft sagt dein Lehrer diese Sätze zu dir, nachdem du einen Text gelesen hast? “ - „Gut gemacht.“ oder „Du arbeitest wirklich gut mit.“) und negatives LF (bspw. „Wie oft sagt dein Lehrer diese Sätze zu dir, nachdem du einen Text gelesen hast? “ - „Das hast du nicht gut gelesen.“ oder „Du hast viele Fehler gemacht.“). Unspezifischer wurde das LF in zwei Publikationen von Schwab et al. gemessen. Schwab, Goldan und Hoffmann (2019) erfragten über ein einzelnes Item, inwiefern Schüler/ innen im jeweiligen Fachunterricht individuelles LF bekommen. Bei Schwab, Markus und Hassani (2022) wurde differenzierter anhand von vier Items nach dem öffentlichen positiven wie negativen LF in Bezug zum Verhalten und zur Leistung gefragt (bspw. „Meine Lehrkraft lobt meine Leistung vor der ganzen Klasse.“ oder „Meine Lehrkraft tadelt mich für mein Verhalten vor meinen Mitschüler/ innen.“). Bei Burnett (1999) wurde anhand von fünf Items zu positiven (α = .81) und drei Items zu negativen (α = .70) Aussagen das LF globaler gemessen. Zum Einsatz kam hier das Significant Others Statements Inventory (Burnett, 1996), bei dem die Häufigkeit von positiven oder negativen Aussagen der Lehrkraft im Hinblick auf die Lernleistung beurteilt wird (bspw. „Gute Arbeit“ oder „Komm schon, das kannst du besser.“). Nelson, Demers und Christ (2014) validierten ein Instrument zur Messung der Wahrnehmung des Unterrichtsumfelds durch die Schüler/ innen (Responsive Environmental Assessment for Classroom Teaching; REACT). In der Publikation wird die Faktorenstruktur des Instruments mit explorativen und konfirmatorischen Faktorenanalysen bestätigt. Dabei wurden sechs Faktoren mit jeweils drei bis sieben Items identifiziert: Positive Verstärkung (bspw. „Meine Lehrkraft sagt mir, wenn ich eine gute Arbeit mache.“), unterrichtliche Instruktion (bspw. „Meine Lehrkraft vermittelt mir, wie ich unterschiedliche Fragentypen beantworten kann.“), Zielsetzung (bspw. „Meine Lehrkraft vermittelt mir, warum es wichtig ist zu lernen.“), differenzierte Instruktion (bspw. „Meine Lehrkraft hilft mir, Bücher oder Materialien auszusuchen, die meiner Kompetenz entsprechen.“), formatives Feedback (bspw. „Meine Lehrkraft zeigt mir, wie ich Fehler selbst korrigieren kann.“) und unterrichtliche Freude (bspw. „Meine Lehrkraft gestaltet das Lernen interessant.“). LF wird jedoch nur mit den Skalen zur positiven Verstärkung und zum formativen Feedback eindeutig abgebildet. VHN 1 | 2024 25 MARKUS SPILLES, PHILIPP NICOLAY, CHRISTIAN HUBER Messung von Lehrkraftfeedback FACH B E ITR AG 4 Fragestellungen Insgesamt zeigt sich, dass die bislang eingesetzten Erhebungsinstrumente zur Messung von LF aus Perspektive der FE einige Einschränkungen aufweisen. 1) Meist werden die Instrumente nur knapp dargestellt, sodass diese für andere Forschende nicht verwendbar sind. 2) In vielen Studien wird nur die Valenz (positives vs. negatives LF) unterschieden. Was fehlt, sind Instrumente mit verschiedenen Fokusbereichen (bspw. Sozialvs. Lernverhalten) zur Untersuchung differenzieller Effekte. 3) Viele Fragebögen beziehen sich auf spezifische Unterrichtsfächer oder Kompetenzbereiche und eignen sich somit nicht dafür, das generelle LF zu erfassen. 4) Oft werden keine Informationen zur Güte der Verfahren berichtet. 5) Die wenigen Studien im deutschsprachigen Raum setzten lediglich Einzelitems ein. 4.1 Fragestellung 1: Explorative Analyse der Faktorenstruktur Welche Faktoren lassen sich beim selbstwahrgenommenen LF durch die FE differenzieren? Aufgrund des explorativen Charakters der Studie und dem schwachen Forschungsstand werden vorab keine Hypothesen zu möglichen Dimensionen formuliert. 4.2 Fragestellung 2: Überprüfung der Kriteriumsvalidität Ergeben sich signifikante Zusammenhänge der einzelnen Feedbackdimensionen mit der selbstwahrgenommenen sozialen Integration und der selbstwahrgenommenen Beziehung zur Lehrkraft? Wie bereits begründet, ist uns die Erfassung des subjektiv empfundenen LF insbesondere im Hinblick auf Zusammenhänge mit nicht-lernbezogenen Indikatoren wie der Wahrnehmung von positiven sozialen Beziehungen innerhalb einer Klasse wichtig. Studien zeigen, dass LF mit der sozialen Integration (bspw. Wullschleger et al., 2020; Spilles et al., 2023) und der Lehrkraftbeziehung (Skipper & Douglas, 2015) korreliert, weshalb in Bezug zu unserem Fragebogen ebenfalls signifikante Zusammenhänge erwartet werden. Konkret werden jeweils positive Zusammenhänge mit Dimensionen des positiven LF und negative Zusammenhänge mit Dimensionen des negativen LF angenommen. 5 Methode 5.1 Stichprobe Insgesamt nahmen n = 358 Schüler/ innen (51 % männlich) aus fünf dritten und 15 vierten Grundschulklassen an der Befragung teil. Die Kinder waren im Schnitt 9.19 Jahre alt (SD=0.74). Das Einzugsgebiet der Schulen lag im Umkreis einer nordrhein-westfälischen Großstadt. Die Teilnahme der Schulen an der Befragung war freiwillig. 5.2 Durchführung Die Erhebung wurde im Frühjahr 2022 in Form einer Paper-Pencil-Befragung von fünf Studierenden der Bergischen Universität Wuppertal durchgeführt und dauerte im Schnitt ca. 35 Minuten. Die Fragen wurden den Kindern vorgelesen. Verständnisfragen gab es kaum. Zwei Items (1, 9, vgl. Tab. 1) wurden als unverständlich eingeschätzt, was im Kontext der Itemselektion (s. u.) noch thematisiert wird. 5.3 Instrumente 5.3.1 LF-FE-Fragebogen Potenzielle Items für den Fragebogen zum selbstwahrgenommenen LF aus Perspektive der FE wurden auf Basis von vier Quellen er- VHN 1 | 2024 26 MARKUS SPILLES, PHILIPP NICOLAY, CHRISTIAN HUBER Messung von Lehrkraftfeedback FACH B E ITR AG stellt. Erstens wurden zehn Grundschullehrkräfte (Alter: 27 bis 45 Jahre, Berufserfahrung: 2 bis 19 Jahre, 70 % weiblich) zu typischen positiven wie negativen Rückmeldungen im Unterricht offen befragt. Zweitens wurden diesbezüglich auch zwölf Grundschulkinder aus fünf dritten und fünf vierten Klassen (50 % weiblich) interviewt. Drittens wurden Items von den Projektmitarbeitenden selbst formuliert. Viertens wurden gängige Verhaltensscreening-Instrumente im deutschsprachigen Raum gesichtet, um hieraus potenzielle Rückmeldungen im Unterricht abzuleiten (Volpe et al., 2018; Petermann & Petermann, 2013; Hartke & Vrban, 2015). Es resultierte ein Pool von insgesamt n = 47 Items (positives LF: n = 20, negatives LF: n = 27). Alle Items wurden von vier Projektmitarbeitenden unabhängig gesichtet, auf Verständlichkeit geprüft und in folgender Form dargestellt: Aussage: „Du hast deine Hausaufgaben gut erledigt.“ Frage: „Wie häufig sagt deine Lehrerin oder dein Lehrer so etwas zu dir? “ Antwortoptionen: 0 = „sehr selten“, 1 = „selten“, 2 = „manchmal“, 3 = „oft“, 4 = „sehr oft“. Den Kindern wurde explizit vermittelt, dass es nicht um Aussagen in der wortwörtlichen Formulierung, sondern um solche oder so ähnliche Aussagen geht. Die Items wurden in der Druckversion des Fragebogens randomisiert aufgelistet. 5.3.2 Kriteriumsvariablen Zur Einschätzung der selbstwahrgenommenen sozialen Integration wurde die Skala zur sozialen Inklusion des Perceptions of Inclusion Questionnaire (Venetz, Zurbriggen, Eckhardt, Schwab & Hessels, 2015) eingesetzt. Die interne Konsistenz in der vorliegenden Stichprobe liegt bei α = .69. Darüber hinaus wurde die selbsteingeschätzte Beziehung zur Lehrkraft anhand einer selbstentwickelten Kurzskala mit vier Items („Ich verstehe mich gut mit meiner Klassenlehrerin oder meinem Klassenlehrer.“ „Meine Klassenlehrerin oder mein Klassenlehrer versteht mich.“ „Meine Klassenlehrerin oder mein Klassenlehrer mag mich.“ „Mit meiner Klassenlehrerin oder meinem Klassenlehrer kann ich gut reden.“) auf einer vierstufigen Skala (0 = „stimmt gar nicht“, 1 = „stimmt eher nicht“, 2 = „stimmt eher“, 3 = „stimmt genau“) erfragt. Das Instrument wurde bereits validiert, jedoch noch nicht veröffentlicht. Die interne Konsistenz liegt in der aktuellen Stichprobe bei α = .75. 5.4 Auswertungsstrategie Zunächst wurden Schiefe und Kurtosis der Items analysiert. Eine Schiefe ab einem Wert von 2 und eine Kurtosis ab einem Wert von 4 wurden als Verteilungsgrenzwerte festgelegt (Ryu, 2011). Für die Itemschwierigkeit wurde ein Bereich von 10 % bis 90 % definiert. Es folgten zwei explorative Faktorenanalysen mit Maximum-Likelihood-Extraktion, die jeweils separat für die Bereiche positives LF und negatives LF durchgeführt wurden. Für die separate Analyse beider Teilbereiche wurde sich aus inhaltlichen Gründen entschieden. Eine gemeinsame Analyse negativer und positiver Items hätte vermutlich zur Folge, dass einzelne Dimensionen sowohl negative als auch positive Items beinhalten und somit gegenüberstellende Zusammenhänge von positivem vs. negativem Feedback im Hinblick auf andere Variablen (vgl. Fragestellung 2) nicht mehr möglich wären. Da angenommen wurde, dass die Faktoren innerhalb der beiden Feedbackbereiche korrelieren, wurde eine oblique Rotationsmethode (Promax-Rotation) gewählt. Die Voraussetzungen zur Durchführung von Faktorenanalysen wurden erfüllt. Die Items zeigten keine Anzeichen von Multikollinearität (-.40 < r < .60). Der Bartlett-Test (positives LF: χ² (171) = 2835.99, p < .001; negatives LF: χ² (351) = 3097.16, p < .001) und das Maß der Stichprobeneignung nach Kaiser-Meyer- Olkin (Positives LF: KMO = .94; negatives LF: VHN 1 | 2024 27 MARKUS SPILLES, PHILIPP NICOLAY, CHRISTIAN HUBER Messung von Lehrkraftfeedback FACH B E ITR AG KMO = .93) deuteten auf die Eignung der Variablen für eine Faktorenanalyse hin. Die Entscheidung über die Anzahl der zu extrahierenden Faktoren wurde auf vier Grundlagen getroffen. Zunächst wurde eine Parallelanalyse (Hauptachsenanalyse) durchgeführt, welche eine konkrete Anzahl an extrahierbaren Faktoren liefert. Darüber hinaus wurden die Eigenwerte und die Screeplots für die Beurteilung der Güte herangezogen. Zudem wurden die potenziellen Faktorenstrukturen auf inhaltliche Plausibilität geprüft. Nach der Faktorenextraktion wurden Items gestrichen, die entweder zu schwach auf dem Primärfaktor (< .50) oder zu stark auf mehreren Faktoren (> .32) luden (Tabachnick & Fidell, 2007). Diese Items wurden entfernt. Für die auf diese Weise extrahierten Faktoren wurde die interne Konsistenz mittels Cronbach’s α berechnet. Hierbei wurde auch geprüft, ob einzelne Items redundant sind und keinen zusätzlichen Gewinn für die interne Konsistenz der Skala liefern. Die explorativen Faktorenanalysen wurden mit R und den Paketen lavaan (Rosseel, 2012) und psych (Revelle, 2020) durchgeführt. Zur Überprüfung der Kriteriumsvalidität wurden die Zusammenhänge der Feedbackskalen, die aus den explorativen Faktorenanalysen resultierten, mit der selbstwahrgenommenen sozialen Integration und der selbstwahrgenommenen Lehrkraftbeziehung betrachtet. Hierfür wurden zunächst bivariate Pearson- Korrelationen berechnet. Anschließend wurde für beide Kriteriumsvariablen jeweils ein Regressionsmodell unter Einbezug aller Feedbackskalen gerechnet. Statistisch kontrolliert wurde für das Geschlecht. Alle metrischen Variablen (Skalen des LF-FE-Fragebogens, soziale Integration, Lehrkraftbeziehung) wurden z-standardisiert. Da die Anzahl der Klassen für eine Mehrebenenanalyse zu gering war, wurden in R mit Hilfe des lavaan-Packets (Rosseel, 2012) Regressionsanalysen mit einer Standardfehlerkorrektur gerechnet. 6 Ergebnisse 6.1 Fragestellung 1 (Explorative Analyse der Faktorenstruktur) Keines der Items wurde aufgrund von Schiefe, Kurtosis oder Itemschwierigkeit gestrichen. Zwei Items (1, 9, vgl. Tab. 1), die die Testleitenden als zu schwierig für die Schulkinder einschätzen, wurden nicht mit in die Analysen einbezogen. Es verblieben n = 45 Items (positives Feedback: n = 19, negatives Feedback: n = 26). 6.1.1 Positives Feedback Aus der Parallelanalyse über alle 19 Items zum positiven LF resultierten vier zu extrahierende Faktoren, wobei der vierte Faktor einen Eigenwert von 0.98 aufwies. Ebenfalls zeigte sich im Screeplot der Knick im Eigenwertverlauf nach dem vierten Faktor. Da das vorgeschlagene vierfaktorielle Modell auch inhaltlich plausibel erschien, wurde die Faktorenanalyse mit dieser Voraussetzung durchgeführt. Nach der Löschung von Items mit zu geringen Faktorladungen bzw. zu hohen Kreuzladungen (2 - 7, vgl. Tab. 1) verblieben drei Faktoren mit jeweils drei Items und ein Faktor mit vier Items. Die Analyse der internen Konsistenzen zeigte für das vierte Item (8, vgl. Tab. 1) dieses Faktors jedoch keine zusätzliche Verbesserung. Außerdem wurde es als inhaltlich redundant zu den anderen Items eingeschätzt und somit gestrichen. Das finale Modell beinhaltete entsprechend vier Faktoren à drei Items (vgl. Tab. 2), die sich inhaltlich wie folgt interpretieren lassen: Sozialverhalten (bspw. „Du bist freundlich zu anderen Kindern.“), Lernverhalten (bspw. „Du konzentrierst dich.“), Schulleistung (bspw. „Deine Antwort ist richtig.“) und Organisation (bspw. „Du gehst gut mit deinen Schulsachen um.“). Die internen Konsistenzen dieser Subskalen liegen zwischen α = .70 und α = .77 (vgl. Tab. 3). VHN 1 | 2024 28 MARKUS SPILLES, PHILIPP NICOLAY, CHRISTIAN HUBER Messung von Lehrkraftfeedback FACH B E ITR AG Abschließend wurde das finale Modell noch über eine konfirmatorische Faktorenanalyse mit Maximum-Likelihood-Schätzer geprüft 1 . Es ergaben sich folgende Fit-Werte: χ 2 = 79.68, df = 48, p < .01, CFI = .978, TLI = .970, SRMR = .032, RMSEA = .043 (90 % CI = [.025; .059]). Nach den empfohlenen Kriterien von Hu und Bentler (1999) liegt ein guter Fit vor. 6.1.2 Negatives Feedback Die Parallelanalyse über alle 26 Items zum negativen LF ergab ebenfalls vier zu extrahierende Faktoren, wobei der vierte Faktor einen Eigenwert von 1.21 aufwies. Bei Betrachtung des Screeplots zeigte sich der Knick im Eigenwertverlauf nach dem dritten Faktor. Das vorgeschlagene vierfaktorielle Modell lieferte inhaltlich keine plausible Struktur, das dreifaktorielle Modell hingegen schon. Die Faktorenanalyse wurde daher mit drei möglichen Faktoren durchgeführt, wobei der Eigenwert des dritten Faktors bei 1.49 lag. Nach der Löschung von Items mit zu geringen Faktorladungen bzw. zu hohen Kreuzladungen (10 - 23, vgl. Tab. 1) verblieben drei Faktoren mit jeweils vier Items. Die Faktoren dieses finalen Modells (vgl. Tab. 2) lassen sich inhaltlich interpretieren als: Sozialverhalten (bspw. „Du streitest dich mit anderen Kindern.“), Lernverhalten und Schulleistung (bspw. „Du strengst dich zu wenig an.“ oder „Deine Antwort ist falsch.“) und Störverhalten (bspw. „Du bist zu laut.“). Die internen Konsistenzen der Subskalen liegen zwischen α = .72 und α = .82 (vgl. Tab. 3). Item Grund für den Ausschluss 1) Du arbeitest selbstständig. 2) Du hast deine Hausaufgaben gut erledigt. 3) Du passt gut auf. 4) Du machst im Unterricht gut mit. 5) Du strengst dich an. 6) Du arbeitest ruhig. 7) Du beginnst von alleine mit der Arbeit. 8) Du hast deine Schulsachen schon ausgepackt. 9) Du arbeitest nicht selbstständig. 10) Du bist nicht konzentriert. 11) Du hältst dich nicht an die Klassenregeln. 12) Du passt nicht gut auf. 13) Du hast deine Schulsachen noch nicht ausgepackt. 14) Du kontrollierst deine Aufgaben nicht ordentlich. 15) Du machst im Unterricht nicht gut mit. 16) Du hast deine Schulsachen vergessen. 17) Du beginnst nicht von alleine mit der Arbeit. 18) Du arbeitest nicht ordentlich. 19) Dein Platz ist unordentlich. 20) Du gehst nicht gut mit deinen Schulsachen um. 21) Du arbeitest nicht gut mit anderen Kindern zusammen. 22) Du zappelst zu viel rum. 23) Du hast eine schlechte Note in der Klassenarbeit geschrieben. Unverständlich für die Kinder Ladung auf mehreren Faktoren Ladung auf mehreren Faktoren Ladung auf mehreren Faktoren Ladung auf mehreren Faktoren Zu geringe Primärfaktorladung Zu geringe Primärfaktorladung Keine Steigerung int. Konsistenz Unverständlich für die Kinder Zu geringe Primärfaktorladung Zu geringe Primärfaktorladung Ladung auf mehreren Faktoren Zu geringe Primärfaktorladung Zu geringe Primärfaktorladung Zu geringe Primärfaktorladung Zu geringe Primärfaktorladung Zu geringe Primärfaktorladung Zu geringe Primärfaktorladung Zu geringe Primärfaktorladung Zu geringe Primärfaktorladung Zu geringe Primärfaktorladung Zu geringe Primärfaktorladung Zu geringe Primärfaktorladung Tab. 1 Ausgeschlossene Items Anmerkung: Zu schwache Ladung auf dem Primärfaktor (< .50) oder zu starke Ladungen auf mehreren Faktoren (> .32) (Tabachnick & Fidell, 2012). VHN 1 | 2024 29 MARKUS SPILLES, PHILIPP NICOLAY, CHRISTIAN HUBER Messung von Lehrkraftfeedback FACH B E ITR AG Positives Feedback M SD r i (s -i) Sozialverhalten Du hältst dich an die Klassenregeln. Du bist freundlich zu anderen Kindern. Du arbeitest gut mit anderen Kindern zusammen. 2.65 2.90 2.75 1.27 1.25 1.25 .57 .62 .61 Lernverhalten Du arbeitest ordentlich. Du arbeitest schnell. Du konzentrierst dich. 2.74 2.46 2.64 1.26 1.29 1.23 .63 .56 .58 Schulleistung Du hast eine gute Note in einer Klassenarbeit geschrieben. Deine Antwort ist richtig. Du hast eine Aufgabe richtig gelöst. 2.46 2.66 2.73 1.22 1.07 1.11 .46 .55 .54 Organisation Du gehst gut mit deinen Schulsachen um. Du hast an deine Schulsachen gedacht. Dein Platz ist ordentlich. 2.52 2.55 2.47 1.40 1.41 1.49 .55 .52 .54 Negatives Feedback M SD r i (s -i) Sozialverhalten Du bist zu wütend. Du bist unfreundlich zu anderen Kindern. Du streitest dich mit anderen Kindern. Du benutzt zu häufig Schimpfwörter. 0.76 0.77 0.92 0.63 1.15 1.14 1.04 1.03 .54 .47 .55 .56 Lernverhalten und Schulleistung Du hast die Aufgabe falsch gelöst. Deine Antwort ist falsch. Du arbeitest zu langsam. Du strengst dich zu wenig an. 1.26 1.20 1.03 0.79 1.00 1.02 1.14 1.01 .47 .54 .47 .54 Störverhalten Du störst den Unterricht. Du führst zu viele Gespräche im Unterricht. Du machst zu viel Quatsch. Du bist zu laut. 0.94 1.40 1.13 1.07 1.07 1.18 1.18 1.04 .62 .66 .64 .64 Anmerkung: Antworten auf die Frage: „Wie häufig sagt deine Lehrerin oder dein Lehrer so etwas zu dir? “ Antwortoptionen: 0 = sehr selten, 1 = selten, 2 = manchmal, 3 = oft, 4 = sehr oft. r i (s -i) (Trennschärfe): Korrelation des jeweiligen Items (i) im Hinblick auf die zugehörige Subskala (s) ohne dieses Item (s -i). Tab. 2 Darstellung der eingeschlossenen Items und Skalen n M SD Schiefe Kurtosis α Positives Feedback 12 2.63 0.83 -0.69 0.16 .87 Sozialverhalten Lernverhalten Schulleistung Organisation 3 3 3 3 2.77 2.61 2.62 2.51 1.04 1.03 0.89 1.15 -0.85 -0.72 -0.54 -0.51 0.11 -0.02 0.08 -0.69 .77 .76 .70 .72 Negatives Feedback 12 0.99 0.65 0.77 0.40 .84 Sozialverhalten Lernverhalten und Schulleistung Störverhalten 4 4 4 0.77 1.07 1.14 0.82 0.77 0.90 1.33 0.62 0.63 1.68 0.01 -0.10 .74 .72 .82 Anmerkung: n = Anzahl der Items je Skala. Range: 0 -4 (Mittelwert der Items je Skala). Tab. 3 Skalenstatistik VHN 1 | 2024 30 MARKUS SPILLES, PHILIPP NICOLAY, CHRISTIAN HUBER Messung von Lehrkraftfeedback FACH B E ITR AG Abschließend wurde das finale Modell noch über eine konfirmatorische Faktorenanalyse mit Maximum-Likelihood-Schätzer geprüft. Es ergaben sich folgende Fit-Werte: χ 2 = 100.80, df = 51, p < .001, CFI = .960, TLI = .948, SRMR = .039, RMSEA = .052 (90 % CI = [.037; .067]). Nach den Kriterien von Hu und Bentler (1999) liegt ein guter Fit vor. In Tab. 4 findet sich noch eine Darstellung der Interkorrelationen der finalen Skalen. 6.2 Fragestellung 2 (Überprüfung der Kriteriumsvalidität) Tab. 5 beinhaltet zunächst die Interkorrelationen der sieben Feedbackskalen mit den beiden Kriteriumsvariablen (soziale Integration, Beziehung zur Lehrkraft). Alle Subskalen des LF-FE-Fragebogens korrelieren signifikant und in der erwarteten Richtung mit beiden Variablen, wobei im Bereich der sozialen Integration das positive sowie negative Feedback zum Sozialverhalten den höchsten Zusammenhang (schwache bis mittlere Korrelation) aufweist. Für die Lehrkraftbeziehung ergeben sich relativ ähnliche (schwache) Zusammenhänge, wobei die Korrelation mit positivem Feedback zur Organisation am geringsten ausfällt. Die Ergebnisse der Regressionsanalyse sind in Tab. 6 abgetragen. Multikollinearitätsprobleme (-.36 < r < .58) der Prädiktoren lagen keine vor. Es ergeben sich signifikante und schwache bis mittlere Zusammenhänge mit der sozialen Integration für das positive und negative LF zum Sozialverhalten. Im Hinblick auf die Lehrkraftbeziehung ist negatives Feedback zum störenden Verhalten der einzige signifikante (schwache) Prädiktor. 1.1 1.2 1.3 1.4 2.1 2.2 2.3 Positives Feedback 1.1 Sozialverhalten 1.2 Lernverhalten 1.3 Schulleistung 1.4 Organisation .58*** .50*** .55*** .53*** .55*** .45*** -.25*** -.05 -.19*** -.05 -.10 -.24*** -.36*** -.11* -.18*** -.24*** -.23*** -.16** Negatives Feedback 2.1 Sozialverhalten 2.2 Lernverhalten und Schulleistung 2.3 Störverhalten .41*** .45*** .44*** Anmerkung: Korrelationen (Pearson) sind auf einem Niveau von p < .05 (*) bzw. p < .01 (**) bzw. p < .001 (***) signifikant. Tab. 4 Interkorrelationen der Subskalen des Feedbackfragebogens Soziale Integration Beziehung Lehrkraft Positives Feedback Sozialverhalten .27*** .23*** Lernverhalten .15** .20*** Schulleistung .19*** .25*** Organisation .17** .14* Negatives Feedback Sozialverhalten -.35*** -.20*** Lernverhalten und Schulleistung -.15** -.19*** Störverhalten -.17** -.24*** Anmerkung: Korrelationen (Pearson) sind auf einem Niveau von p< .05 (*) bzw. p< .01 (**) bzw. p< .001 (***) signifikant. Tab. 5 Interkorrelationen mit den Kriteriumsvariablen VHN 1 | 2024 31 MARKUS SPILLES, PHILIPP NICOLAY, CHRISTIAN HUBER Messung von Lehrkraftfeedback FACH B E ITR AG 7 Diskussion 7.1 Fragestellung 1 (Explorative Analyse der Faktorenstruktur) Bei der Exploration der Faktorenstruktur ergab sich für das positive und negative LF eine psychometrisch zufriedenstellende und inhaltlich plausible Faktorenstruktur. Grundsätzlich wurde bestätigt, dass sich positives wie negatives LF auch in der Selbstwahrnehmung der FE grob in die Bereiche Lernen (Lernverhalten, Schulleistungen) und Sozialverhalten (Sozialverhalten, Störverhalten) aufteilt, was vergleichbar mit Operationalisierungen von LF in bisherigen Beobachtungsstudien (bspw. Wullschleger et al., 2020) ist. Bemerkenswert ist, dass für positives und negatives LF teilweise divergierende Subskalen resultierten. Während das Sozialverhalten eine eigene Subskala sowohl bzgl. des positiven als auch bzgl. des negativen LF bildete, zeigte sich im Hinblick auf das Lernen beim positiven LF eine Aufteilung in die Bereiche Schulleistungen und Lernverhalten, während beim negativen LF beide Bereiche zu einer einzigen Skala Lernverhalten und Schulleistung zusammengefasst wurden. Darüber hinaus ergab sich lediglich für das negative LF die Skala Störverhalten, die Skala Organisation wurde nur in Bezug zum positiven LF gefunden. Für diese unterschiedlichen Fokusbereiche in beiden Valenzkategorien sind mehrere Erklärungsansätze denkbar. So könnten Schulkinder positives LF tatsächlich differenzierter wahrnehmen als negatives LF. Dies könnte daran liegen, dass die Auftretenshäufigkeit von positivem LF in der Wahrnehmung der Kinder deutlich über der von negativem LF liegt (vgl. Tab. 3). Vermutlich sind den Kindern dadurch positive Äußerungen der Lehrkräfte kognitiv präsenter als negative, weshalb sie auch besser zwischen Lernverhalten und Schulleistung differenzieren können. Nicht überraschend ist der zusätzliche Faktor Störverhalten beim negativen Feedback. Schließlich gibt es kaum positive Pendants zu Rückmeldungen bei störenden Verhaltensweisen. Verwunderlich hingegen ist, dass sich die Skala Organisation nur für den Bereich des positiven LF ergab, obwohl entsprechende negative Items im Fragebogen enthalten waren. Denkbar ist auch, dass durch Soziale Integration Beziehung Lehrkraft β SE p β SE p Geschlecht -.01 .11 .938 -.02 .09 .798 Positives Feedback Sozialverhalten Lernverhalten Schulleistung Organisation .15 -.02 .04 .07 .07 .08 .05 .07 .019 .862 .436 .315 .11 .04 .14 -.03 .07 .12 .08 .06 .117 .751 .072 .561 Negatives Feedback Sozialverhalten Lernverhalten und Schulleistung Störverhalten -.30 .00 .01 .08 .09 .07 < .001 .965 .842 -.07 -.04 -.14 .07 .06 .06 .350 .540 .013 R² / korrigiertes R² .162 / .143 .115 / .095 Anmerkungen: Fett gedruckt: p < .05. Referenzkategorie Geschlecht: weiblich. β = standardisiertes Regressionsgewicht. Tab. 6 Ergebnisse der Regressionsanalyse mit Standardfehlerkorrektur VHN 1 | 2024 32 MARKUS SPILLES, PHILIPP NICOLAY, CHRISTIAN HUBER Messung von Lehrkraftfeedback FACH B E ITR AG die Auswahl der Items die Möglichkeit zur Bildung verschiedener Subskalen limitiert wurde. Bei der Itemformulierung wurde jedoch darauf geachtet, dass es zu jeder positiven Aussage auch ein negatives Pendant gibt, was jedoch im Hinblick auf Aussagen zum Störverhalten nicht immer inhaltlich plausibel war. 7.2 Fragestellung 2 (Überprüfung der Kriteriumsvalidität) Die Ergebnisse zum Zusammenhang zwischen LF und der sozialen Integration gehen einher mit bisherigen Studien zur Thematik (bspw. Wullschleger et al., 2020; Spilles et al., 2023). Ähnlich wie in bisherigen Feldstudien zeigte sich auch hier, dass vorrangig LF zum Sozialverhalten mit der sozialen Integration zusammenhängt. Einschränkend muss jedoch konstatiert werden, dass in der aktuellen Studie lediglich die selbstwahrgenommene soziale Integration gemessen wurde und nicht die soziale Akzeptanz durch die Mitschüler/ innen. Die Forschungslage zum Zusammenhang von LF und der wahrgenommenen Beziehung zur Lehrkraft ist noch nicht so breit wie im Hinblick auf die soziale Integration. Bei Skipper und Douglas (2015) wurde lediglich leistungsbezogenes LF gemessen, wobei kritisch wahrgenommenes LF mit einer negativ wahrgenommenen Lehrkraftbeziehung einherging. In unserer Studie zeigt sich, dass vermutlich aber insbesondere Kritik am Störverhalten der Schüler/ innen mit einer negativ wahrgenommenen Lehrkraftbeziehung korreliert. Eine Erklärung für die Bedeutsamkeit von LF zum Sozialbzw. Störverhalten im Hinblick auf die wahrgenommene soziale Integration bzw. Beziehung zur Lehrkraft könnte die durch die Kinder wahrgenommene emotionale Temperatur (vgl. Huber, 2019) des LF sein, die in unserer Studie nicht zusätzlich erfasst wurde. Bei der emotionalen Temperatur werden Informationen zur Beziehung zwischen der Person, die ein Feedback ausspricht, und der Person, die das Feedback empfängt, transportiert. Nach Huber (2019) umfasst diese sowohl die digitale (konkrete sprachliche) als auch die analoge (non- und paraverbale) Kommunikation, wie die Lautstärke, Stimmlage, Gestik oder Mimik. Hendrickx, Mainhard, Oudman, Boor-Klip und Brekelmans (2017) konnten zeigen, dass negativ-affektive Verhaltensweisen von Lehrkräften (bspw. Aussagen wie „Du nervst mich gerade sehr! “) einen signifikanten Einfluss darauf nehmen, wie die Mitschüler/ innen die Beziehung zwischen Lehrkraft und dem/ der Interaktionspartner/ in einschätzen. Der emotionalen Temperatur des LF kommt also scheinbar eine entscheidende Bedeutung im Hinblick auf die Wahrnehmung von sozialen Beziehungen zu. 7.3 Limitationen Selbstverständlich ergeben sich einige Limitationen. Erstens wurde die Faktorenstruktur nur explorativ untersucht. Diese müsste konfirmatorisch bestätigt und mit Blick auf die Mittelwertunterschiede zwischen Jungen und Mädchen auch in Bezug auf ihre Messinvarianz untersucht werden. Zweitens wurden keine weiteren Instrumente zur Messung von LF eingesetzt, wie bspw. systematische Verhaltensbeobachtungen. Drittens beschränkten sich die eingesetzten Items auf die Häufigkeit von Aussagen. In Zukunft wäre es wünschenswert, auch Hinweise über die emotionale Temperatur des LF zu erfahren. Viertens wurde LF nur sehr oberflächlich gemessen und nicht in Anlehnung an ein differenziertes Modell (bspw. Hattie & Timperley, 2007), was allerdings eine bewusste Entscheidung war, da nicht speziell lernbezogenes LF im Fokus der Untersuchung stand, sondern eher die Wahrnehmung von grundsätzlichen Fokusbereichen durch Grundschul- VHN 1 | 2024 33 MARKUS SPILLES, PHILIPP NICOLAY, CHRISTIAN HUBER Messung von Lehrkraftfeedback FACH B E ITR AG kinder. Fünftens müssten Replikationsstudien auch andere Zielgruppen in den Blick nehmen, also bspw. ältere oder jüngere Schüler/ innen. 7.4 Fazit Trotz der genannten Einschränkungen liegt mit dem LF-FE-Fragebogen ein frei verfügbares Instrument für den deutschsprachigen Raum vor, das LF ökonomisch, differenziert und aus Perspektive der FE misst. Die signifikanten Zusammenhänge mit Aspekten des schulischen Wohlbefindens (selbstwahrgenommene soziale Integration und Beziehung zur Lehrkraft) geben erste Hinweise auf dessen Validität. Der Bedeutung des selbstwahrgenommenen LF für die Entwicklung von positiven sozialen Beziehungen sollte in künftigen Studien daher mehr Beachtung zukommen. Dabei sollte insbesondere geprüft werden, ob in diesem Zusammenhang tatsächlich vorrangig LF zum Sozialverhalten und zum Störverhalten prädiktiv ist und welche Rolle die emotionale Temperatur des LF spielt. Anmerkung 1 Die Durchführung einer konfirmatorischen Analyse an derselben Stichprobe, an der bereits eine explorative Faktorenanalyse durchgeführt wurde, ist tautologisch. Wir berichten die entsprechenden Indizes aber dennoch, damit die Leserinnen und Leser einen besseren Eindruck von der Modellgüte erhalten und für künftige konfirmatorische Überprüfungen an unabhängigen Stichproben eine Referenz vorliegt. Literatur Burnett, P. C. (1996). Significant Others Statements Inventory. Abgerufen am 1. 3. 2023 von https: / / eprints.qut.edu.au/ 26832/ 2/ 26832.pdf Burnett, P. C. (1999). Children’s self-talk and academic self-concepts. Educational Psychology in Practice, 15 (3), 195 -200. http: / / dx.doi.org/ 10.1080/ 0266736990150308 Burnett, P. C. (2002). Teacher praise and feedback and students’ perceptions of the classroom environment. Educational Psychology, 22 (1), 5-16. https: / / doi.org/ 10.1080/ 01443410120101215 de Kleijn, R. A. M. (2023). Supporting student and teacher feedback literacy: an instructional model for student feedback processes. Assessment & Evaluation in Higher Education, 48 (2), 186 -200. https: / / doi.org/ 10.1080/ 02602938.20 21.1967283 Hartke, B. & Vrban, R. (2015). Schwierige Schüler - 49 Handlungsmöglichkeiten bei Verhaltensauffälligkeiten. 10. Aufl. Buxtehude: Persen. Hattie, J. (2009). Visible Learning: A Synthesis of Over 800 Meta-Analyses Relating to Achievement. London: Routledge. Hattie, J. & Timperley, H. (2007). The power of feedback. Review of Educational Research, 77 (1), 81 -112. https: / / doi.org/ 10.3102/ 00346543029 8487 Hendrickx, M. M. H. G., Mainhard, T., Oudman, S., Boor-Klip, H. J. & Brekelmans, M. (2017). Teacher behavior and peer liking and disliking: The teacher as a social referent for peer status. Journal of Educational Psychology, 109 (4), 546 -558. https: / / doi.org/ 10.1037/ edu0000157 Hoya, F. (2018). Feedback aus der Sicht von Kindern und Lehrkräften. Die Relevanz der Erteilung und Wahrnehmung im Leseunterricht der Grundschule. Wiesbaden: Springer VS. https: / / doi.org/ 10.1007/ 978-3-658-23129-3 Hoya, F. (2021). Unterschiede in der Wahrnehmung positiven und negativen Feedbacks von Mädchen und Jungen im Leseunterricht der Grundschule. Unterrichtswissenschaft, 49, 423 -441. https: / / doi.org/ 10.1007/ s42010-021-00102-1 Hu, L. T. & Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling: A Multidisciplinary Journal, 6 (1), 1 -55. https: / / doi.org/ 10.10 80/ 10705519909540118 Huber, C. (2019). Ein integriertes Rahmenmodell zur Förderung sozialer Integration im inklusiven Unterricht. Sozialpsychologische Grundlagen, empirische Befunde und schulpraktische Ableitungen. Vierteljahresschrift für Heilpädagogik und ihre Nachbargebiete, 88 (1), 27 -43. http: / / dx.doi.org/ 10.2378/ vhn2019.art06d Mapplebeck, A. & Dunlop, L. (2021). Oral interactions in secondary science classrooms: a grounded approach to identifying oral feedback types VHN 1 | 2024 34 MARKUS SPILLES, PHILIPP NICOLAY, CHRISTIAN HUBER Messung von Lehrkraftfeedback FACH B E ITR AG and practices. Research in Science Education, 51 (Suppl 2), 957 -982. https: / / doi.org/ 10.1007/ s11165-019-9843-y Nelson, P. M., Demers, J. A. & Christ, T. J. (2014). The Responsive Environmental Assessment for Classroom Teaching (REACT): The dimensionality of student perceptions of the instructional environment. School Psychology, 29(2), 182-197. http: / / dx.doi.org/ 10.1037/ spq0000049 Núñez, J. C., Suárez, N., Rosário, P., Vallejo, G., Cerezo, R. & Valle, A. (2015). Teachers’ feedback on homework, homework-related behaviors, and academic achievement. The Journal of Educational Research, 108 (3), 204-216. https: / / doi.org/ 10.1080/ 00220671.2013.878298 O’Mara, A. J., Marsh, H. W., Craven, R. G. & Debus, R. L. (2006). Do self-concept interventions make a difference? A synergistic blend of construct validation and meta-analysis. Educational Psychologist, 41 (3), 181 -206. https: / / doi.org/ 10.1207/ s15326985ep4103_4 Petermann, U. & Petermann, F. (2013). Lehrereinschätzliste für Sozial- und Lernverhalten. 2. Aufl. Göttingen: Hogrefe. Revelle, W. (2020). psych: Procedures for Personality and Psychological Research. Evanston, Illinois: Northwestern University. Rosseel, Y. (2012). lavaan: An R Package for Structural Equation Modeling. Journal for Statistical Software, 48 (2), 1 -36. https: / / doi.org/ 10.18637/ jss.v048.i02 Ryu, E. (2011). Effects of skewness and kurtosis on normal-theory based maximum likelihood test statistics in multilevel structural equation modeling. Behavior Research Methods, 43, 1066 - 1074. https: / / doi.org/ 10.3758/ s13428-011-011 5-7 Schwab, S., Goldan, J. & Hoffmann, L. (2019). Individuelles Feedback als Bestandteil inklusiven Unterrichts? Eine empirische Studie über die Wahrnehmung von individuellem Lehrkraftfeedback aus Schülerinnen- und Schülersicht. In M.-C. Vierbuchen & F. Bartels (Hrsg.), Feedback in der Unterrichtspraxis. Schülerinnen und Schüler beim Lernen wirksam unterstützen, 95 -108. Stuttgart: Kohlhammer. Schwab, S., Markus, S. & Hassani, S. (2022). Teachers’ feedback in the context of students’ social acceptance, students’ well-being in school and students’ emotions. Educational Studies, Online First. https: / / doi.org/ 10.1080/ 03055698.20 21.2023475 Skipper, Y. & Douglas, K. (2015). The influence of teacher feedback on children’s perceptions of student-teacher relationships. British Journal of Educational Psychology, 85 (3), 276 -288. https: / / doi.org/ 10.1111/ bjep.12070 Spilles, M., Huber, C., Nicolay, P., König, J. & Hennemann, T. (2023). The relationship of classmatesperceived teacher feedback and the social acceptance of second, third and fourth graders. International Journal of Inclusive Education. https: / / doi.org/ 10.1080/ 13603116.2023.2185690 Tabachnick, B. G. & Fidell, L. S. (2007). Using Multivariate Statistics. 5 th ed. New York: Pearson International. Venetz, M., Zurbriggen, C. L. A., Eckhart, M., Schwab, S. & Hessels, M. G. P. (2015). The Perceptions of Inclusion Questionnaire (PIQ). Deutsche Version. Abgerufen am 1. 3. 2023 von https: / / piqinfo.ch/ wp-content/ uploads/ 2019/ 08/ piq-deutsch.pdf Volpe, R. J., Casale, G., Mohiyeddini, C., Grosche, M., Hennemann, T., Briesch, A. M. & Daniels, B. (2018). A universal behavioral screener linked to personalized classroom interventions: Psychometric characteristics in a large sample of German school children. Journal of School Psychology, 66, 25 -40. https: / / doi.org/ 10.1016/ j. jsp.2017.11.003 Wisniewski, B., Zierer, K. & Hattie, J. (2020). The power of feedback revisited: A meta-analysis of educational feedback research. Frontiers in Psychology, 10, 1 -14. https: / / doi.org/ 10.3389/ fpsyg.2019.03087 Wullschleger, A., Garrote, A., Schnepel, S., Jaquiéry, L. & Moser Opitz, E. (2020). Effects of teacher feedback behavior on social acceptance in inclusive elementary classrooms: Exploring social referencing processes in a natural setting. Contemporary Educational Psychology, 60, 1 -12. https: / / doi.org/ 10.1016/ j.cedpsych.2020.101841 Anschrift der Autoren Dr. Markus Spilles Philipp Nicolay Prof. Dr. Christian Huber Bergische Universität Wuppertal Institut für Bildungsforschung Gaußstr. 20 D-42119 Wuppertal E-Mail: spilles@uni-wuppertal.de