motorik
7
0170-5792
Ernst Reinhardt Verlag, GmbH & Co. KG München
10.2378/mot2023.art05d
11
2023
461
Fachbeiträge aus Theorie und Praxis: Urteilsakkuratheit von Grundschullehrpersonen in der Einschätzung von motorischen Basiskompetenzen
11
2023
Benjamin Niederkofler
Die Studie ist der Frage nachgegangen, wie akkurat Lehrpersonen der Grundschule die motorischen Basiskompetenzen (MB) von Schulkindern einschätzen. Dazu wurden 16 Lehrpersonen gebeten, die MB von 254 Schulkindern der 2. bzw. 4. Schulstufe zu beurteilen. Zudem wurden die Schulkinder in den MB Sich-Bewegen (SB) und Etwas-Bewegen (EB) (Herrmann 2018) getestet. Die Berechnung der Urteilskomponenten nach Schrader (1989) zeigte eine Überschätzung des Niveaus der MB, eine akkurate Einschätzung der Leistungsheterogenität im EB sowie deren Unterschätzung im SB und eine mittlere Urteilsakkuratheit für die Rangordnung. Dies zeigt, dass Lehrpersonen MB nur bedingt einschätzen können.
7_046_2023_1_0006
Zusammenfassung / Abstract Die Studie ist der Frage nachgegangen, wie akkurat Lehrpersonen der Grundschule die motorischen Basiskompetenzen (MB) von Schulkindern einschätzen. Dazu wurden 16 Lehrpersonen gebeten, die MB von 254 Schulkindern der 2. bzw. 4. Schulstufe zu beurteilen. Zudem wurden die Schulkinder in den MB Sich-Bewegen (SB) und Etwas-Bewegen (EB) (Herrmann 2018) getestet. Die Berechnung der Urteilskomponenten nach Schrader (1989) zeigte eine Überschätzung des Niveaus der MB, eine akkurate Einschätzung der Leistungsheterogenität im EB sowie deren Unterschätzung im SB und eine mittlere Urteilsakkuratheit für die Rangordnung. Dies zeigt, dass Lehrpersonen MB nur bedingt einschätzen können. Schlüsselbegriffe: Diagnostische Kompetenz, Sportunterricht, Primarstufe Accuracy of primary teacher judgments on basic motor competencies This study investigated how accurate primary school teachers assess the basic motor competence (BMC) of students. 16 teachers were asked to assess the BMC of 254 2nd and 4th graders. In addition, the students were tested in the BMC Self-Movement (SM) and Object- Movement (OM, Herrmann 2018). The calculation of judgment components according to Schrader (1989) showed an overestimation of BMC level, an accurate assessment of BMCs’ heterogeneity in OM as well as its underestimation in SM, and a medium judgment accuracy for the BMCs’ ranking. These finding shows that teachers can assess BMC only to a certain extent. Keywords: Diagnostic competence, physical education, primary school [ 26 ] 1 | 2023 motorik, 46. Jg., 26-34, DOI 10.2378 / mot2023.art05d © Ernst Reinhardt Verlag [ FACHBEITRAG ] Urteilsakkuratheit von Grundschullehrpersonen in der Einschätzung von motorischen Basiskompetenzen Benjamin Niederkofler Einleitung Geht man davon aus, dass die Bewegung und Bewegungsentwicklung ein Ziel von Sportunterricht darstellt (Doppelauftrag), dann sollten die pädagogische Diagnostik sowie die Entscheidungen der Lehrpersonen im Rahmen des motorischen Leistungsstatus von Schulkindern besonders souverän ausfallen. Obgleich den Lehrpersonen vor dem Hintergrund ihres beruflichen Ethos bei Unterrichtsentscheidungen zu vertrauen ist, wurde in verschiedenen Untersuchungen festgestellt, dass an den Diagnosen der Lehrpersonen auch begründete Zweifel angemeldet werden können (Hoge / Coladarci 1989; Südkamp, Kaiser / Möller 2012). Auch im Fach Sport deuten Erkenntnisse darauf hin, dass Lehrpersonen Schwierigkeiten haben, fachspezifische Lern- und Leistungsmerkmale der Schulkinder einzuschätzen (Ferrari et al. 2022; Niederkofler / Herrmann / Amesberger 2018; Seyda 2018). Dabei lässt sich in jüngster Zeit ein gesteigertes Interesse an Diagnosen über motorische Basiskompetenzen (MB) erkennen. MB werden als Kompetenzen definiert, die Kinder mindestens benötigen, um sportliche Bewegungen im Sinne der kulturellen Teilhabe ausführen zu können [ 27 ] Niederkofler • Urteilsakkuratheit von Grundschullehrpersonen 1 | 2023 (Herrmann 2018). Der Fokus auf MB ist einleuchtend, da ein Kind bspw. nur dann an Ballspielen teilnehmen kann, wenn es die Grundfertigkeiten des Werfens und Fangens erworben hat. Gleichzeitig nehmen MB in allen Schulstufen und insbesondere in der Grundschule einen hohen curricularen Stellenwert ein (Herrmann / Gerlach 2014; Niederkofler / Herrmann 2020). Entsprechend wichtig ist es für Lehrpersonen, die Ausprägung der MB innerhalb der Klasse zu kennen, um den Erwerb von MB im Unterricht formativ zu unterstützen, summativ zu überprüfen sowie um prognostische Aussagen über die Möglichkeiten der Teilhabe an der Sport- und Bewegungskultur tätigen zu können. Zur Diagnose von MB können Lehrpersonen auf elaborierte Testinstrumente zurückgreifen (u. a. Herrmann 2018). Deren Anwendung verspricht lehrplanbezogene Informationen zum Laufen, Springen, Balancieren, Rollen (genannt Sich-Bewegen) und zum Werfen, Fangen, Prellen, Dribbeln (genannt Etwas-Bewegen) der Schulkinder (Niederkofler / Herrmann 2020). Eine Durchführung des gesamten Tests ist in der Unterrichtspraxis jedoch nicht immer möglich. Häufig ist der zeitliche Rahmen eingeschränkt und Lehrpersonen müssen Stehgreif-Diagnosen tätigen. In diesem Kontext stellen sich Fragen zur Akkuratheit von Diagnosen. Während für den Kindergarten und die Sekundarstufe bereits erste Erkenntnisse vorliegen, ist bisher unklar, wie akkurat Lehrpersonen der Grundschule die MB bei Schulkindern einschätzen. Theoretische Überlegungen zur diagnostischen Kompetenz Diagnostische Kompetenz bezeichnet zunächst die Fähigkeit eines Menschen, Merkmale anderer Menschen korrekt einzuschätzen (Schrader 2013). Mit Blick auf Lehrpersonen und deren Einschätzung von lern- und leistungsrelevanten Merkmalen bei Schulkindern muss der Begriff allerdings präziser gefasst werden. Häufig wird von einem Diagnoseprozess ausgegangen (Niederkofler et al. 2018; Südkamp / Praetorius 2017), in welchem Informationen z. B. über den Lernstand der Schulkinder fortlaufend erhoben, interpretiert und pädagogisch-didaktisch genutzt werden. Niederkofler et al. (2018) postulieren, dass Lehrpersonen im Prozess auf unterschiedliche diagnostische Ressourcen zurückgreifen. Konkret werden das Wissen und Können zur Diagnostik, die diagnostischen Fähigkeiten, die Diagnosesituation, die Diagnose, das Wissen aus Diagnosen sowie das diagnostische Urteil als Prozesselemente der diagnostischen Kompetenz hervorgehoben, welche in eine didaktische Entscheidung einfließen. Eine zentrale Rolle nimmt die Diagnosesituation ein. Diese ergibt sich im Fach Sport häufig aus der Beobachtung von Bewegungshandlungen, wobei die Lehrperson an bestimmten Handlungsmerkmalen der Schulkinder interessiert ist (z. B. die Ausführungsqualität der Rolle) und eine Diagnose tätigt (siehe Abb. 1). Diagnostische Kompetenz bezeichnet also das Können, Wissen und Wollen einer Lehrperson im Vollzug des Diagnoseprozesses. Die Ausdifferenzierung als Prozess in Abbildung 1 macht ersichtlich, dass diagnostische Kompetenz von Lehrpersonen zwei Funktionen erfüllt. Man unterscheidet eine wissensgenerierende und eine bedingende Funktion. So kann die Lehrperson ihr Wissen und Können zur Diagnostik in Diagnosesituationen für eine Diagnose nutzen. Diese Elemente erfüllen die Funktion der Wissensgenerierung (z. B. über die motorischen Fertigkeiten des Schulkindes). Zudem kann die Diagnose in ein diagnostisches Urteil überführt (z. B. kann die Rolle nicht sicher ausführen) und für didaktische Entscheidungen (z. B. Feedback an das Schulkind) genutzt werden. Diese Elemente schreiben der diagnostischen Kompetenz eine bedingende Funktion zu, im Sinne der Konstituierung von weiteren Handlungen. Im Folgenden werden die bedingenden Prozesselemente der diagnostischen Kompetenz vertieft. Für eine umfassende Beschreibung des Diagnoseprozesses wird auf Niederkofler et al. (2018) verwiesen. Diagnosen Mit informellen, semiformellen und formellen Diagnosen werden drei pädagogische Diagnoseformen unterschieden (Hascher 2008; Ingen- [ 28 ] 1 | 2023 Fachbeiträge aus Theorie und Praxis kamp / Lissmann 2008; Shavelson et al. 2008). Unter informellen Diagnosen sind momentane und unsystematische subjektive Urteile gefasst. Als Stehgreif-Diagnosen dienen sie dem schnellen Handeln im Unterricht. Semiformelle Diagnosen beschreiben eine fokussierte und zielorientierte diagnostische Tätigkeit. Sie finden geplant statt, allerdings entsprechen sie nicht den Qualitätskriterien einer formellen Diagnose. Die formelle Diagnose beschreibt ein, zumeist testtheoretisch abgesichertes, wissenschaftliches Verfahren, das die Lehrperson einsetzt, um den Lern- und Leistungsstand gezielt zu erheben. Die Auswertung erfolgt systematisch und mit Abstand zur Diagnosesituation. Wissen aus Diagnosen Die Lehrperson baut in Abhängigkeit der genutzten Diagnoseform ein Wissen aus Diagnosen mit unterschiedlicher Qualität auf. Dies ist naheliegend, da sich die Diagnoseformen im Grad des Diagnoseaufwandes, der wissenschaftlichen Fundierung sowie des curricularen Bezuges unterscheiden. Das Wissen aus Diagnosen bezieht sich auf verschiedene Merkmale, die im Fokus der Diagnose liegen. Diagnostisches Urteil Diagnostische Urteile bestimmen unter anderem die weiteren Unterrichtshandlungen der Lehrperson. Sie sollten daher eine möglichst hohe Qualität aufweisen. Allerdings hat sich gezeigt, dass im Unterrichtsalltag nicht alle Urteilsprozesse unter höchsten Güteanforderungen ablaufen. In diesem Rahmen stellen sich Fragen zur Akkuratheit von Urteilen (Praetorius / Südkamp 2017; Schrader 1989). Die Akkuratheit ist ein Maß dafür, wie zutreffend bestimmte Merkmale von Schulkindern durch die Lehrperson eingeschätzt werden (Spinath 2005). Nach Schrader und Helmke (1987) äußert sich die Akkuratheit in den drei Komponenten Niveau, Differenzierung und Rangordnung. Die Komponenten lassen dann unterschiedliche Aussagen über die Akkuratheit der diagnostischen Urteile zu (siehe Berechnung der Urteilsakkuratheit). Adaptivität in der didaktischen Entscheidung Der Diagnoseprozess sollte nicht beim diagnostischen Urteil stehen bleiben. Die prozessbezogene Betrachtung (Abb. 1) betont, dass das Urteil allein von geringer didaktischer Relevanz ist. Erst die Adaptivität des Lehrens an das Urteil ermöglicht differenzierte Fördermaßnahmen (z. B. Auswahl der Inhalte und Lernaufgaben) (Ingenkamp / Lissmann 2008; Van Ophuysen / Lintorf 2014). Demnach vermittelt die diagnostische Kompetenz der Lehrperson wichtige Informationen zum Lern- und Leistungsstand der Schulkinder und unterstützt die Suche nach einer Lehrstrategie. Die dargelegte begriffliche Differenzierung legt nahe, dass unterschiedliche Prozesselemente als Indikatoren genutzt werden können, um auf das Konstrukt der diagnostischen Kompetenz zu schließen. In der Literatur wird dabei häufig auf das diagnostische Urteil Bezug genommen (z. B. Spinath 2005). Dies ist naheliegend, da die unmittelbare und bedingende Handlungsrelevanz des Urteils eine Schlüsselrolle im Diagnoseprozess darstellt. Zum diagnostischen Urteil von Lehrpersonen im Fach Sport liegen einige Untersuchungen vor, welche im Folgenden vorgestellt werden. Abbildung 1: Diagnostische Kompetenz als unterrichtlicher Diagnoseprozess (Niederkofler et al. 2018, 74) [ 29 ] Niederkofler • Urteilsakkuratheit von Grundschullehrpersonen 1 | 2023 [ 29 ] Niederkofler • Urteilsakkuratheit von Grundschullehrpersonen 1 | 2023 ten, dass Lehrpersonen im Kindergarten das Niveau der Kinder im Sich-Bewegen überschätzen und im Etwas-Bewegen unterschätzen. Auch auf Ebene der Testitems wird- - mit Ausnahme von Fangen- - das sportliche Können der Kinder überschätzt. Zudem zeigte sich, dass die Niveaukomponente im mittleren Zusammenhang mit der Klassengröße stand, wobei die Akkuratheit in größeren Klassen geringer ausfiel. Gleichzeitig stand die Anzahl der Sportlektionen in keinem Zusammenhang mit der Urteilsakkuratheit. Neben diesen Studien mit Blick auf den motorischen Leistungsstatus liegt eine Studie von Seyda (2018) vor, welche die diagnostische Kompetenz im Rahmen des Fähigkeitsselbstkonzepts der Schulkinder untersuchte. Dazu wurden 35 Lehrpersonen der Grundschule gebeten, eine Diagnose zur Selbsteinschätzung der Kinder (»Wie schätzt Ihr Schüler seine physischen Fähigkeiten ein? «) sowie über die physische Leistung der Schulkinder abzugeben (»Wie schätzen Sie die physischen Fähigkeiten Ihres Schülers ein? «). Zudem wurde die physische Fähigkeitsselbstwahrnehmung in Anlehnung an Deusinger (2004) erfasst (Beispielitem: »Ich kann schnell rennen«). Berechnet wurden die drei Urteilskomponenten nach Schrader und Helmke (1987). Die Ergebnisse deuteten mit einer Rangordnungskomponente von r =.50, einer Differenzierungskomponente von 1.68 und einer Niveaukomponente von -.35 auf eine geringe Akkuratheit hin. Auch zeigte sich, dass sich Fachlehrpersonen in ihrer Beurteilungsqualität nicht von fachfremden Lehrpersonen unterscheiden. Fragestellung Bisherige Erkenntnisse legen nahe, dass das diagnostische Urteil im Diagnoseprozess eine zentrale Rolle einnimmt. Weiter hat sich gezeigt, dass motorische (Basis-)Kompetenzen vom Kindergarten bis zur Sekundarstufe eine hohe curriculare Bedeutung besitzen (Niederkofler / Herrmann 2020; Ruin / Stibbe 2014). Entsprechend wurden bereits zwei Studien durchgeführt, welche das Urteil von Lehrpersonen in der Einschätzung von MB im Kindergarten und der Sekundar- Forschung zur diagnostischen Kompetenz von Lehrpersonen im Fach Sport Es liegen zwei Studien vor, welche sich Fragen zur Akkuratheit von diagnostischen Urteilen im Rahmen von MB stellen. Eine Studie von Niederkofler et al. (2018) untersuchte die Ausprägung der drei Urteilskomponenten Niveau, Differenzierung und Rang in der Einschätzung von MB nach Schrader (1989) bei 15 Lehrpersonen der 5. und 6. Schulstufe. Dazu schätzten diese die Leistungen der einzelnen Schulkinder im Laufen, Seilspringen, Balancieren, Rollen (Sich Bewegen) und im Werfen, Fangen, Prellen, Dribbeln (Etwas Bewegen) ein. Zudem wurden die Schulkinder in ihren MB (Herrmann / Seelig 2017a) getestet. Berechnet wurden die Urteilskomponenten nach Schrader (1989). Die Ergebnisse zeigten eine mittlere Urteilsakkuratheit in der Einschätzung der Rangordnung. Zudem offenbarte sich eine Unterschätzung der Merkmalsstreuung der Schulkinder (Differenzierung). Auch wurde eine Überschätzung des absoluten motorischen Niveaus (Niveau) festgestellt (Tab. 1). Die Studie konnte zudem Zusammenhänge zwischen der Akkuratheit der diagnostischen Urteile mit dem Schultyp und der Berufserfahrung der Lehrpersonen finden. Die unsystematischen Wechselwirkungen ließen allerdings keine eindeutige Aufklärungsaussage zu. Zudem liegt eine weitere Studie von Ferrari et al. (2022) vor. Die Arbeitsgruppe untersuchte das Urteil über MB von 25 respektive 46 Lehrpersonen im Kindergarten in zwei Erhebungsdurchgängen. Die Lehrpersonen wurden mittels Fragebogen befragt, wie sie den prozentualen Anteil der Kinder einschätzen, welche die Testanforderungen erfüllen. Zudem wurden die Kinder in ihren MB getestet (Herrmann et al. 2019). Berechnet wurde die Niveaukomponente nach Schrader (1989). Dazu wurde der Testwert der Schulkinder mit den Einschätzungen der Lehrpersonen auf eine einheitliche Skalierung gebracht und der prozentuale Anteil innerhalb der Klassen berechnet, welcher im jeweiligen Testitem die maximalen Punkte erreicht hat. Danach wurde der Wert von der Einschätzung der Lehrperson subtrahiert. Beide Erhebungen zeig- [ 30 ] 1 | 2023 Fachbeiträge aus Theorie und Praxis stufe untersucht haben. Dabei wurde auf einen etablierten methodischen Ansatz zurückgegriffen: das diagnostische Urteil wird als Korrelation (für die Rangkomponente), Subtraktion (für die Niveaukomponente) und als Quotienten der Streuung der Diagnose der Lehrperson mit den bei Schulkindern erhobenen Zielmerkmalen operationalisiert (Schrader / Helmke 1987). Die Studien zeigten, dass Lehrpersonen allgemein Schwierigkeiten haben, die MB akkurat zu beurteilen. Die Studienergebnisse offenbarten keine eindeutigen Wechselwirkungen zwischen der Urteilsakkuratheit und der Ausbildung, dem Schultyp oder der Berufserfahrung der Lehrpersonen. Allerdings offenbarte sich, dass das motorische Niveau in großen Klassen weniger akkurat eingeschätzt wurde. Insbesondere zeigte sich, dass das Urteil von Lehrpersonen der Grundschule in Bezug auf die MB der Schulkinder bisher unberücksichtigt blieb. Es stellt sich daher folgende Frage: Wie akkurat schätzen Lehrpersonen der Grundschule die motorischen Basiskompetenzen bei Schulkindern in Bezug auf das absolute Leistungsniveau, die Heterogenität der Leistungen und deren Rangordnung ein? Methode Studiendesign und Stichprobe Mitte des Schuljahres 2018 / 19 wurden N = 16 Lehrpersonen (M = 39,5 Jahre, SD = 12.4, 87 % weiblich) mittels Fragebogen gebeten, die motorischen Basiskompetenzen der Schulkinder in ihren Klassen einzuschätzen (N = 254 Schulkindern). Dabei besuchten n = 151 (M = 7,9 Jahre, SD = 0.8) Schulkinder die zweite und n = 103 (M = 9,6 Jahre, SD = 0.6) die vierte Schulstufe. Im Anschluss an die Fragebogenerhebung durchliefen alle Schulkinder den MOBAK-1-2respektive MOBAK-3-4-Test (siehe Beschreibung der Testinstrumente). Zuvor wurden Eltern, Lehrpersonen, Schulkinder sowie die zuständige Bildungsbehörde schriftlich und mündlich über den Zweck der Untersuchung informiert. Zudem wurde bei den Bildungsverantwortlichen eine Teilnahmeerlaubnis eingeholt. Fragebogen für Lehrpersonen Die Lehrpersonen sollten im Fragebogen das sportliche Können im Werfen, Fangen, Prellen und Dribbeln (Etwas-Bewegen) sowie im Balancieren, Rollen, Springen und Laufen (Sich-Bewegen) eines jeden Kindes in der Klasse einschätzen. Dabei galten die MOBAK-1-2 Testitems als Referenzpunkt der Einschätzung für Lehrpersonen der zweiten Klassenstufe. In gleicherweise waren es die MOBAK-3-4 Testitems für Lehrpersonen der vierten Klassenstufe (Beispielitem: »Wie schätzen Sie das sportliche Können von [BeispielschülerIn] ein? Er / Sie kann einen Ball sicher fangen.«). Die Items lagen in einer dreistufigen Likert-Skala (0 = überhaupt nicht; 1 = teils teils; 2 = ganz sicher) vor. Zusätzlich wurde das Antwortformat »weiß ich nicht« angeboten. Acht Lehrpersonen nutzten dieses Antwortformat. Das hat dazu geführt, dass von n = 67 Schulkindern keine Einschätzung der Lehrperson vorlag. Diese Schulkinder wurden von der Studie ausgeschlossen, was dann zur oben angegebenen Gesamtstichprobe führte. Zudem wurden soziodemografischen Daten der Lehrpersonen erfragt. Beschreibung der Testinstrumente Die MB wurden in der zweiten Schulstufe mit dem MOBAK-1-2 Test (Herrmann 2018; Herrmann / Gerlach / Seelig 2015) und in der vierten Schulstufe mit dem MOBAK-3-4 Test (Herrmann 2018; Herrmann / Seelig 2017b) getestet. Beide Tests bilden die Kompetenzen Etwas-Bewegen und Sich-Bewegen ab. Die Testitems Werfen, Fangen, Prellen und Dribbeln werden aufsummiert sowie durch vier dividiert und bilden so die Basiskompetenz Etwas-Bewegen ab. Die Testitems Laufen, Springen, Balancieren und Rollen werden in gleicher Weise berechnet und operationalisieren die Basiskompetenz Sich- Bewegen. Alle Testitems wurden in drei Stufen skaliert (0 = nicht bestanden; 1 = bestanden; 2 = voll bestanden). Eine detaillierte Beschreibung der Tests findet sich bei Herrmann (2018). Berechnung der Urteilsakkuratheit Zur Beantwortung der Fragestellung wurden drei Komponenten des diagnostischen Urteils nach [ 31 ] Niederkofler • Urteilsakkuratheit von Grundschullehrpersonen 1 | 2023 [ 31 ] Niederkofler • Urteilsakkuratheit von Grundschullehrpersonen 1 | 2023 formiert, zu einem Z-Wert aufsummiert, gemittelt (Bortz 2005, 219) und anschließend rücktransformiert. Die RK gilt als Maß dafür, wie akkurat Lehrpersonen die Ränge unter den Schulkindern in Bezug auf die MB wiedergeben. Die Werte können zwischen -1 und +1 variieren, wobei Werte näher +1 auf eine höhere Übereinstimmung hindeuten und damit ein akkurateres Urteil beschreiben. In diesem Zusammenhang wird von Praetorius et al. (2011) postuliert, dass Korrelationen von Variablen zum selben Merkmal grundsätzlich einen höheren Wert aufweisen sollten und eine akkurate Beurteilung erst dann vorliegt, sobald r xy >.55 ausfällt. Ergebnisse Tabelle 1 stellt die Ergebnisse zur Akkuratheit des diagnostischen Urteils von den teilnehmenden Lehrpersonen über das Sich-Bewegen und Etwas-Bewegen der Schulkinder dar. Zudem werden die Einzelitems und deren Akkuratheit angegeben. Die Ergebnisse für die RK zeigten eine mittlere Akkuratheit für das Sich-Bewegen und für das Etwas-Bewegen. Die einzelnen Testitems zeigten eine Urteilsakkuratheit der RK im mittleren bis schwachen Bereich, wobei Prellen, Rollen und Springen mit mittlerer Akkuratheit eingeschätzt wurden. Darüber hinaus zeigten die Berechnungen für die DK eine Unterschätzung für das Sich-Bewegen und eine beinahe akkurate Einschätzung für das Etwas-Bewegen. Die Betrachtung der Einzelitems belegte zur DK für das Werfen, Fangen, Prellen und Springen eine Unterschätzung der Leistungsheterogenität und für das Dribbeln sowie Balancieren eine Überschätzung. Das Rollen und Laufen wurde beinahe akkurat eingeschätzt. Die Berechnungen zur NK offenbarten eine Überschätzung für das Sich-Bewegen und für das Etwas-Bewegen. Die NK für die Einzelitems zeigte für das Werfen und Springen eine Überschätzung und für Fangen, Dribbeln, Balancieren, Rollen und Laufen eine leichte Unterschätzung. Das Prellen wurde im Mittel akkurat eingeschätzt. Schrader und Helmke (1987) mit den Programmen Microsoft Excel 2019 und IBM SPSS Statistics 27 für die MB Sich-Bewegen und Etwas-Bewegen sowie für die Einzelitems Werfen, Fangen, Prellen und Dribbeln, bzw. Balancieren, Rollen, Springen und Laufen berechnet. Zudem wurden der Differenzierungs- und Niveaufehler (Schrader / Helmke 1987) berechnet, um gerichtete Aussagen über die Ausprägung der Differenzierungsrespektive Niveaukomponente zu ermöglichen. Die Niveaukomponente (NK) wurde bestimmt, indem die getesteten Werte der Schulkinder (M x ) von der Lehrpersoneneinschätzung (M y ) subtrahiert wurden. Die NK gilt als Maß für die mittlere Tendenz zur Überbzw. Unterschätzung der SchülerInnenmerkmale. Bei akkurater Einschätzung nimmt die NK den Wert 0 an, Werte größer 0 weisen auf eine Tendenz zur Überschätzung der MB der Klasse hin, Werte kleiner 0 auf eine Unterschätzung. Als weiteres Maß wird der Niveaufehler als Betrag der NK angegeben. Die Differenzierungskomponente (DK) errechnet sich aus der Streuung der Lehrpersoneneinschätzung eines Merkmals (s y ) geteilt durch die Streuung der getesteten Werte bei Schulkindern (s x ) (Schrader / Helmke 1987). Die Streuung der Variablen wurde vorab mittels IBM SPSS Statistics 27 berechnet und anschließend wurden die Quotienten mittels Microsoft Excel 2019 bestimmt. Die DK bestimmt das Maß der mittleren Tendenz zur Überbzw. Unterschätzung der Streuung der MB. Bei akkurater Einschätzung nimmt die DK den Wert 1 an, ein Quotient größer 1 entspricht einer Überschätzung, ein Quotient kleiner 1 einer Unterschätzung der Streuung der MB. Als weiteres Maß wird der Differenzierungsfehler aus dem Betrag der Differenz der Streuung berechnet. Die Rangkomponente (RK) berechnet sich als die klassenweise bestimmte Rangkorrelation nach Spearman (r xy ) zwischen Lehrpersoneneinschätzung und der getesteten Ausprägung der MB bei Schulkindern. Um die Einzelkorrelationen pro Klasse zu einem Korrelationskoeffizienten zusammenzufassen, wurden die Korrelationen zuerst in Fischers Z-Werte trans- [ 32 ] 1 | 2023 Fachbeiträge aus Theorie und Praxis Diskussion In diesem Beitrag wurde die Frage gestellt, wie akkurat Lehrpersonen der Grundschule die MB der Schulkinder einschätzen. Dazu wurden drei Urteilskomponenten berechnet mit denen eine, nach Rang, Heterogenität und Niveau differenzierte Aussage über die Akkuratheit der Urteile im Rahmen der diagnostischen Kompetenz getätigt werden kann. Die Ergebnisse zeigten eine mittlere Urteilsakkuratheit für das Sich-Bewegen und Etwas-Bewegen in der RK. Das bedeutet, dass Lehrpersonen die Rangfolge der motorischen Leistungen zwischen den Schulkindern mit mittlerer Qualität einschätzen. Dies deckt sich mit den Ergebnissen von Niederkofler et al. (2018) zur Sekundarstufe sowie mit der von Seyda (2018) beschriebenen Einschätzungsqualität des physischen Fähigkeitsselbstkonzepts von Lehrpersonen der Grundschule. Darüber hinaus wurde die Merkmalsstreuung (DK) tendenziell unterschätzt. Das bestätigt vorerst die Erkenntnisse aus bisherigen Studien, in denen durchgängig eine Unterschätzung der Streuung von fachspezifischen Lern- und Leistungsmerkmalen beschrieben wurde (Niederkofler et al. 2018; Seyda 2018). Gleichzeitig zeigte sich eine beachtliche Akkuratheit in der Einschätzung der Heterogenität im Etwas-Bewegen. Dies legt nahe, dass den Lehrpersonen das Leistungsspektrum im Prellen, Dribbeln, Werfen und Fangen überaus bewusst ist. Woher diese Unterschiede kommen, ist bisher unklar. Da davon auszugehen ist, dass Lehrpersonen die Diagnosen auf Basis ihrer diagnostischen Ressourcen tätigen, ist dies möglicherweise mit dem Wissen und Können zur Diagnostik der Lehrperson zu erklären. Die Zusammenhänge zur Ausbildung oder zur Berufserfahrung sind bisher allerdings uneinheitlich (Niederkofler et al. 2018; Seyda 2018). Gleichzeitig müsste gefragt werden, ob nicht auch die Motivation der Schulkinder in der Testsituation oder gewisse Testmerkmale wie etwa die Länge des Tests zu diesen Unterschieden beigetragen haben. Nach Südkamp et al. (2012) könnten auch diese Aspekte die Akkuratheit des Urteils moderieren. An dieser Stelle benötigt es allerdings weitere Studien. Rangordnung (RK) Differenzierung (DK) D-Fehler Niveau (NK) N-Fehler Werfen .18 .73 -.20 .40 |.40| Fangen .24 .87 -.08 -.12 |.12| Prellen .39 .67 -.25 .00 |.00| Dribbeln .27 1.12 .07 -.33 |-.33| Balancieren .24 1.17 .07 -.15 |-.15| Rollen .39 1.02 .01 -.19 |-.19| Springen .45 .77 -.19 .29 |.29| Laufen .32 1.04 .02 -.10 |.10| Sich-Bewegen .49 .81 -.33 .15 |.15| Etwas-Bewegen .46 .99 -.01 .07 |.07| N 13-16 16 16 16 16 Tabelle 1: Mittlere Akkuratheit der diagnostischen Urteile von Lehrpersonen der Grundschule [ 33 ] Niederkofler • Urteilsakkuratheit von Grundschullehrpersonen 1 | 2023 [ 33 ] Niederkofler • Urteilsakkuratheit von Grundschullehrpersonen 1 | 2023 Auch belegen die Daten eine Überschätzung der absoluten motorischen Leistung (Niveau). Demnach schreiben Lehrpersonen den Schulkindern bessere motorische Leistungen zu, als diese in der Testsituation gezeigt haben. Dies trifft für Lehrpersonen der Sekundarstufe gleichermaßen zu (Niederkofler et al. 2018) wie auch für jene im Kindergarten (Ferrari et al. 2022). Ein möglicher Grund für die Überschätzung könnte der bei Ferrari et al. (2022) aufgefundene Zusammenhang zwischen der NK und der Klassengröße sein. Wird die Akkuratheit in der Einschätzung der Einzelitems betrachtet, so fällt in den Ergebnissen das Laufen und Werfen auf. Die Laufdiagnose fiel für alle Komponenten vergleichsweise akkurat aus, nicht aber die Diagnose zum Werfen. Hier zeigte sich eine schwache Akkuratheit für die RK, eine Unterschätzung der Heterogenität (mit vergleichsweise hohem Differenzierungsfehler) sowie eine Überschätzung des Wurfniveaus (mit vergleichsweise hohem Niveaufehler). Das könnte bedeuten, dass Lehrpersonen in der Laufdiagnostik weniger Schwierigkeiten haben als im Werfen. Dafür würde auch die bei Ferrari et al. (2022) beschriebene schwache Akkuratheit im Wurfurteil von Lehrpersonen im Kindergarten sprechen. Allerdings fiel dort auch das Laufurteil mit schwacher Akkuratheit aus und steht damit konträr zur Beobachtung im vorliegenden Beitrag. Dieser Unterschied in der Akkuratheit der Laufdiagnose könnte in den methodischen Zugängen begründet sein und über den unterschiedlichen Diagnosefokus sowie der damit einhergehenden Bezugsnorm erklärt werden. Während Lehrpersonen bei Ferrari et al. (2022) nach dem prozentualen Klassenanteil befragt wurden und somit einen klassenbezogenen Fokus einnahmen, wurde in diesem Beitrag nach Diagnosen über einzelne Schulkinder gefragt. Neben der sachlichen Bezugsnorm in der Diagnose von MB, könnten die Lehrpersonen bei Ferrari et al. (2022) durch den Fokus auf die gesamte Klasse zudem eine soziale Bezugsnorm eingenommen haben. Damit deuten sich Diagnoseschwierigkeiten in Abhängigkeit der Bewegungsformen an, die weiter untersucht werden müssten. Die Berechnung der Urteilskomponenten wurde in Anlehnung an Schrader und Helmke (1987) als Korrelation (RK), Subtraktion (NK) und als Quotienten der Streuung (DK) der Diagnose der Lehrperson und den bei Schulkindern erhobenen MB operationalisiert. Damit sind limitierende, methodische Aspekte (wie etwa Messfehler des Testinstruments) verbunden, welche hier nicht vertieft werden. Sie können bei Niederkofler et al. (2018) nachgelesen werden. Vor diesem Hintergrund könnte die Urteilsakkuratheit jedoch auch unterschätzt sein. Zusammenfassend können die Ergebnisse dahingehend interpretiert werden, dass Grundschullehrpersonen gewisse Schwierigkeiten haben, MB bei Schulkindern einzuschätzen. Entsprechend sollten sie ihre Diagnosen auch anzweifeln, sobald sie die Schulkinder im Aufbau von MB gezielt unterstützen möchten. Dabei kann es hilfreich sein, wissenschaftlich fundierte Diagnosetools hinzuzuziehen. Darüber hinaus regen die Befunde dazu an, Lehrpersonen im Aufbau einer diagnostischen Kompetenz zu unterstützen. Mit Blick auf MB sollten Fortbildungsangebote die Kompetenzbereiche Sich- Bewegen und Etwas-Bewegen differenziert thematisieren, indem sowohl wissensgenerierende (z. B. Wissen über Bewegungen, Anwendung der MOBAK-Testbatterien) als auch bedingende Prozesselemente der diagnostischen Kompetenz (z. B. Kopplung von Urteilen mit didaktischen Aspekten der Bewegungskorrektur und -vermittlung) vermittelt werden. Dieser Beitrag durchlief das Peer Review. Literatur Bortz, J. (2005): Statistik für Human- und Sozialwissenschaftler. Heidelberg, Springer Deusinger, I. M. (2004): Frankfurter-Kinder-Selbstkonzept-Inventar (FKSI). Göttingen, Hogrefe Ferrari, I., Kühnis, J., Bretz, K., Herrmann, C. (2022): Diagnostische Kompetenz der Lehrpersonen und deren Bedeutung für die Förderung motorischer Basiskompetenzen. In: Messmer, R., Krieger, C. (Hrsg.): Narrative zwischen Wissen und Können. Aktuelle Befunde aus Sportdidaktik und -pädagogik. Sankt Augustin, Academia, 175—194, https: / / doi.org/ 10.5771/ 9783985720118-175 Hascher, T. (2008): Diagnostische Kompetenzen im Lehrberuf. In: Kraler C., Schratz M. (Hrsg.): Wis- [ 34 ] 1 | 2023 Fachbeiträge aus Theorie und Praxis sen erwerben, Kompetenzen entwickeln. Modelle zur kompetenzorientierten Lehrerbildung. Münster, Waxmann, 71-86 Herrmann, C. (2018): MOBAK 1-4. Test zur Erfassung Motorischer Basiskompetenzen für die Klassen 1-4. Göttingen, Hogrefe Herrmann, C., Gerlach, E. (2014): Motorische Basiskompetenzen in der Grundschule: pädagogische Zielentscheidung und Aufgabenentwicklung. Sportunterricht, 63(11), 322-328 Herrmann, C., Gerlach, E., Seelig, H. (2015): Development and Validation of a Test Instrument for the Assessment of Basic Motor Competencies in Primary School. Measurement in Physical Education and Exercise Science, 19(2), 80-90, https: / / doi.org/ 10. 1080/ 1091367X.2014.998821 Herrmann, C., Seelig, H. (2017a): Basic motor competencies of fifth graders. Construct validity of the MOBAK-5 test instrument and determinants. German Journal of Exercise and Sport Research, 47 (2), 110-121, https: / / doi.org/ 10.1007/ s12662-016- 0430-3 Herrmann, C., Seelig, H. (2017b): Structure and Profiles of Basic Motor Competencies in the Third Grade-- Validation of the Test Instrument MOBAK-3. Perceptual and Motor Skills, 124(1), 5-20, https: / / doi.org/ 10.1177/ 0031512516679060 Hoge, R. D., Coladarci, T. (1989): Teacher-Based Judgments of Academic Achievement: A Review of Literature. Review of Educational Research, 59(3), 297- 313, https: / / doi.org/ 10.3102/ 00346543059003297 Ingenkamp, K., Lissmann, U. (2008): Lehrbuch der pädagogischen Diagnostik. Weinheim, Beltz Niederkofler, B., Herrmann, C. (2020): »Was kann meine Klasse? « Das MOBAK-Konzept und die MO- BAK-Instrumente zur Diagnose von motorischen Basiskompetenzen bei 4bis 12-jährigen Schulkindern. Bewegung & Sport, 2(2020), 35-42 Niederkofler, B., Herrmann, C., Amesberger, G. (2018): Diagnosekompetenz von Sportlehrkräften- - Semiformelle Diagnose von motorischen Basiskompetenzen Zeitschrift für sportpädagogische Forschung, 2018(2), 72-96, https: / / doi. org/ 10.5771/ 2196-5218-2018-2-72 Praetorius, A.-K., Karst, K., Dickhäuser, O., Lipowsky, F. (2011): Wie gut schätzen Lehrer die Fähigkeitsselbstkonzepte ihrer Schüler ein? Zur diagnostischen Kompetenz von Lehrkräften. Psychologie in Erziehung und Unterricht, 58(2), 81-91, https: / / doi.org/ 10.2378/ peu2011.art30d Praetorius, A.-K., Südkamp, A. (2017): Eine Einführung in das Thema der diagnostischen Kompetenz von Lehrkräften. In: Südkamp, A., Praetorius, A.-K. (Hrsg.): Diagnostische Kompetenz von Lehrkräften. Theoretische und methodische Weiterentwicklungen. Münster, Waxmann, 13-18 Ruin, S., Stibbe, G. (2014): Zum Bildungs- und Erziehungsverständnis in kompetenzorientierten Lehrplänen. Sportunterricht, 63(6), 168-173 Schrader, F.-W. (1989): Diagnostische Kompetenzen von Lehrern und ihre Bedeutung für die Gestaltung und Effektivität des Unterrichts. Frankfurt am Main, Lang Schrader, F.-W. (2013): Diagnostische Kompetenz von Lehrpersonen. Beiträge zur Lehrerbildung, 31(2), 154-165, https: / / doi.org/ 10.25656/ 01: 13843 Schrader, F.-W., Helmke, A. (1987): Diagnostische Kompetenz von Lehrern: Komponenten und Wirkung. Empirische Pädagogik, 1, 27-52 Seyda, M. (2018). Können Sportlehrkräfte die Perspektive ihrer Schülerinnen und Schüler einnehmen? Eine Untersuchung über die Akkuratheit von Beurteilungen physischer Fähigkeitsselbstwahrnehmungen. Unterrichtswissenschaft, 46, 215- 231, https: / / doi.org/ 10.1007/ s42010-017-0006-4 Shavelson, R. J., Young, D. B., Ayala, C. C., Brandon, P. R., Furtak, E. M., Ruiz-Primo, M. A., Tomita, M. K., Yin, Y. (2008): On the Impact of Curriculum-Embedded Formative Assessment on Learning: A Collaboration between Curriculum and Assessment Developers. Applied Measurement in Education, 21(4), 295-314, https: / / doi.org/ 10. 1080/ 08957340802347647 Spinath, B. (2005): Akkuratheit der Einschätzung von Schülermerkmalen durch Lehrer und das Konstrukt der diagnostischen Kompetenz. Zeitschrift für Pädagogische Psychologie, 19(1), 85-95, https: / / doi. org/ 10.1024/ 1010-0652.19.12.85 Südkamp, A., Kaiser, J., Möller, J. (2012): Accuracy of teachers’ judgments of students’ academic achievement: A meta-analysis. The Journal of educational psychology, 104(3), 743-762 Südkamp, A., Praetorius, A.-K. (Hrsg.) (2017): Diagnostische Kompetenz von Lehrkräften. Theoretische und methodische Weiterentwicklungen. Münster, Waxmann, https: / / doi.org/ 10.1037/ a0027627 Van Ophuysen, S., Lintorf, K. (2014): Unterschiede in der diagnostischen Praxis. Empirische Pädagogik, 28(3), 211-228 Der Autor Prof. Dr. Benjamin Niederkofler Leiter der deutschsprachigen Professur für Sportpädagogik und -didaktik an der Fakultät für Bildungswissenschaften der Freien Universität Bozen- Bolzano Anschrift Prof. Dr. Benjamin Niederkofler Freie Universität Bozen-Bolzano Fakultät für Bildungswissenschaften Regensburger Allee 16 I-39042 Brixen benjamin.niederkofler@unibz.it
