eJournals Psychologie in Erziehung und Unterricht 58/2

Psychologie in Erziehung und Unterricht
3
0342-183X
Ernst Reinhardt Verlag, GmbH & Co. KG München
41
2011
582

Wie gut schätzen Lehrer die Fähigkeitsselbstkonzepte ihrer Schüler ein? Zur diagnostischen Kompetenz von Lehrkräften

41
2011
Anna-Katharina Praetorius
Karina Karst
Oliver Dickhäuser
Frank Lipowsky
Die vorliegende Arbeit untersucht, inwiefern Lehrkräfte die bereichsspezifischen Fähigkeitsselbstkonzepte ihrer Schüler akkurat einschätzen können. Die diagnostische Kompetenz wurde dabei in Form der Niveau-, der Differenzierungs- und der Rangkomponente operationalisiert. Die Ergebnisse basieren auf den Daten von 37 Lehrkräften sowie 663 Grundschülern der ersten Jahrgangsstufe. Während Lehrkräfte das Niveau und die Streuung des Fähigkeitsselbstkonzepts in den drei untersuchten Bereichen Mathematik, Lesen und Schreiben durchschnittlich recht gut einschätzen können, fällt ihnen die Einschätzung der Rangfolge, insbesondere im Bereich Schreiben, schwerer. Es zeigen sich zudem lediglich geringe Zusammenhänge zwischen der diagnostischen Kompetenz in den untersuchten Fächern. Auch lässt sich kein Effekt der Berufserfahrung auf die diagnostische Kompetenz feststellen. Die Ergebnisse werden im Hinblick auf ihre Bedeutung für Theorie und Praxis diskutiert.
3_058_2011_002_0081
n Empirische Arbeit Psychologie in Erziehung und Unterricht, 2011, 58, 81 - 91 DOI 10.2378/ peu2010.art30d © Ernst Reinhardt Verlag München Basel Wie gut schätzen Lehrer die Fähigkeitsselbstkonzepte ihrer Schüler ein? Zur diagnostischen Kompetenz von Lehrkräften Anna-Katharina Praetorius 1 , Karina Karst 2, 4 , Oliver Dickhäuser 3 , Frank Lipowsky 4 1 Universität Koblenz-Landau 2 Deutsches Institut für Internationale Pädagogische Forschung, Frankfurt a. M. 3 Universität Mannheim 4 Universität Kassel How Teachers Rate Their Students: On Teachers’ Diagnostic Competence Regarding the Academic Self-Concept Summary: This article presents findings from a study examining to which extent teachers are able to accurately rate the domain-specific academic self-concept of their students. The diagnostic competence was operationalized in form of a level component, a differentiation component and a ranking component. The results are based on the data of 37 teachers and 663 students in grade primary one. The teachers were at average able to assess the level and also the variation of the self-concept in all three analysed subjects (mathematics, reading, writing) whereas it was much more difficult for them to assess the ranking of the self-concept, especially in the subject writing. In addition, there were low correlations of the diagnostic competence across the three subjects. There was no significant effect of professional experience on diagnostic competence. The results were discussed with a view on practical and theoretical implications. Keywords: Diagnostic competence, academic self-concept, subject-specific analysis, components of accuracy, judgment accuracy Zusammenfassung: Die vorliegende Arbeit untersucht, inwiefern Lehrkräfte die bereichsspezifischen Fähigkeitsselbstkonzepte ihrer Schüler akkurat einschätzen können. Die diagnostische Kompetenz wurde dabei in Form der Niveau-, der Differenzierungs- und der Rangkomponente operationalisiert. Die Ergebnisse basieren auf den Daten von 37 Lehrkräften sowie 663 Grundschülern der ersten Jahrgangsstufe. Während Lehrkräfte das Niveau und die Streuung des Fähigkeitsselbstkonzepts in den drei untersuchten Bereichen Mathematik, Lesen und Schreiben durchschnittlich recht gut einschätzen können, fällt ihnen die Einschätzung der Rangfolge, insbesondere im Bereich Schreiben, schwerer. Es zeigen sich zudem lediglich geringe Zusammenhänge zwischen der diagnostischen Kompetenz in den untersuchten Fächern. Auch lässt sich kein Effekt der Berufserfahrung auf die diagnostische Kompetenz feststellen. Die Ergebnisse werden im Hinblick auf ihre Bedeutung für Theorie und Praxis diskutiert. Schlüsselbegriffe: Diagnostische Kompetenz, Fähigkeitsselbstkonzept, fachspezifische Untersuchung, Akkuratheitskomponenten, Urteilsgenauigkeit Zielführender und effektiver Unterricht sollte das Ziel eines jeden Lehrers sein. Aktuellen Forschungsergebnissen zufolge muss ein solcher Unterricht eine hohe Passung von Lerngelegenheiten an die Lernvoraussetzungen von Schülern aufweisen (vgl. auch Weinert, Schrader & Helmke, 1990). Es lässt sich annehmen, dass eine wichtige Voraussetzung für eine solche Passung eine differenzierte und vergleichsweise genaue Einschätzung der Lernvoraussetzungen 82 Anna-Katharina Praetorius et al. von Schülern durch Lehrkräfte ist. Im Rahmen des vorliegenden Artikels wird erstens untersucht, inwiefern Grundschullehrer über die Fähigkeit verfügen, die Fähigkeitsselbstkonzepte ihrer Schüler - als eine der zentralen motivationalen Lernvoraussetzungen im schulischen Kontext - akkurat einzuschätzen. Zweitens wird der Frage nachgegangen, ob Lehrkräfte bezüglich des Fähigkeitsselbstkonzepts über eine fachübergreifende diagnostische Kompetenz verfügen. Drittens wird die Bedeutung der Berufserfahrung von Lehrkräften für die Qualität von diagnostischer Kompetenz untersucht. Bedeutung von diagnostischer Kompetenz bezüglich des Fähigkeitsselbstkonzepts Seit in einer Zusatzstudie von PISA den teilnehmenden Lehrern eine geringe leistungsbezogene diagnostische Kompetenz zugeschrieben wurde (Artelt, Stanat, Schneider & Schiefele, 2001; Kritik an der Studie s. Helmke, 2003), ist die Akkuratheit von Lehrereinschätzungen wieder vermehrt in der Diskussion. Die größere Aufmerksamkeit, die diesem Bereich mittlerweile zukommt, lässt sich unter anderem daran erkennen, dass die diagnostische Kompetenz von Lehrkräften explizit in die Standards für die Lehrerbildung (Kultusministerkonferenz, 2004) aufgenommen wurde. Im Fokus der öffentlichen und wissenschaftlichen Diskussion steht jedoch hauptsächlich die Qualität von auf Leistung bezogenen Diagnosen. Inwiefern Lehrkräfte motivationale Merkmale ihrer Schüler wie das Fähigkeitsselbstkonzept einschätzen können, wurde bislang kaum untersucht. Die Wichtigkeit von akkuraten Lehrereinschätzungen in diesem Bereich ergibt sich aus der Bedeutung des Fähigkeitsselbstkonzeptes für den schulischen Kontext. Hier denkt man zunächst an den vielzitierten und für den schulischen Kontext äußerst bedeutsamen Zusammenhang zwischen Fähigkeitsselbstkonzept und Leistung (z.B. Valentine, DuBois & Cooper, 2004). Aber auch für motivationale Merkmale (wie z. B. die Schulangst; Martschinke & Kammermeyer, 2006) spielt das Fähigkeitsselbstkonzept eine wichtige Rolle. Aufgrund möglicher negativer Auswirkungen von unrealistischen Fähigkeitsselbstkonzepten auf die genannten Bereiche ergibt sich bei solchen Ausprägungen die Notwendigkeit von Interventionen 1 . Voraussetzung für Interventionen sind - wie eingangs erwähnt - akkurate Einschätzungen des Fähigkeitsselbstkonzepts durch die Lehrkraft. Um festzustellen, ob das Selbstkonzept eines Schülers unrealistisch ausgeprägt ist, müssen Lehrkräfte - implizit oder explizit - zwei Diagnoseleistungen integrieren: Sie müssen zum einen die Höhe des Fähigkeitsselbstkonzepts vergleichsweise akkurat einschätzen und zum anderen entscheiden, ob es sich um ein realistisch oder unrealistisch ausgeprägtes Fähigkeitsselbstkonzept handelt 2 . Ob Lehrkräfte die Höhe des Fähigkeitsselbstkonzepts einschätzen können, ist Thema der vorliegenden Arbeit. Messung der diagnostischen Kompetenz In den fünfziger Jahren entwickelte Cronbach aufgrund seiner Kritik an der damaligen Berechnung der Genauigkeit von Urteilen über andere Personen ein komplexes Komponentenmodell. Dieses wurde von Schrader und Helmke (1987) für den schulischen Bereich adaptiert. Seitdem wird die diagnostische Kompetenz in der deutschsprachigen Literatur primär über drei Komponenten berechnet: Die Niveau-, die Differenzierungssowie die Rangkomponente. Die Niveaukomponente entspricht der Differenz zwischen dem mittleren Lehrerurteil und dem Mittelwert der Schülerwerte in einer Schulklasse. Eine ideale Einschätzung weist somit den Wert Null auf. Werte jenseits dieses Optimums zeigen an, inwiefern Lehrkräfte dazu tendieren, das durchschnittliche Niveau der Fähigkeitsselbstkonzepte innerhalb einer Klasse im Vergleich zur tatsächlichen Ausprägung zu über- (Werte größer Null) respektive zu unterschätzen (Werte kleiner Null). Fähigkeitsselbstkonzepte der Schüler 83 In der Differenzierungskomponente spiegelt sich die Tendenz zur Über- oder Unterschätzung der Streuung eines Merkmals im Vergleich zur tatsächlichen Streuung. Sie wird durch den Quotienten der Streuung der Lehrereinschätzung und der tatsächlichen Streuung berechnet. Der Wert einer optimalen Einschätzung liegt hier bei Eins, Werte größer Eins stellen eine Überschätzung, Werte kleiner Eins eine Unterschätzung der Streuung dar. Die Rangkomponente schließlich bildet ab, inwiefern ein Lehrer in der Lage ist, die Position von Schülern in der Klasse bezüglich eines bestimmten Merkmals einzuschätzen. Diese Komponente ist laut Schrader und Helmke (1987, S. 35) „Indikator für die diagnostische Kompetenz im eigentlichen Sinne“. Sie errechnet sich durch die Produkt-Moment-Korrelation zwischen Kriterium und Urteil. Eine Korrelation von r = 1.00 zeigt, dass der Lehrer die Schülerrangfolge des Merkmals perfekt einschätzt. Güte von Lehrerurteilen Es gibt bislang nur wenige Untersuchungen zur diagnostischen Kompetenz von Lehrern hinsichtlich des Schülerfähigkeitsselbstkonzepts. In den meisten dieser Studien wird dabei lediglich die Rangkomponente berücksichtigt, die kontinuierlich eine moderate Ausprägung im Bereich zwischen .30 < r < .60 aufweist (z. B. Kammermeyer, 1998; Marsh, 1990). Die Erfassung der diagnostischen Kompetenz ausschließlich über eine Komponente ist jedoch äußerst problematisch, da systematische Urteilstendenzen außer Acht gelassen werden: So kann ein Lehrer als kompetenter Diagnostiker gelten, wenn er zwar die Rangfolge eines Merkmals einschätzen kann, dessen Niveau und/ oder Streuung jedoch stark überbeziehungsweise unterschätzt. Eine Studie mit Grundschullehrkräften von Spinath (2005) stellt bezüglich der Berechnungsweise eine Ausnahme dar. Hier wird die diagnostische Kompetenz mittels der drei Komponenten nach Schrader und Helmke (1987) operationalisiert. Spinath konnte in ihrer Untersuchung zeigen, dass Lehrkräfte die Rangfolge des allgemeinen Fähigkeitsselbstkonzepts mit r = .39 moderat einschätzen können, während sie dazu tendieren, das Niveau des Fähigkeitsselbstkonzepts ihrer Schüler zu unterschätzen und die Streuung desselben zu überschätzen. Wir erwarten, dass sich diese Ergebnisse (moderate Ausprägung der Rangkomponente, Tendenz zur Unterschätzung des Niveaus und zur Überschätzung der Streuung) auch in unserer Stichprobe finden lassen. Bereichsspezifische Ausprägung der diagnostischen Kompetenz Ein Manko bisheriger Untersuchungen ist, dass die Einschätzung des Fähigkeitsselbstkonzepts durch Lehrkräfte unseres Wissens nach ausschließlich schulfachunspezifisch erfolgte. Leistungshandeln in der Schule findet jedoch mehrheitlich fachgebunden statt. Die fachspezifischen Fähigkeitsselbstkonzepte sind dabei nicht ausschließlich auf das allgemeine Fähigkeitsselbstkonzept zurückführbar (Marsh & Shavelson, 1985). Eine fachspezifische Einschätzung des Fähigkeitsselbstkonzepts sollte für Lehrkräfte damit sowohl einfacher als auch praktisch bedeutsamer sein. Ausgehend von einer fachspezifischen Erfassung lässt sich zudem überprüfen, ob Lehrkräfte über eine globale diagnostische Kompetenz verfügen: Sind die Urteile der einzelnen Lehrer über die verschiedenen Domänen hinweg hoch miteinander korreliert, ist eher von einer globalen diagnostischen Kompetenz auszugehen, fallen die Zusammenhänge gering aus, ist eher von mehreren unabhängigen Facetten diagnostischer Kompetenz(en) auszugehen. In Anlehnung an Arbeiten zur diagnostischen Kompetenz in anderen Bereichen, nach denen die Güte diagnostischer Urteile über verschiedene Unterrichtsfächer und über verschiedene Aufgaben- und Personenmerkmale (z. B. Hopkins, George & Williams, 1985; Spinath, 2005) eher gering miteinander zusammenhängt, gehen wir davon aus, dass sich in unserer Stichprobe nur geringe Zusammenhänge zwischen der Güte der Beurteilung der Selbstkonzepte durch die 84 Anna-Katharina Praetorius et al. Lehrer über Fächer hinweg (verbales Selbstkonzept und mathematisches Selbstkonzept) zeigen. Diagnostische Kompetenz und Berufserfahrung Bisherige Untersuchungen zur diagnostischen Kompetenz von Lehrkräften verweisen auf deutliche interindividuelle Unterschiede (für den leistungsbezogenen Bereich z. B. Schrader & Helmke, 1987; für den Bereich motivationaler Schülermerkmale z. B. Spinath, 2005). Durch das in Beziehung Setzen von diagnostischer Kompetenz mit anderen Merkmalen (v. a. Kontext-, Personen-, Unterrichtsmerkmalen) wird versucht, diese Unterschiede zu erklären. Eines dieser Personenmerkmale ist die Berufserfahrung der Lehrkräfte. Bezüglich des Zusammenhangs zwischen diagnostischer Kompetenz und Berufserfahrung finden sich differierende Befunde. Während Untersuchungen auf einen nicht vorhandenen Zusammenhang zwischen diagnostischer Kompetenz und Berufserfahrung (Wild & Rost, 1995, für den Bereich der kognitiven Schülerfähigkeiten; Schrader, 1989, für den Bereich der Leistung) oder gar auf einen negativen Zusammenhang (Helmke & Fend, 1981, für die Bereiche Selbstvertrauen, Schulfreude und Konzentrationsfähigkeit) hinweisen, kann man aufgrund theoretischer Annahmen eine positive Beziehung erwarten: Expertentum wird nach dem Experten-Novizen-Paradigma durch langjährige Erfahrung erworben (vgl. Reimann & Rapp, 2008), weshalb Expertentum in Studien häufig über die Berufserfahrung operationalisiert wird (z. B. van Ophuysen, 2006). Da die Lehrertätigkeit deutliche diagnostische Anteile, in etwa bezüglich der Notengebung, beinhaltet, sollten Lehrkräfte mit zunehmender Berufserfahrung auch über eine höhere diagnostische Kompetenz verfügen. Diesem existierenden Widerspruch wollen wir in der vorliegenden Arbeit noch einmal mit der Forschungsfrage nachgehen, ob berufserfahrene Lehrkräfte bezüglich des Fähigkeitsselbstkonzepts über eine höhere diagnostische Kompetenz verfügen als Novizen. Fragestellungen und Hypothesen im Überblick Fragestellung 1: Wie gut können Lehrkräfte im Mittel die Fähigkeitsselbstkonzepte ihrer Schüler bezüglich der Rangfolge, des Niveaus und der Streuung einschätzen? Hypothese 1: Die durchschnittliche diagnostische Kompetenz von Lehrkräften ist moderat ausgeprägt (Rangkomponente) mit einer Tendenz zur Unterschätzung des Niveaus (Niveaukomponente) und einer Tendenz zur Überschätzung der Streuung (Differenzierungskomponente). Fragestellung 2: Existiert eine globale diagnostische Kompetenz von Lehrern? Hypothese 2: Die Akkuratheit der Einschätzung des verbalen und diejenige des mathematischen Fähigkeitsselbstkonzepts weisen nur geringe Zusammenhänge auf. Fragestellung 3: Hängen interindividuelle Unterschiede in der diagnostischen Kompetenz mit der Berufserfahrung zusammen? Aufgrund des widersprüchlichen Forschungsstandes wurde hier keine Hypothese formuliert. Methode Stichprobe Die Stichprobe der vorliegenden Arbeit basiert auf im Rahmen der Studie PERLE „Persönlichkeits- und Lernentwicklung von Grundschulkindern“ erhobenen Daten (vgl. Greb, Faust & Lipowsky, 2007). An der Studie nahmen insgesamt 37 Lehrkräfte 3 (36 weiblich, 1 männlich) aus 20 Schulen der Bundesländer Sachsen, Thüringen, Berlin und Mecklenburg- Vorpommern teil. An der Selbstkonzeptbefragung nahmen 702 Kinder teil. Für 663 der Erstklässler (322 Mädchen, 332 Jungen, 9 ohne Angabe) liegen Antworten für alle Selbstkonzeptitems sowie die dazugehörigen Lehrerangaben vor, sodass diese in die weiteren Analysen einbezogen wurden. Das Alter der Schüler liegt zwischen 5; 7 und 9; 7 Jahren (M = 7; 5 Jahre). Bei den Lehrkräften wurde mit 66 % am häufigsten der Altersbereich „zwischen 35 und 45 Jahren“ angegeben. Die Berufserfahrung variierte zwischen Fähigkeitsselbstkonzepte der Schüler 85 1 und 35 Jahren (SD = 10.9) und lag im Mittel bei 16 Jahren. Die Klassenstärke betrug im Mittel 19 Schüler (SD = 3.58; min. = 13 4 ; max. = 26). Material und Durchführung Das Fähigkeitsselbstkonzept der Schüler wurde am Ende des ersten Schuljahres (Juni 2007) klassenweise von 2 - 4 geschulten Befragungsleitern innerhalb einer Schulstunde erhoben. Die Lehrer waren bei der Erhebung nicht im Klassenraum anwesend. Die Schüler bearbeiteten einen im Rahmen des PERLE-Projekts entwickelten Fragebogen mit 24 Items, die sich neben zwei Beispielitems auf die vier Selbstkonzeptfacetten Mathematik (6 Items), Schreiben (4 Items), Lesen (4 Items) 5 sowie die im Rahmen dieser Arbeit nicht beschriebene Facette kreative Tätigkeiten (8 Items) bezogen. Die Facetten Lesen und Schreiben wurden als Indikatoren für das verbale Fähigkeitsselbstkonzept erfasst. Diese Unterteilung wurde vorgenommen, da die Fähigkeiten im Lesen sowie im Schreiben in der ersten Klasse oft noch unterschiedlich hoch ausgeprägt sind und/ oder wahrgenommen werden (vgl. Poloczek, 2007). Alle Items haben ein dreistufiges Antwortformat (Beispielitem Mathematik: „Fällt dir das Rechnen leicht oder schwer? “ mit den Antwortstufen „schwer“ (1), „weder leicht noch schwer“ (2), „leicht“ (3); Beispielitem Lesen: „Wie gut kannst du vorlesen? “ mit den Antwortformaten „nicht so gut“ (1), „gut“ (2), „sehr gut“ (3); Beispielitem Schreiben: „Wie viele Fehler machst du beim Schreiben? “ mit den Antwortstufen „viele Fehler“ (1), „ein paar“ (2), „fast keine“ (3)) 6 . Die internen Konsistenzen (Cronbachs a ) waren in allen drei Bereichen zufriedenstellend bis gut (Mathematik: a = .83, Lesen: a = .84, Schreiben: a = .75). Die durchschnittliche Höhe des Fähigkeitsselbstkonzepts lag im Bereich Mathematik bei M = 2.39 (SD = .43), im Bereich Lesen bei M = 2.54 (SD = .46) und im Bereich Schreiben bei M = 2.41 (SD = .44). Der Zusammenhang zwischen den Skalen Mathematik und Lesen beträgt r = .37 (p < .001), zwischen den Skalen Mathematik und Schreiben r = .39 (p < .001) und zwischen den Skalen Lesen und Schreiben r = .51 (p < .001). Den Lehrkräften wurde für das Fach Deutsch und Mathematik jeweils ein Fragebogen vorgelegt; die Bearbeitungsdauer betrug 45 Minuten pro Bogen. Die Lehrer füllten den Bogen für das Fach Mathematik am Tag der Selbstkonzepterhebung und den Bogen für das Fach Deutsch am vorhergehenden Tag aus. Die Fragebögen umfassten neben der Einschätzung des Fähigkeitsselbstkonzepts der von ihnen unterrichteten Schüler in den Bereichen Lesen, Schreiben und Rechnen auch die leistungsbezogene Einschätzung der Schüler. Als Hilfe zur Einschätzung der Fähigkeitsselbstkonzepte der Schüler wurden den Lehrkräften die von den Schülern zu bearbeitenden Selbstkonzeptitems vorgelegt. Überdies wurde erklärt, dass das von den Lehrkräften einzuschätzende Fähigkeitsselbstkonzept der Schüler anhand einer Mittelwertbildung der Schüleritems in dem jeweiligen Bereich berechnet wird. Die Lehrkräfte konnten bei der Einschätzung ihrer Schüler zwischen sechs Ausprägungen auswählen („Sehr gering“ (-3), „gering“ (-2), „eher gering“ (-1), „eher hoch“ (+1), „hoch“ (+2) und „sehr hoch“ (+3)). Um Schüler- und Lehrerwerte auf ein einheitliches Antwortformat zu bringen, war eine Umkodierung notwendig. Dazu wurden die Extremwerte der Lehrereinschätzungen an diejenigen der Schülermittelwerte angepasst: Das mögliche Minimum der Lehrereinschätzung (-3) wurde zum Minimum des Schülermittelwertes (1) transformiert, das mögliche Maximum der Lehrerwerte (3) wurde aufgrund des entsprechenden Maximums der Schülermittelwerte (3) beibehalten. Die restlichen Werte der Lehrereinschätzungen wurden äquidistant zwischen die transformierten Extrempunkte gesetzt (der ursprüngliche Lehrerwert -2 wurde zum Wert 1.4 transformiert, der Wert -1 zu 1.8, der Wert 1 zu 2.2 und der Wert 2 zu 2.6). Die Mittelwerte der transformierten Lehrereinschätzungen lagen für Mathematik bei M = 2.23 (SD = .48), für Lesen bei M = 2.32 (SD = .51) und für Schreiben bei M = 2.26 (SD = .47). Der Zusammenhang zwischen den Skalen Mathematik und Lesen beträgt r = .52 (p < .001), zwischen den Skalen Mathematik und Schreiben r = .44 (p < .001) und zwischen den Skalen Lesen und Schreiben r = .72 (p < .001). Ergebnisse Wie sind die Komponenten der diagnostischen Kompetenz ausgeprägt? Die Verteilungskennwerte der drei über alle Lehrer gemittelten Komponenten (Rangkomponente 7 , Niveaukomponente und Differenzierungskomponente) sind jeweils getrennt für die Bereiche Mathematik, Lesen und Schreiben Tabelle 1 zu entnehmen. Um die Spannweite der Lehrereinschätzungen aufzuzeigen, sind zudem die Prozentränge angegeben. 86 Anna-Katharina Praetorius et al. Im Bereich Schreiben findet sich für die Rangkomponente ein numerisch geringerer Wert als in den Bereichen Mathematik und Lesen. Dieser Unterschied ist jedoch lediglich auf dem 10-Prozent-Niveau signifikant (p = .10 für Schreiben vs. Lesen; p = .08 für Schreiben vs. Mathe). Dies resultiert vermutlich aus der geringen Stichprobengröße von 37 Lehrkräften. Alle drei Mittelwerte der Niveaukomponente fallen negativ aus (vgl. Tab. 1) und sind signifikant vom Idealwert Null verschieden 8 (Mathematik t(35) = -5.83; Lesen t(35) = -.5.45; Schreiben t(34) = -3.61). Die Lehrkräfte unterschätzen demnach im Mittel in allen drei Bereichen die Höhe der Fähigkeitsselbstkonzepte ihrer Schüler. Bezüglich der Differenzierungskomponente weichen die Lehrerurteile in keinem der drei Bereiche signifikant vom Idealwert Eins 9 ab (Mathematik t(35) = 0.59; Lesen t(35) = 0.12; Schreiben t(34) = 0.03; s. auch Tab. 1). Die Streuung der Fähigkeitsselbstkonzepte wird also im Mittel von den Lehrkräften in allen drei Bereichen adäquat eingeschätzt. Existiert eine globale diagnostische Kompetenz von Lehrern? Zur Überprüfung dieser Fragestellung wurde zunächst für jeden Lehrer (N = 36 bzw. 37) jeweils ein Rangkomponentenwert in den Bereichen Mathematik, Lesen und Schreiben berechnet. Anschließend wurden die Interkorrelationen zwischen diesen Bereichen ermittelt. Die Ergebnisse sind Tabelle 2 zu entnehmen. Nur die beiden Rangkomponenten Lesen und Schreiben, die sich auf die Einschätzung M SD Prozentränge 0 25 50 75 100 Rangkomponente Mathematik .55** .21 .00 .41 .59 .70 .89 Lesen .52** .22 -.03 .36 .56 .68 .85 Schreiben a .25** .25 -.23 .04 .27 .40 .72 Niveaukomponente Mathematik -0.16 0.17 -0.50 -0.26 -0.16 -0.06 0.20 Lesen -0.22 0.25 -0.67 -0.43 -0.22 0.02 0.19 Schreiben a -0.15 0.25 -0.69 -0.32 -0.18 -0.02 0.43 Differenzierungskomponente Mathematik 1.15 0.32 0.53 0.95 1.13 1.38 1.98 Lesen 1.07 0.32 0.46 0.82 1.07 1.32 1.75 Schreiben a 1.04 0.36 0.49 0.82 1.06 1.21 2.58 Tabelle 1: Verteilungskennwerte der drei Akkuratheitskomponenten getrennt für die Bereiche Mathematik, Lesen und Schreiben Anmerkung: Die Daten beziehen sich auf N = 37 bzw. 36 a Lehrer. ** p < .01 Schreiben Lesen Rangkomponente Lesen .38* Mathematik .04 n.s. .14 n.s. Niveaukomponente Lesen .80** Mathematik .06 n.s. .25 n.s. Differenzierungskomponente Lesen .73** Mathematik .10 n.s. .09 n.s. Tabelle 2: Interkorrelationen zwischen den Komponenten der Bereiche Lesen, Schreiben und Mathematik (N = 35) ** p < .01; * p < .05; n.s. = nicht signifikant Fähigkeitsselbstkonzepte der Schüler 87 des verbalen Fähigkeitsselbstkonzepts beziehen, weisen einen signifikant positiven Zusammenhang auf, während für die anderen Kombinationen die Zusammenhänge statistisch nicht signifikant sind. Das gleiche Bild ergibt sich für die Interkorrelationen der Niveau- und Differenzierungskomponente (s. Tab. 2). Hängen interindividuelle Unterschiede in der diagnostischen Kompetenz mit der Berufserfahrung zusammen? Um zu untersuchen, ob sich Novizen und berufserfahrene Lehrer hinsichtlich ihrer diagnostischen Kompetenz unterscheiden, wurde getrennt für die Bereiche Mathematik, Schreiben und Lesen die diagnostische Kompetenz in Form der Rangkomponente mit der Berufserfahrung in Jahren korreliert. Es ergeben sich geringe Zusammenhänge in den drei Bereichen (Mathematik r = -.13, Lesen r = -.15, Schreiben r = .25), die jedoch keine einheitliche Richtung aufweisen und zudem in keinem der Bereiche statistisch signifikant sind. Auch Korrelationen zwischen Berufserfahrung und Niveausowie Differenzierungskomponente sind statistisch nicht signifikant. Diskussion Inhalt der vorliegenden Arbeit ist die diagnostische Kompetenz von Lehrkräften hinsichtlich des Fähigkeitsselbstkonzepts. Dem Fähigkeitsselbstkonzept kommt im schulischen Kontext eine zentrale Rolle bezüglich Lernverhalten und Leistungserfolg von Schülern zu (Eckert, Schilling & Stiensmeier-Pelster, 2006; Helmke, 1992). Es ist zu erwarten, dass bei stark unrealistischen Ausprägungen von Fähigkeitsselbstkonzepten akkurate Lehrereinschätzungen desselben für adaptives Unterrichten und Interventionen notwendig sind 10 . Dass Lehrkräfte über die Fähigkeit verfügen, über verschiedene Lernbereiche hinweg solche verhältnismäßig akkuraten Einschätzungen vorzunehmen, muss jedoch aus empirischer Sicht angezweifelt werden. Rangkomponente: Interpretation der Kennwerte Die Daten der vorliegenden Arbeit weisen in allen drei Bereichen eine numerisch moderate (vgl. Cohen, 1992) Übereinstimmung zwischen der Rangfolge der Lehrereinschätzungen und derjenigen der Fähigkeitsselbstkonzepte der Schüler auf. Insbesondere Spinath (2005) weist auf die Problematik hin, dass es keinerlei Richtlinien zur Bewertung dieser statistischen Kennzahlen der diagnostischen Kompetenz gibt. Sie schlägt aus diesem Grund vor, die statistischen Kennzahlen nicht anhand ihrer numerischen Größe, sondern aufgrund inhaltlicher Überlegungen zu bewerten. Aufgrund einer solchen Interpretation sind die vorliegenden Korrelationen mit .25 ≤ r ≤ .55 als eher niedrig ausgeprägt zu bezeichnen. Denn die Interpretation einer Korrelation als hoch, mittel oder niedrig hängt vom inhaltlichen Zusammenhang der korrelierten Variablen ab. So erscheint es sinnvoll, bei einer Korrelation zweier inhaltlich voneinander verschiedener Merkmale - wie beispielsweise Intelligenz und Schulleistung - Zusammenhänge zwischen .30 < r < .50 in Anlehnung an Cohen (1992) als mittel zu interpretieren. Handelt es sich jedoch wie im vorliegenden Fall bei den beiden zu korrelierenden Variablen um Faktoren, die dasselbe Merkmal betreffen, sollte eine als mittel einzuschätzende Korrelation im Sinne konvergenter Validität höhere Werte aufweisen (Schermelleh- Engel & Schweizer, 2007). Rangkomponente: Bereichsspezifische Betrachtung Die Befunde deuten numerisch darauf hin, dass es Lehrkräften im Bereich Schreiben schwerer fällt, die Fähigkeitsselbstkonzepte ihrer Schüler akkurat einzuschätzen als in den beiden anderen Bereichen - allerdings waren die Unterschiede nur auf dem 10-Prozent-Niveau signifikant. Möglicherweise haben Lehrkräfte Schwierigkeiten mit der Einschätzung von Fähigkeitsselbstkonzepten im Bereich Schreiben, 88 Anna-Katharina Praetorius et al. da sich die Fähigkeitsselbstkonzepte in diesem Bereich - im Gegensatz zu den Bereichen Lesen und Mathematik (vgl. hierzu Dickhäuser & Galfe, 2004) - nicht primär aufgrund sozialer Vergleiche bilden. Diese Vermutung begründet sich darin, dass beim Schreiben weniger öffentliche Rückmeldungen und damit Möglichkeit zu sozialen Vergleichen vorhanden sind. Eine empirische Überprüfung dieser Vermutung steht noch aus. Diagnostische Kompetenz: Niveau- und Differenzierungskomponente In den drei Bereichen Mathematik, Lesen und Schreiben fand sich durchgängig eine Unterschätzung des Niveaus der Fähigkeitsselbstkonzepte durch die Lehrkräfte. Betrachtet man den möglichen Extremwert der Unterschätzungen (-2) sowie die Tatsache, dass sich Schüler- und Lehrerskala nicht zu hundert Prozent entsprechen, erscheinen die vorliegenden Unterschätzungen (zwischen -0.15 und -0.22) jedoch nicht sonderlich bedeutsam. Lehrkräfte schätzen demnach das Niveau des Fähigkeitsselbstkonzepts im Mittel recht gut ein. Dieses Ergebnis könnte u. a. dadurch erklärt werden, dass die meisten der untersuchten Lehrkräfte sich über die vielfach belegte Tatsache einer im Durchschnitt stark überhöhten Selbsteinschätzung von Kindern zu Schulbeginn (z. B. Helmke, 1998) im Klaren sind. Die Heterogenität der Fähigkeitsselbstkonzepte wurde von den Lehrkräften in allen drei untersuchten Bereichen im Mittel adäquat eingeschätzt. Verglichen mit bereichsunspezifischen Einschätzungen des Fähigkeitsselbstkonzepts (s. Spinath, 2005) scheint es Lehrkräften bei der Einschätzung bereichsspezifischer Fähigkeitsselbstkonzepte besser zu gelingen, die Streuung zutreffend einzuschätzen. Einschränkungen bezüglich der Interpretation der Komponenten Bei der Interpretation der Niveausowie der Differenzierungskomponente muss berücksichtigt werden, dass die Einheitlichkeit der Metrik von Lehrerurteilen und Fähigkeitsselbstkonzepten nicht ursprünglich vorlag, sondern durch Transformation hergestellt wurde. Die Befunde sind daher nicht eindeutig belastbar. Die beiden Komponenten wurden trotzdem berichtet, da bei alleiniger Betrachtung der relativen Übereinstimmung (Rangkomponente) eine Tendenz zur Überschätzung der Qualität diagnostischer Einschätzungen zu verzeichnen ist (z. B. Begeny, Eckert, Montarello & Storie, 2008). Bezüglich der Interpretation der Rangkomponente im Bereich Lesen ergibt sich ebenfalls eine Einschränkung: Im Rahmen der Skalenbildung wurde ein Item der Schülerskala Lesen eliminiert, da dies zu einer Erhöhung der Reliabilität führte. Da dieses Item den Lehrkräften zur Einschätzung der Schülerfähigkeitsselbstkonzepte im Bereich Lesen jedoch vorlag, beurteilten die Lehrkräfte somit zumindest partiell etwas anderes. Diagnostische Kompetenz und Berufserfahrung Innerhalb der vorliegenden Arbeit konnte kein Zusammenhang zwischen Berufserfahrung und diagnostischer Kompetenz festgestellt werden. Dieses Ergebnis reiht sich ein in die Befunde von Wild und Rost (1995) sowie Schrader(1989), die ebenfalls keinen Zusammenhang finden konnten. Der vorliegende Befund steht somit den Annahmen des Experten-Novizen-Paradigmas entgegen, nach dem Lehrkräfte mit längerer Berufserfahrung zu zutreffenderen Urteilen gelangen sollten. Erklärt werden kann dies mit einer Studie von Bromme (1987): Experten erinnern sich vor allem an Unterrichtsepisoden, weniger jedoch an individuelle Lernprozesse. Da Fähigkeitsselbstkonzepte von Schülern anhand individueller Lernprozesse ersichtlich sind, können Experten diese dann unter Umständen nicht akkurater einschätzen als Novizen. Fähigkeitsselbstkonzepte der Schüler 89 Domänenspezifität der diagnostischen Kompetenz Vergleicht man die Ausprägung der Komponenten der vorliegenden Studie mit denen von Spinath (2005), fällt auf, dass die Lehrkräfte in der vorliegenden Stichprobe besser diagnostizieren. Ein möglicher Grund hierfür ist, dass es Lehrkräften - wie eingangs vermutet - tatsächlich einfacher fällt, fachspezifische Fähigkeitsselbstkonzepte einzuschätzen als fachunspezifische. Es zeigt sich zudem, dass kein signifikanter Zusammenhang zwischen der Akkuratheit der Einschätzung des verbalen und der Einschätzung des mathematischen Fähigkeitsselbstkonzepts existiert. Dieses Ergebnis steht in Einklang mit Ergebnissen aus anderen Studien zur diagnostischen Kompetenz, so zum Beispiel bezüglich der Einschätzung von motivationalen Schülermerkmalen (Spinath, 2005). Eine fachunspezifische Erfassung der diagnostischen Kompetenz, wie sie bisher üblich war, sollte somit in zukünftigen Studien durch eine fachspezifische Erfassung ergänzt werden. Die vorliegenden Befunde unterstreichen die u. a. von Spinath (2005) angesprochene Fragwürdigkeit einer globalen diagnostischen Kompetenz und stehen in Einklang mit der aktuellen Tendenz in der Bildungsforschung zu vermehrt domänenspezifischen Untersuchungen von Instruktionsprozessen (z. B. Brophy, 2001). Offene Fragen und Ausblick Bezüglich der Ergebnisse der Untersuchung fällt die starke Streuung der drei untersuchten Maße auf. Neben der Frage, wie gut Lehrkräfte im Mittel Fähigkeitsselbstkonzepte einschätzen, stellt sich somit weiterhin die Frage, durch welche Faktoren die interindividuellen Unterschiede zwischen den Lehrkräften bedingt sind. Dem sollte in zukünftigen Untersuchungen nachgegangen werden. Auffällig ist zudem, dass die Interkorrelationen der Lehrereinschätzungen der Fähigkeitsselbstkonzepte in den drei untersuchten Bereichen Mathematik, Lesen und Schreiben deutlich höher ausfallen als diejenigen der Fähigkeitsselbstkonzepte. Dieses Ergebnis weist darauf hin, dass Lehrkräfte möglicherweise die Tendenz haben, diese drei Bereiche stark zu verknüpfen. Eine mögliche Ursache dafür sind implizite Fähigkeitstheorien der Lehrkräfte (für einen Überblick bzgl. Lehrerüberzeugungen s. Stipek, Givvin, Salmon & MacGyvers, 2001). Um die Adaptivität von Unterricht an die Lernvoraussetzungen von Schülerinnen und Schülern künftig noch zu steigern, erscheint die Förderung diagnostischer Kompetenz(en) - insbesondere in Bezug auf die für die Qualität von Einschätzungen zentrale Rangkomponente - wichtig. Im Bereich der selbstkonzeptbezogenen diagnostischen Kompetenz(en) existieren diesbezüglich jedoch bislang keine Konzepte. Bei der Entwicklung solcher Konzepte ist eine Orientierung an vorhandenen Konzepten im leistungsbezogenen Bereich (z. B. Helmke, Hosenfeld & Schrader, 2004; Peter-Koop, 2006) möglich. Die Entwicklung diesbezüglicher Förderungen erscheint jedoch nur sinnvoll, wenn man von einer zugrunde liegenden diagnostischen Kompetenz ausgeht, die durch Förderungen systematisch verändert werden kann. Zukünftige Forschungen erscheinen somit vor allem bezüglich der weiteren Präzisierung und Ausdifferenzierung des Konstrukts diagnostische Kompetenz wichtig. Anmerkungen 1 Dabei ist zu vermuten, dass fehlende Interventionen nicht bei allen unrealistischen Ausprägungen des Fähigkeitsselbstkonzepts gleich schwerwiegend sind. Der problematischste Fall ist sicherlich, wenn Lehrkräfte unrealistisch niedrige Fähigkeitsselbstkonzepte nicht erkennen und aus diesem Grund keine Interventionsmaßnahmen ergreifen. 2 Für die Einschätzung der Realitätsangemessenheit von Fähigkeitsselbstkonzepten müssen Lehrkräfte zudem die Leistungsfähigkeit der Schüler als Kriterium adäquat einschätzen können. 3 In den Bereichen Mathematik und Lesen liegen Daten für 37, im Bereich Schreiben für 36 Lehrkräfte vor. 4 In die Studie wurden z.T. sehr kleine Klassen einbezogen. 90 Anna-Katharina Praetorius et al. 5 Den Schüler/ -innen wurden im Bereich Lesen 5 Items vorgelegt, die endgültige Skala besteht jedoch lediglich aus 4 Items, da ein Item wegen zu geringer Trennschärfe ausgeschlossen wurde. 6 Bezüglich der gewählten Antwortkategorien findet sich - typisch für die Grundschule - eine linksschiefe Verteilung: Kategorie 1 wurde über alle Items gemittelt im Bereich Schreiben von 5 %, im Bereich Lesen von 6 % und im Bereich Mathematik von 7 % der Schüler/ innen gewählt, Kategorie 2 im Bereich Schreiben von 48 %, im Bereich Lesen von 34 % und im Bereich Mathematik von 47 % der Schüler/ -innen, Kategorie 3 im Bereich Schreiben von 46 %, im Bereich Lesen von 60 % und im Bereich Mathematik von 46 % der Schüler/ -innen. 7 Die Rangkomponentenwerte wurden vor der Mittelung einer Fisher-z-Transformation unterzogen. 8 Die Berechnung erfolgte anhand eines Ein-Stichproben-T-Tests mit zweiseitiger Signifikanz. 9 Dies ergibt sich aus einem Test auf Varianzhomogenität bei zwei Beobachtungen in verbundenen Stichproben (Test nach Pitman, 1939) mit zweiseitiger Signifikanz. 10 Dabei ist für adaptives unterrichtliches Handeln vermutlich keine perfekte Übereinstimmung zwischen Einschätzung und Selbstkonzept notwendig, auch eine annähernd genaue Einschätzung sollte genügen. Literatur Artelt, C., Stanat, P., Schneider, W. & Schiefele, U. (2001). Lesekompetenz, Testkonzeption und Ergebnisse. In J. Baumert, E. Klieme, M. Neubrand, M. Prenzel, U. Schiefele, W. Schneider, P. Stanat, K. J. Tillmann & M. Weiß (Hrsg.), PISA 2000. Basiskompetenzen von Schülerinnen und Schülern im internationalen Vergleich (S. 69 - 140). Opladen: Leske + Budrich. Begeny, J. C., Eckert, T. L., Montarello, S. A. & Storie, M. S. (2008). Teachers’ perceptions of students’ reading abilities: An examination of the relationship between teachers’ judgments and students’ performance across a continuum of rating methods. School Psychology Quarterly, 23 (1), 43 - 55. Bromme, R. (1987). Die Untersuchung des professionellen Wissens von Lehrern: Zum Inhalt und zur psychologischen Struktur des Wissens. In G.-A. Eckerle & J.-L. Patry (Hrsg.), Theorie und Praxis des Theorie-Praxis- Bezuges in der empirischen Pädagogik (S. 179 - 199). Baden-Baden: Nomos. Brophy, J. E. (Ed.) (2001). Subject-specific instructional methods and activities. Advances in research on teaching, Vol. 8. Oxford, England: Elsevier. Carpenter, T. P., Fennema, E., Peterson, P. L., Chiang, C. P. & Loef, M. (1989). Using Knowledge of Children’s Mathematics Thinking in Classroom Teaching: An Experimental Study. American Educational Research Journal 26 (4), 499 - 531. Cohen, J. (1992). A power primer. Psychological Bulletin, 112, 155 - 159. Coladarci, T. (1986). Accuracy of Teacher Judgments of Student Responses to Standardized Test Items. Journal of Educational Psychology, 78, 141 - 146. Cronbach, L. J. (1955). Processes affecting scores on “understanding of others” and “assumed similarity”. Psychological Bulletin, 52, 177 - 193. Dickhäuser, O. & Galfe, E. (2004). Besser als …, schlechter als … - Leistungsbezogene Vergleichsprozesse in der Grundschule. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 36, 1 - 9. Eckert, C., Schilling, D. & Stiensmeier-Pelster, J. (2006). Einfluss des Fähigkeitsselbstkonzepts auf die Intelligenz- und Konzentrationsleistung. Zeitschrift für Pädagogische Psychologie, 20, 41 - 48. Greb, K., Faust, G. & Lipowsky, F. (2007). Projekt PERLE: Persönlichkeits- und Lernentwicklung von Grundschulkindern. Diskurs Kindheits- und Jugendforschung, 2, 100 - 104. Helmke, A. (1992). Selbstvertrauen und schulische Leistungen. Göttingen: Hogrefe. Helmke, A. (2003). Unterrichtsqualität erfassen, bewerten, verbessern. Seelze: Kallmeyer. Helmke, A., Hosenfeld, I. & Schrader, F.-W. (2004). Vergleichsarbeiten als Instrument zur Verbesserung der Diagnosekompetenz von Lehrkräften. In R. Arnold & C. Griese (Hrsg.), Schulleitung und Schulentwicklung (S. 119 - 144). Hohengehren: Schneider. Helmke, A. & Fend, H. (1981). Wie gut kennen Eltern ihre Kinder und Lehrer ihre Schüler? Ergebnisse der Konstanzer Untersuchungen zu Bedingungen der Diagnosegenauigkeit bei Eltern und Lehrern. In G. Zimmer (Hrsg.), Persönlichkeitsentwicklung und Gesundheit im Schulalter (S. 341 - 360). Frankfurt/ Main: Campus. Hopkins, K. D., George, C. A. & Williams, D. D. (1985). The Concurrent Validity of Standardized Achievement Tests by Content Area Using Teachers’ Ratings as Criteria. Journal of Educational Measurement, 22 (3), 177 - 182. Kammermeyer, G. (1998). Schulfähigkeit: Kriterien und diagnostische/ prognostische Kompetenz von Lehrerinnen, Lehrern und Erzieherinnen. Friedrich-Alexander-Universität Erlangen-Nürnberg. Kultusministerkonferenz (2004). Standards für die Lehrerbildung: Bildungswissenschaften. Online verfügbar unter: www.kmk.org/ fileadmin/ veroeffentlichungen_ beschluesse/ 2004/ 2004_12_16-Standards-Lehrerbil dung.pdf; Stand: 19. 10. 2010. Marsh, H. W. (1990). A multidimensional, hierarchical model of self-concept: Theoretical and empirical justification. Educational Psychology Review, 2, 77 - 172. Marsh, H. W. & Shavelson, R. J. (1985). Self-concept: Its multifaced, hierarchical structure. Educational Psychologist, 20, 107 - 125. Martschinke, S. & Kammermeyer, G. (2006). Selbstkonzept, Lernfreude und Leistungsangst und ihr Zusammenspiel im Anfangsunterricht. In A. Schründer- Lenzen (Hrsg.), Risikofaktoren kindlicher Entwicklung (S. 125 - 139). Wiesbaden: VS Verlag. Mayer, R. E. (2001). What good is educational psychology? The case of cognition and instruction. Educational Psychologist, 36, 83 - 88. van Ophuysen, S. (2006). Vergleich diagnostischer Entscheidungen von Novizen und Experten am Beispiel der Schullaufbahnempfehlung. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 38, 154 - 161. Peter-Koop, A. (2006). Die Vermittlung mathematikdiagnostischer Kompetenzen in der universitären Grundschullehrerausbildung. In A. H. Hilligus (Hrsg.), Standards und Kompetenzen - neue Qualität in der Lehrerausbildung? (S. 459 - 468). Berlin: Lit. Fähigkeitsselbstkonzepte der Schüler 91 Phillips, D. A. (1984). Illusion of incompetence among academically competent children. Child Development, 55, 2000 - 2016. Pitman, E. J. G. (1939). A note on normal correlation. Biometrika, 31, 9 - 12. Pohlmann, B., Möller, J. & Streblow, L. (2004). Zur Fremdeinschätzung von Schülerselbstkonzepten durch Lehrer und Mitschüler. Zeitschrift für Pädagogische Psychologie, 18, 157 - 169. Poloczek, S. (2007). Zur Struktur des Fähigkeitsselbstkonzepts von Erstklässlerinnen und Erstklässlern. Unveröffentlichte Diplomarbeit am Fachbereich Psychologie und Sportwissenschaft an der Johann-Wolfgang-Goethe-Universität Frankfurt am Main. Reichen, J. (1982). Lesen durch Schreiben. Zürich: Sabe. Reimann, P. & Rapp, A. (2008). Expertiseerwerb. In A. Renkl (Hrsg.), Lehrbuch Pädagogische Psychologie. Bern: Huber. Schermelleh-Engel, E. & Schweizer, K. (2007). Multitrait- Multimethod-Analysen. In H. Moosbrugger & A. Kelava (Hrsg.), Testheorie und Fragebogenkonstruktion (S. 325 - 341). Heidelberg: Springer. Schöne, C., Dickhäuser, O., Spinath, B. & Stiensmeier- Pelster, J. (2002). Skalen der Erfassung des schulischen Selbstkonzepts - SESSKO. Göttingen: Hogrefe. Schrader, F.-W. (1989). Diagnostische Kompetenzen von Lehrern und ihre Bedeutung für die Gestaltung und Effektivität des Unterrichts. Frankfurt am Main: Peter Lang. Schrader, F.-W. & Helmke, A. (1987). Diagnostische Kompetenz von Lehrern: Komponenten und Wirkungen. Empirische Pädagogik, I, 27 - 52. Schrader, F.-W. & Weinert, F. E. (1986). Diagnose des Lehrers als Diagnostiker. In H. Petillon, J. Wagner & B. Wolf (Hrsg.), Schülergerechte Diagnose. Theoretische und empirische Beiträge zur Pädagogischen Diagnostik (S. 11 - 29). Weinheim: Beltz. Spinath, B. (2005). Akkuratheit der Einschätzung von Schülermerkmalen durch Lehrer und das Konstrukt der diagnostischen Kompetenz. Zeitschrift für Pädagogische Psychologie, 19, 85 - 95. Stipek, D. J., Givvin, K. B., Salmon, J. M., MacGyvers, V. L. (2001). Teachers’ beliefs and practices related to mathematics instruction. Teaching and Teacher Education, 17, 213 - 226. Timperley, H., Wilson, A., Barrar, H. & Fung, I. (2007). Teacher professional learning and development: Best evidence synthesis iteration (BES). Wellington: Ministry of Education. Weinert, F. E. (1992). Vorwort von Franz E. Weinert. In A. Helmke, Selbstvertrauen und schulische Leistungen (S. 9 - 10). Göttingen: Hogrefe. Weinert, F. E., Schrader, F.-W. & Helmke, A. (1990). Educational expertise: Closing the gap between educational research and classroom practice. School Psychology International, 11, 163 - 180. Wild, K.-P. & Rost, D. H. (1995). Klassengröße und Genauigkeit von Schülerbeurteilungen. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 27, 79 - 90. Anna-Katharina Praetorius Universität Koblenz-Landau DFG-Graduiertenkolleg Unterrichtsprozesse Thomas-Nast-Straße 44 D-76829 Landau Tel.: (0 63 41) 28 03 32 61 praetorius@uni-landau.de Dr. des Karina Karst (geb. Greb) Deutsches Institut für Internationale Pädagogische Forschung (DIPF) Arbeitseinheit Bildungsqualität und Evaluation Schloßstr. 29 D-60486 Frankfurt/ Main greb@dipf.de Prof. Dr. Oliver Dickhäuser Universität Mannheim Lehrstuhl Pädagogische Psychologie D-68131 Mannheim oliver.dickhaeuser@uni-mannheim.de Prof. Dr. Frank Lipowsky Universität Kassel Institut für Erziehungswissenschaften Nora Platiel Str. 1 D-34109 Kassel lipowsky@uni-kassel.de