Psychologie in Erziehung und Unterricht
3
0342-183X
Ernst Reinhardt Verlag, GmbH & Co. KG München
10.2378/PEU2018.art06d
41
2018
652
Diskrepanzen zwischen Selbst- und Lehrkräfteurteil bei der Einschätzung antisozialen Verhaltens im Kindesalter
41
2018
Eva Link
Maren Weiss
Maria Arnis
Mark Stemmler
Frühes antisoziales Verhalten stellt einen Risikofaktor für längerfristige Devianz dar, weshalb die Identifikation von „Risikokindern“ von hoher Bedeutung ist. Zur Erhebung von Problemverhalten werden Selbsteinschätzungen häufig durch Lehrkräfteurteile ergänzt, wobei sich die Übereinstimmung verschiedener Urteiler in bisherigen Studien als gering herausstellte. Die vorliegende Studie untersucht mögliche Einflussgrößen auf individueller und (Klassen-)Kontextebene zur Erklärung der Urteilerdiskrepanzen. An der Studie nahmen N = 320 Schülerinnen und Schüler der dritten Klassen an Nürnberger Grundschulen teil. Erhoben wurden Selbsturteile zu Schul-Bullying und Delinquenz sowie Lehrerurteile zum Sozialverhalten. Auch in der vorliegenden Studie waren die Zusammenhänge zwischen Selbst- und Fremdurteil gering. Für Jungen sowie Kinder mit Migrationshintergrund zeigten sich höhere Urteilerdiskrepanzen. Zudem fielen die Urteilerdiskrepanzen in Klassen mit hohem Bullyingniveau deutlich höher aus, was möglicherweise auf eine Orientierung der Lehrkräfte an der Klassennorm zurückzuführen ist. In zukünftigen Studien und bei der diagnostischen Beurteilung einzelner Kinder sollten daher unbedingt Effekte des Klassenkontexts berücksichtigt werden, um Fehleinschätzungen zu vermeiden.
3_065_2018_2_0003
n Empirische Arbeit Psychologie in Erziehung und Unterricht, 2018, 65, 96 -109 DOI 10.2378/ peu2018.art06d © Ernst Reinhardt Verlag München Basel Diskrepanzen zwischen Selbst- und Lehrkräfteurteil bei der Einschätzung antisozialen Verhaltens im Kindesalter Eine Untersuchung individueller und kontextbezogener Einflussgrößen Eva Link, Maren Weiss, Maria Arnis, Mark Stemmler Friedrich-Alexander Universität Erlangen-Nürnberg (FAU) Zusammenfassung: Frühes antisoziales Verhalten stellt einen Risikofaktor für längerfristige Devianz dar, weshalb die Identifikation von „Risikokindern“ von hoher Bedeutung ist. Zur Erhebung von Problemverhalten werden Selbsteinschätzungen häufig durch Lehrkräfteurteile ergänzt, wobei sich die Übereinstimmung verschiedener Urteiler in bisherigen Studien als gering herausstellte. Die vorliegende Studie untersucht mögliche Einflussgrößen auf individueller und (Klassen-)Kontextebene zur Erklärung der Urteilerdiskrepanzen. An der Studie nahmen N = 320 Schülerinnen und Schüler der dritten Klassen an Nürnberger Grundschulen teil. Erhoben wurden Selbsturteile zu Schul-Bullying und Delinquenz sowie Lehrerurteile zum Sozialverhalten. Auch in der vorliegenden Studie waren die Zusammenhänge zwischen Selbst- und Fremdurteil gering. Für Jungen sowie Kinder mit Migrationshintergrund zeigten sich höhere Urteilerdiskrepanzen. Zudem fielen die Urteilerdiskrepanzen in Klassen mit hohem Bullyingniveau deutlich höher aus, was möglicherweise auf eine Orientierung der Lehrkräfte an der Klassennorm zurückzuführen ist. In zukünftigen Studien und bei der diagnostischen Beurteilung einzelner Kinder sollten daher unbedingt Effekte des Klassenkontexts berücksichtigt werden, um Fehleinschätzungen zu vermeiden. Schlüsselbegriffe: Antisoziales Verhalten, Selbst- und Fremdurteil, Urteilerdiskrepanzen, Klassenkontext Differences Between Self and Teacher Ratings Concerning Antisocial Behavior: Influences of Individual and Context Factors Summary: Early antisocial behavior is a risk factor for long-term maladaptive development. Therefore, the early identification of at-risk children is relevant both for research and clinical practice. The assessment of teacher ratings is often combined with self-ratings; however, in former studies, interrater agreement was quite low. This study examines individual and context factors influencing interrater disagreement. In spring 2014, N = 320 Bavarian third grade students were interviewed concerning deviant behavior/ delinquency, and school bullying. Furthermore, teacher ratings concerning social behavior were assessed. As in previous studies, agreement between teacher and selfratings was quite low. Interrater agreement was lower in boys and in children with migration background. Moreover, interrater agreement was lower in school classes with high levels of bullying, reflecting the influence of classroom norms on teacher ratings. Researchers and practitioners should pay more attention to the relevance of classroom context effects in order to avoid misjudgment. Keywords: Antisocial behavior, selfand teacher rating, rater disagreement, class context Schon im Grundschulalter zeigt ein erheblicher Anteil von Kindern dissoziales Verhalten wie körperliche Aggression, Schul-Bullying, Delinquenz oder ausgeprägtes oppositionelles Verhalten (Ihle, Esser, Laucht & Schmidt, 2004; Petermann & Petermann, 2013; Remschmidt, 2009; Wolke, Woods, Stanford & Schulz, 2001). So fanden Baier, Pfeiffer, Rabold, Simonson und Diskrepanzen zwischen Selbst- und Lehrkräfteurteil 97 Kappes (2010) an einer Stichprobe von Kindern der vierten Klasse Lebenszeitprävalenzen von 15 % für körperliche Gewaltanwendung gegenüber anderen Kindern und von 2 % bis 5 % für verschiedene delinquente Taten wie Diebstahl, Zündeln und Sachbeschädigung. Bullying-Verhaltensweisen wie Schlagen/ Treten, Ausschließen von Mitschülern oder Hänseln und Ignorieren wurden von jeweils 13 % bis 21 % der Kinder zugegeben. Grundsätzlich fallen Jungen mehr durch dissoziales Verhalten auf als Mädchen, wenn dies auch nicht auf jede Art von Dissozialität gleichermaßen zutrifft (Archer, 2004; Card, Sawalani, Stucky & Little, 2008; Lansford et al., 2012). Je früher problematisches Sozialverhalten im Lebenslauf auftritt, je schwerwiegender und vielseitiger dieses Verhalten ist und in je mehr Kontexten es gezeigt wird, desto höher ist das Risiko für langfristige kriminelle „Karrieren“ (Loeber & Le Blanc, 1990). Angesichts der schwerwiegenden persönlichen und gesellschaftlichen Folgen, die mit der Verfestigung früher dissozialer Verhaltensmuster einhergehen können, ist es geboten, Risikokinder möglichst früh zu identifizieren und entsprechenden Präventions- und Interventionsmaßnahmen zuzuführen. Diese frühe Identifikation gestaltet sich aber relativ schwierig: Die Kinder selbst können oder wollen nicht immer akkurat Auskunft über eigenes Fehlverhalten geben, teils aus Gründen sozialer Erwünschtheit, teils aufgrund entwicklungsbedingter Defizite (Kratzer & Cwielong, 2014; Mummendy & Grau, 2008; Thiels & Schmitz, 2008). Um dieser Problematik zu begegnen, werden häufig Fremdbeurteiler eingesetzt, welche die Angaben der Kinder validieren oder ergänzen sollen, beispielsweise Eltern, Erzieherinnen und Erzieher oder Lehrkräfte. Gerade im Grundschulalter erscheinen Lehrkräfte als geeignete Fremdbeurteiler für problematisches Sozialverhalten, insbesondere offen-aggressives Verhalten, da diese die Kinder über einen längeren Zeitraum intensiv begleiten. Zum anderen erleben Lehrkräfte die Kinder hauptsächlich im Kontext der Peer-Gruppe, in welchem antisoziale Verhaltenstendenzen gut beobachtbar sein sollten. Bei der Arbeit mit Lehrkräfteurteilen stellt sich allerdings immer wieder das Problem, dass diese häufig deutlich diskrepant zu anderen Informationsquellen (z. B. Selbst- oder Elternurteil) sind (z. B. Lösel, Stemmler, Beelmann & Jaursch, 2005; Roos et al., 2016; Rønning et al., 2009). So berichteten schon Achenbach, McConaughy und Howell (1987) von geringen Übereinstimmungen (mittlerer Zusammenhang: r = .20) zwischen Selbst- und Lehrerurteil in der Beurteilung behavioraler und emotionaler Probleme vom frühen Kindesbis ins frühe Erwachsenenalter. Zu ähnlichen Zusammenhangswerten kommt Epkins (1995) in einer Studie an 8 - 12-jährigen PatientInnen einer psychiatrischen Einrichtung. Dagegen berichten Thiels und Schmitz (2008) zwar etwas höhere Zusammenhänge für die Selbst- und Fremdbeurteilung dissozialen und aggressiven Verhaltens von Jugendlichen, allerdings zeigte sich auch hier, dass das Lehrkräfteurteil deutlich schlechter mit dem Selbsturteil zusammenhängt als das Elternurteil. Zwar wird vereinzelt auf diverse Fehlerquellen hingewiesen, welche auf Schülersowie auf Lehrerseite zu Urteilsverzerrungen führen können (vgl. Lösel & Schmucker, 2003; Thiels et al., 2008), insgesamt werden diese Verzerrungen aber viel zu wenig diskutiert und kaum empirisch untersucht (Mason, Gunersel & Ney, 2014). Meist wird darauf hingewiesen, dass Lehrkräfte- und Selbsturteil nicht konkurrent, sondern komplementär einzusetzen seien (Lösel et al., 2005; Thiels et al., 2008) - wie die Angaben von Kindern und Lehrkräften konkret zu integrieren sind, vor allem bei deutlich diskrepanten Angaben, wird aber häufig nicht erläutert. Dies mag auch daran liegen, dass es - im Gegensatz zu Leistungsbeurteilungen - abgesehen von sehr aufwendigen externen Verhaltensbeobachtungen kein valides Außenkriterium gibt, das das „wahre“ Ausmaß des Problemverhaltens akkurat wiedergibt (Mason et al., 2014). Es gibt Hinweise darauf, dass schülerbezogene Merkmale Verhaltensratings durch die Lehrkräfte beeinflussen und somit verzerren können. Bereits mehrfach untersucht wurde der 98 Eva Link, Maren Weiss, Maria Arnis, Mark Stemmler Einfluss des ethnischen Hintergrunds, wobei die Ergebnisse bisheriger Studien heterogen sind (vgl. Mason et al., 2014). Beispielsweise wurden in einer Studie von Ramirez und Shapiro (1998) Schülerinnen und Schüler anderer ethnischer Herkunft als die der Lehrkräfte selbst bezüglich verschiedener ADHS-Symptome als unauffälliger beurteilt als Schülerinnen und Schüler gleicher ethnischer Herkunft. In einer anderen Studie zeigten sich zumindest teilweise stereotypenkonforme Verzerrungen der Lehrerurteile je nach ethnischer Herkunft der zu beurteilenden Kinder (Chang & Sue, 2003). Eine Reihe weiterer Studien fand dagegen keinen ethnischen Bias (vgl. Mason et al., 2014). Ein weiteres schülerbezogenes Merkmal, welches im Zusammenhang mit Urteilsverzerrungen bereits untersucht wurde, ist das Geschlecht. Im Allgemeinen werden Jungen von ihren Lehrkräften als aggressiver und hyperaktiver eingeschätzt als Mädchen (Graves, Blake & Kim, 2012), was jedoch mit einer empirisch gesicherten erhöhten Prävalenz derartigen Verhaltens bei Jungen in Einklang steht. Darüber hinaus fanden Roos et al. (2016) in ihrer Studie zu Beurteilerübereinstimmung jedoch erste Hinweise darauf, dass im Rahmen psychologischer Diagnostik die Übereinstimmung zwischen Selbst- und Lehrkräfteurteil bei Mädchen höher ist als bei Jungen. Die Autoren nehmen an, dass dies darauf zurückzuführen ist, dass Mädchen zu einer differenzierteren Selbsteinschätzung in der Lage sind. Neben diesen individuellen Aspekten sind bei der Beurteilung von Schulkindern zudem mögliche Kontexteffekte der Schulklasse denkbar, welche in bisherigen Studien vernachlässigt wurden und zur Erklärung der geringen Übereinstimmungen beitragen könnten (vgl. Roos et al., 2016). Es ist zu vermuten, dass das Problemniveau einer Schulklasse für die Lehrkraft einen Anker für die Beurteilung individueller Verhaltensauffälligkeiten darstellt. Somit käme es beim einzelnen Kind zu einer Überschätzung von Problemverhaltensweisen in unproblematischen Klassen und gleichsam zu einer Unterschätzung in stark problembelasteten Klassen. Auch ist zu erwarten, dass eine Lehrkraft umso weniger Ressourcen zur differenzierten Beurteilung einzelner Kinder hat, je auffälliger - und somit anstrengender - die gesamte Klasse ist. Dieser Einfluss des Klassenkontextes auf die Übereinstimmung von Selbst- und Lehrkräfteurteilen wurde bislang nicht empirisch untersucht. Die vorliegende Studie widmet sich damit folgenden Fragestellungen und Hypothesen: 1. Wie in anderen Untersuchungen berichtet, erwarten auch wir Lebenszeit-Prävalenzraten bis zu 20 % für verschiedene Aspekte antisozialen Verhaltens. Eine höhere Belastung von Jungen wird erwartet. Darüber hinaus gehen wir von hohen Interkorrelationen unterschiedlicher selbstberichteter Erscheinungsformen antisozialen Verhaltens (hier konkret: Schul-Bullying und allgemeine Delinquenz) aus. 2. Es werden geringe bis mäßige Übereinstimmungen zwischen Selbst- und Lehrkräfteurteil in Bezug auf kindliches Problemverhalten erwartet. Problemverhalten, das im Kontext Schule auftritt und von außen gut beobachtbar ist (hier: Schul-Bullying), soll sich stärker im Lehrerurteil niederschlagen als verdecktes oder außerhalb der Schule gezeigtes Problemverhalten (hier: Delinquenz). 3. Es wird untersucht, ob individuelle Merkmale der Schülerinnen und Schüler einen Einfluss auf die Urteilerübereinstimmung haben. Der Einfluss des Migrationsstatus der Schülerinnen und Schüler wird aufgrund bisheriger widersprüchlicher Ergebnisse ungerichtet untersucht. Bezüglich des Geschlechts der Kinder wird angenommen, dass die Urteilerübereinstimmung bei Mädchen höher ist als bei Jungen. 4. Abschließend soll explorativ untersucht werden, ob die Übereinstimmung von Lehrer- und Schülerurteil bezüglich antisozialer Verhaltensweisen je nach Schulklasse unterschiedlich ist und welche Rolle hierbei das Problemniveau der Schulklasse als Kontextfaktor spielt. Diskrepanzen zwischen Selbst- und Lehrkräfteurteil 99 Methode Stichprobe und Erhebung Die vorliegende Studie wurde im Rahmen des Projekts Chancen und Risiken im Lebensverlauf durchgeführt. Dabei handelt es sich um ein von der Deutschen Forschungsgemeinschaft gefördertes Projekt, welches als Teilprojekt des Sonderforschungsbereichs Von Heterogenitäten zu Ungleichheiten (SFB 882) insbesondere Faktoren untersuchte, welche deviante bzw. delinquente Lebensverläufe begünstigen. Im Rahmen der vorliegenden Studie wurden im März und April 2014 Schülerinnen und Schüler der dritten Klasse sowie deren Klassenlehrkräfte in Nürnberger Grundschulen befragt. Insgesamt nahmen neun Grundschulen mit 26 dritten Schulklassen an der Befragung teil, mit einer potenziellen Teilnehmerzahl von 566 Schulkindern. Aufgrund von Ablehnungen der Teilnahme durch die Eltern (141 Kinder), Fehlen am Tag der Befragung (15 Kinder) und fehlenden Rückmeldungen der Eltern (86 Kinder) ergab sich letztlich eine Stichprobe von N = 324 (Teilnahmequote 57 %). Da zwei Schulklassen mit jeweils nur zwei Kindern repräsentiert waren, gehen in diese Auswertungen die Daten von 320 Kindern aus 24 Schulklassen ein. Pro Schulklasse nahmen durchschnittlich 13 Kinder (Range: 7 bis 19) teil. 51 % der teilnehmenden Kinder waren männlichen und 49 % weiblichen Geschlechts, das Durchschnittsalter lag bei 8.7 Jahren (SD = ±0.67). 204 Kinder (63 %) hatten einen Migrationshintergrund. Die Erhebung fand in Fragebogenform im Klassenverband während einer Doppelstunde statt, wobei jeweils drei geschulte Testleiterinnen anwesend waren. Jede Frage des Fragebogens wurde von der Testleiterin laut vorgelesen und Fragen der Kinder während der Testung wurden unmittelbar beantwortet, um Verständnisschwierigkeiten zu vermeiden. Zur Erleichterung der Bearbeitung und zur Incentivierung wurden Pausen, Gruppenspiele und Süßigkeiten eingesetzt. Zusätzlich zur Befragung der Schülerinnen und Schüler wurden die Klassenlehrkräfte gebeten, zu jedem Kind einen zweiseitigen Fragebogen auszufüllen. Die Lehrerfragebögen wurden von allen Lehrkräften bearbeitet und abgegeben, womit ergänzend zu den 320 Schülerfragebögen eine entsprechende Anzahl an Lehrerfragebögen vorliegt. Die Klassenlehrkräfte waren in 21 Klassen weiblich, in drei Klassen männlich. Da in Bayern die Klassenlehrkraft zur dritten Klasse wechselt, kannten die Lehrkräfte die Kinder in der Regel seit Beginn des Schuljahres, also seit ca. einem halben Jahr. Erhebungsinstrumente Für die vorliegenden Analysen waren in Hinblick auf die formulierten Hypothesen nur einige Teile des Schülersowie des Lehrkräftefragebogens relevant. Zusätzlich zu den im Folgenden berichteten Konstrukten wurden im Rahmen der Befragung außerdem Daten zu den folgenden Themen erhoben: Elterliche Erziehung, Freizeitgestaltung, soziale Integration, Wohnsituation, nachbarschaftliches Umfeld. An dieser Stelle werden nur die Skalen bzw. Items beschrieben, welche in die Analysen einbezogen wurden. Schülerfragebogen Zur Erfassung antisozialen Verhaltens im Selbstbericht wurden einerseits Verhaltensweisen abgefragt, die für den Schulkontext spezifisch sind (Schul- Bullying), zum anderen wurden delinquente und deviante Verhaltensweisen erhoben, die nicht an den Schulkontext gebunden sind. Schul-Bullying Schul-Bullying ist definiert als das Ausüben negativer Handlungen von Schulkindern gegenüber anderen Schülerinnen oder Schülern, welches im Schulalltag wiederholt und über einen längeren Zeitraum stattfindet (Olweus, 1994). Bullying-Verhalten wurde mithilfe einer modifizierten Kurzfassung des Bully/ Victim Questionnaire erhoben (BVQ; Lösel & Bliesener, 2003; Olweus, 1989). Diese erfasst mit jeweils drei Items die Auftretenshäufigkeit von Bullying in Bezug auf die Beobachtung, Viktimisierung und (Mit-)Täterschaft. Die Erhebung von (Mit-)Täterschaft („Wie oft hast du dabei mitgemacht,…“) wurde der Erfassung der reinen Täterschaft vorgezogen, um Effekte sozialer Erwünschtheit gering zu halten (vgl. Lösel & Bender, 2011, 2014). Die verwendeten Items lassen sich neben den drei Handlungsperspektiven drei verschiedenen Verhaltensbereichen zuordnen: Verbale Aggression (Beispielitem aus der Beobachterperspektive: „Wie oft hast du schon beobachtet, dass ein Schüler von anderen Schülern gehänselt worden ist oder hässliche Dinge gesagt bekam? “), Zerstörung von Sachen (Beispielitem aus der (Mit-) Täterperspektive: „Wie oft hast du dabei mitgemacht, einem anderen Schüler etwas kaputtzumachen? “) und physische Aggression (Beispielitem aus der Opferperspektive: „Wie oft wurdest du von anderen Schülern im Ernst geschlagen oder getreten? “). Den Befragten wurde hierbei ein dreistufiges Antwortformat vorgegeben (0 = noch 100 Eva Link, Maren Weiss, Maria Arnis, Mark Stemmler nie, 1 = manchmal, 2 = oft). Referenzzeitraum war jeweils die Zeit seit Beginn der dritten Klasse (also ca. sechs Monate). Zur Untersuchung der vorliegenden Fragestellung wurde auf Individualebene die Skala (Mit-)Täterschaft herangezogen (möglicher Wertebereich 0 - 6; α = .68). Das beobachtete Bullying wurde auf Ebene der Schulklassen aggregiert, um ein Maß für das Bullying-Niveau jeder Schulklasse zu erhalten (ICC = 0.17; α = .48). Es ergaben sich signifikant unterschiedliche Mittelwerte im beobachteten Bullying zwischen den 24 Schulklassen (Mittelwerte zwischen 1.82 und 4.60; F (23, 290) = 3.71, p < .001). Devianz/ Delinquenz Zur Erfassung devianten/ delinquenten Verhaltens, welches nicht an den Schulkontext gebunden ist, wurden 10 ausgewählte Items der Delinquenzbelastungsskala (DBS, gekürzte Version; Lösel, 1975) verwendet, welche folgende Delikte umfassten: Schwarzfahren, Wechselgeld erschwindeln, Automatenbetrug, Mitschüler bestehlen, Einbruch, Sachbeschädigung (2 Items), Zündeln, Streunen, Schule schwänzen (Beispielitems: „Hast du schon einmal absichtlich Fenster, Straßenlaternen oder ähnliche Dinge zerstört? “, „Hast du schon einmal die Schule einen ganzen Tag lang geschwänzt? “). Zusätzlich zu den DBS-Items wurde außerdem Tierquälerei mithilfe eines selbst entwickelten Items („Hast du schon einmal ein Tier gequält? “) erhoben. Alle Items wurden mit einem dichotomen Antwortformat (ja/ nein) zur Erfassung der Lebenszeitprävalenz vorgegeben, da sich eine differenziertere Erfassung (z. B. Jahresprävalenz, Häufigkeit der Tatbegehung) in einer Vorstudie als in dieser Altersgruppe nicht durchführbar erwiesen hatte. Wie viele verschiedene Delikte ein Kind im Laufe seines Lebens bisher begangen hat, wurde mit der Bildung eines Versatilitätswertes (Summenscore, Wertebereich 0 - 11) berechnet. Cronbachs Alpha beträgt für die Skala α = .79. Soziodemografische Daten Aus dem demografischen Teil des Fragebogens wurden für die vorliegende Arbeit das Alter und das Geschlecht der Befragten sowie der Migrationshintergrund mitberücksichtigt. Ein Migrationshintergrund wurde angenommen, wenn das Kind angab, die zuerst gelernte oder zu Hause normalerweise gesprochene Sprache in der Familie sei nicht Deutsch bzw. wenn das Kind berichtete, schon einmal einen Vorkurs/ Deutschkurs oder eine Deutschlernklasse besucht zu haben. Lehrerfragebogen Sozialverhalten Zur Erfassung des antisozialen und aggressiven Verhaltens diente der Social Behavior Questionnaire (SBQ; Tremblay et al., 1991; Tremblay, Vitaro, Gagnon, Piché & Royer, 1992); hier wurde die deutsche Übersetzung von Lösel, Hacker, Jaursch, Stemmler und Wallner (2006) verwendet. Die Version für Erzieherinnen und Erzieher sowie Lehrkräfte umfasst 46 Items, welche zur Beschreibung von ängstlichen, störend-unruhestiftenden, unaufmerksamen und prosozialen Verhaltensweisen dienen. Im Rahmen unserer Studie wurden vier Primärskalen ausgewählt, von denen an dieser Stelle aber nur zwei berücksichtigt werden: Physische Aggression (sechs Items, z. B.: „Das Kind greift andere Kinder körperlich an“) und Zerstörung / Delinquenz (fünf Items, z. B.: „Das Kind zerstört die Sachen von anderen“). Beurteilungszeitraum war die Zeit seit Beginn der dritten Klasse (also ca. sechs Monate). Aus diesen beiden Skalen kann die Sekundärskala Störung des Sozialverhaltens gebildet werden. Die Lehrkräfte beurteilten jedes Kind bezüglich der beschriebenen Verhaltensweisen auf einer dreistufigen Skala (0 = trifft nicht zu, 1 = trifft manchmal/ etwas zu, 2 = trifft genau/ häufig zu), deren Mittelwert zur Skalenbildung herangezogen wurde. Cronbachs Alpha beträgt α = .91 für die Skala physische Aggression, α = .61 für Zerstörung / Delinquenz und α = .87 für die Sekundärskala Störung des Sozialverhaltens. Statistische Analysen Zusätzlich zu den bivariaten Zusammenhangs- und Unterschiedstestungen wurden Differenzwerte zwischen Selbst- und Fremdurteil gebildet. Da die drei Fragebogenverfahren SBQ, DBS und BVQ unterschiedlich skaliert sind, wurden die Daten über die gesamte Stichprobe z-standardisiert. Differenzwerte wurden jeweils aus dem Selbsturteil (BVQ und DBS) und dem Lehrerurteil zur Störung des Sozialverhaltens gebildet. Diese Sekundärskala wurde gewählt, da sie ein breiteres Spektrum antisozialen Verhaltens abdeckt und mehr Items umfasst als die Primärskalen. Diese Differenzwerte wurden auf Einflussfaktoren auf individueller Ebene (Geschlecht, Migrationshintergrund) und auf Klassenebene (Problemverhalten in der Klasse) untersucht. Das Problemverhalten in der Klasse wurde über das Ausmaß beobachteten Bullyings in der Klasse operationalisiert. Aufgrund der hierarchischen Datenstruktur wurde zudem eine Diskrepanzen zwischen Selbst- und Lehrkräfteurteil 101 Mehrebenenanalyse zur Überprüfung von individuellen (Geschlecht, Migrationshintergrund) und Kontexteffekten (beobachtetes Bullying auf Klassenebene) auf die Differenz zwischen Selbst- und Lehrkräfteurteil gerechnet. Hier wurde das Programm HLM 7 (SSI Software, 2016) eingesetzt (Methode: Maximum Likelihood; Schätzung mit robusten Standardfehlern). Ergebnisse Fragestellung 1: Auftreten sozialen Problemverhaltens Bullying-(Mit-)Täterschaft Vergleichsweise wenige Kinder gaben an, selbst Bullyingverhalten gezeigt zu haben: Nur je 1 % bis 4 % der Kinder sagten, dass sie selbst „oft“ andere gehänselt, geschlagen oder deren Sachen zerstört haben. Immerhin gaben aber 21 % zu, dass sie andere „manchmal“ geschlagen haben und 34 % äußerten, andere „manchmal“ gehänselt zu haben. Fasst man nun die Bullying- (Mit-)Täterschaft in einer Summenskala zusammen (Wertebereich 0 - 6), so fallen die Werte insgesamt recht gering aus. Jungen hatten im Vergleich zu Mädchen signifikant höhere Werte auf der Bullying-(Mit-)Täterskala (Tab. 1). Selbstberichtete Devianz/ Delinquenz In Bezug auf die selbstberichtete Delinquenz gaben 41 % der Kinder an, bereits mindestens eine der abgefragten Taten begangen zu haben. Ungefähr die Hälfte (49 %) dieser Täterinnen und Täter berichtete eine einzelne Tat, weitere 19 % bejahten zwei verschiedene Taten. Drei oder mehr verschiedene Taten wurden demnach von ungefähr einem Drittel der Täterinnen und Täter begangen. Wie schon beim Bullying, gaben auch bei der selbstberichteten Delinquenz die Jungen mehr verschiedene Taten an (Tab. 1). Abbildung 1 stellt dar, welche Delikte von Jungen und Mädchen begangen wurden. Am häufigsten - unabhängig vom Geschlecht - berichteten die Kinder demnach von Schwarzfahren, Automatenbetrug und Tierquälerei. Kinder, die angaben, Bullying-Verhalten gezeigt zu haben, gaben auch insgesamt mehr delinquentes Verhalten an (r s = .41, p < .001). Dieser Zusammenhang galt für Jungen (r s = .43, p < .001) und Mädchen (r s = .38, p < .001) gleichermaßen. Min Max M (SD) Jungen Mädchen t (df) M (SD) Selbsturteil BVQ (Mit-)Täterschaft 0.00 6.00 0.78 (1.13) 1.09 (1.33) 0.45 (0.76) 5.26*** (251.48) DBS Devianz/ Delinquenz 0.00 11.00 0.97 (1.75) 1.28 (2.15) 0.65 (1.13) 3.31*** (238.13) Lehrkräfteurteil (SBQ) Zerstörung/ Delinquenz 0.00 1.20 0.09 (0.78) 0.10 (0.20) 0.07 (0.15) 1.54 (297.75) physische Aggression 0.00 2.00 0.17 (0.37) 0.28 (0.45) 0.07 (0.23) 5.29*** (242.59) Störung d. Sozialverhaltens (Sekundärskala) 0.00 1.45 0.13 (0.25) 0.20 (0.30) 0.07 (0.16) 4.76*** (250.23) Tab. 1: Sozialverhalten: Deskriptive Daten und Geschlechtsunterschiede (n = 320) Anmerkungen: BVQ: Bully-Victim-Questionnaire (Wertebereich 0 - 6); DBS: Delinquenzbelastungsskala (Wertebereich 0 - 11); SBQ: Social Behavior Questionnaire (Wertebereich 0 - 2). *** p < .001. 102 Eva Link, Maren Weiss, Maria Arnis, Mark Stemmler Lehrkräfteurteil Die Lehrkräfteurteile zum Sozialverhalten fielen insgesamt recht niedrig aus und schöpften den möglichen Wertebereich von 0 bis 2 nur bedingt aus (Tab. 1). Auf der Skala physische Aggression und der Sekundärskala Störung des Sozialverhaltens lagen sie für Jungen signifikant höher (Tab. 1). Fragestellung 2: Zusammenhänge und Diskrepanzen zwischen Selbst- und Lehrkräfteurteil Die Zusammenhänge zwischen Selbst- und Lehrkräfteurteil bewegten sich im niedrigen Bereich (Tab. 2). Es wurden aber doch differenzierte Zusammenhänge deutlich: Das Selbsturteil zur Bullying-(Mit)Täterschaft hing vor allem mit dem Lehrkräfteurteil zur physischen Aggression zusammen, wohingegen Selbstangaben zur Devianz/ Delinquenz stärker mit dem Lehrkräfteurteil zur Skala Zerstörung/ Delinquenz korreliert waren. Wider Erwarten waren die Zusammenhänge zwischen Lehrkräfteurteil und Bullying-(Mit-)Täterschaft nicht höher als zwischen Lehrkräfteurteil und Devianz/ Delinquenz. Zur Untersuchung von Urteilerdiskrepanzen wurden die Lehrkräfteurteile (Skala Störung 50 45 40 35 30 25 20 15 10 5 0 Schwarzfahren Wechselgeld erschwindeln Automatenbetrug Mitschüler bestehlen Einbruch Sachbeschädigung öffentlich Sachbeschädigung privat Zündeln Tierquälerei Streunen Schule schwänzen Prävalenz gesamt Jungen Mädchen Abb. 1: Täterraten (in Prozent) getrennt nach Geschlecht für verschiedene Delikte. Lehrkräfteurteil Selbsturteil Bullying (BVQ) Devianz (DBS) SBQ: Zerstörung/ Delinquenz SBQ: Physische Aggression SBQ: Störung des Sozialverhaltens (Sekundärskala) .11* .25*** .27*** .29*** .20*** .27*** Tab. 2: Bivariate Zusammenhänge zwischen Selbst- und Lehrkräfteurteil Anmerkungen: Spearman-Rangkorrelationen; SBQ: Social Behavior Questionnaire; BVQ: Bully-Victim-Questionnaire; DBS: Delinquenzbelastungsskala. * p < .05, *** p < .001. Diskrepanzen zwischen Selbst- und Lehrkräfteurteil 103 des Sozialverhaltens, SBQ) von den Selbsturteilen (Skalen Bullying-(Mit-)Täterschaft, BVQ, und Devianz/ Delinquenz, DBS) abgezogen. Im Vorfeld wurden die Skalenwerte z-standardisiert, um eine vergleichbare Skalierung zu schaffen. Die Differenzwerte für Devianz / Delinquenz wiesen einen Range von -4.86 bis 5.82 auf, für Bullying-(Mit)Täterschaft betrug der Range -5.56 bis 4.43. Fragestellung 3: Differenzen zwischen Lehrkräfte- und Selbsturteil: Einfluss individueller Merkmale Die durchschnittlichen Differenzwerte für Jungen und Mädchen unterschieden sich nicht signifikant voneinander (Bullying: M = .05 (SD = 1.37) vs. M = -.03 (SD = .90), t (274.30) = 0.63, p = .53; Devianz/ Delinquenz: M = -.09 (SD = 1.53) vs. M = -.06 (SD = .76), t (230.56) = -1.10, p = .27). Levene-Tests zeigten jedoch, dass die Differenzwerte bei Jungen deutlich weiter streuten und somit mehr Abweichungen in beide Richtungen als bei Mädchen zu beobachten waren (Bullying: F (1, 312) = 19.21, p < .001; Devianz/ Deliquenz: F (1, 311) = 22.13, p < .001). Auch für den Vergleich von Kindern mit und ohne Migrationshintergrund zeigten sich keine signifikanten Mittelwertsdifferenzen (Bullying: M = .07 (SD = 1.22) vs. M = -.09 (SD = 1.05), t (268.14) = -1.18, p = .24; Devianz/ Delinquenz: M = .02 (SD = 1.33) vs. M = -.08 (SD = 1.01), t (290.79) = -0.78, p = .44). Levene-Tests zeigten Differenz Schüler-/ Lehrkräfteurteil 3,00 2,00 1,00 ,00 -1,00 2,00 3,00 4,00 5,00 beobachtetes Bullying (Klassenebene) Abb. 2: Differenz von Selbst- und Lehrkräfteurteil in Abhängigkeit vom Klassenkontext (mittleres beobachtetes Bullying auf Klassenebene; n = 24 Klassen). Anmerkungen: Negative Differenz: Lehrerurteil > Schülerurteil; Positive Differenz: Schülerurteil > Lehrerurteil. 104 Eva Link, Maren Weiss, Maria Arnis, Mark Stemmler Modell Devianzmaß (Δ D) Koeffizienten Restvarianz (Level 1: σ 2 , Level 2: τ 00 ) Intercept Bully_Klasse (Level 2) Geschlecht (Level 1) Migrationshintergrund (Level 1) Nullmodell: ICC = 0.19 Level 1: |Differenz| = β 0j + r ij Level 2: β 0j = γ 00 + u 0j 863.80 0.72*** σ 2 = 0.83 τ 00 = 0.19 Modell mit Makro-Prädiktor: Level 1: |Differenz| = β 0j + r ij Level 2: β 0j = γ 00 + γ 01 Bully_Klasse + u 0j 852.19 (Δ D = 11.61**) -0.57 n.s. 0.39** σ 2 = 0.83 τ 00 = 0.11 Modell mit Mikro- und Makro-Prädiktor: Level 1: |Differenz| = β 0j + β 1j Geschlecht + β 2j Migrationshintergrund + r ij Level 2: β 0j = γ 00 + γ 01 Bully_Klasse + u 0j 820.55 (Δ D = 31.64***) 0.24 n.s. 0.37** 0.56*** 0.12 σ2 = 0.74 τ 00 = 0.13 Tab. 3: Mehrebenenanalyse mit den in Betrag gesetzten Differenzwerten der Selbst- und Fremdurteile (DBS-SSV) als abhängige Variable und Prädiktoren auf Mikro- und Makroebene Anmerkungen: Maximum Likelihood Methode; Schätzung mit robusten Standardfehlern; Geschlecht weiblich = 1, männlich = 2; Migrationshintergrund 0 = nein, 1 = ja; Bully_Klasse: Mittlerer BVQ-Skalenwert „beobachtetes Bullying“ pro Schulklasse. ** p < .01, *** p < .001. Diskrepanzen zwischen Selbst- und Lehrkräfteurteil 105 jedoch auch hier eine signifikant stärkere Streuung der Werte für Kinder mit Migrationshintergrund (Bullying: F (1, 311) = 10.17, p < .01; Devianz/ Delinquenz: F (1, 310) = 7.78, p < .01). Fragestellung 4: Differenzen zwischen Lehrkräfte- und Selbsturteil: Einfluss von Klassenmerkmalen Zur weiteren Aufklärung der schulbezogenen Einflussfaktoren auf die Differenzwerte wurden zunächst Intraklassenkoeffizienten (ICC ) berechnet. Hier zeigte sich in Bezug auf die Einschätzung von Devianz/ Delinquenz ein ICC von .15; dies bedeutet, dass die Unterschiede in den Übereinstimmungen zumindest in Teilen vom Kontext Schulklasse abhängen. Die Differenzwerte bezüglich der Einschätzung zum Bullying waren in geringerem Ausmaß vom Klassenkontext abhängig (ICC = .07). Aus Platzgründen wird im Folgenden nur noch auf die Urteilsdiskrepanzen zu Devianz/ Delinquenz, nicht aber zum Bullying eingegangen, da die Ergebnisse für beide Skalen sehr ähnlich waren. Als möglicher Indikator für Charakteristika der Schulklasse wurde das beobachtete Bullying auf Klassenebene herangezogen. Abbildung 2 zeigt die Verteilung der Abweichungen in Abhängigkeit vom Klassenkontext. In unauffälligen Klassen ergaben sich häufiger negative Differenzwerte, das heißt die Lehrkräfte schätzten die Kinder im Mittel etwas negativer ein als die Kinder sich selbst. In auffälligen Klassen zeigten sich vermehrt positive Abweichungen (Schülerurteil negativer als Lehrkräfteurteil). Insgesamt waren die Urteile der Lehrkräfte zum Sozialverhalten in ihrer Klasse weitgehend unabhängig von den Urteilen der Kinder zum beobachteten Bullying (auf Ebene der Schulklassen: r s = .21, p > .05). Unter Berücksichtigung der hierarchischen Struktur der Daten wurde abschließend eine Mehrebenenanalyse (HLM 7) gerechnet. Im Folgenden gehen die Differenzwerte zwischen Selbst- und Lehrkräfteurteil im Betrag ein, um interpretierbare Koeffizienten zu erhalten, da sowohl negative wie positive Differenzen als unerwünschte Abweichung von Selbst- und Fremdurteil zu werten sind. Als Level 2-(Makro-)Prädiktor wurde das beobachtete Bullying pro Klasse aufgenommen. Im abschließenden Schritt wurden auf Level 1 die Prädiktoren Geschlecht und Migrationshintergrund aufgenommen. Tabelle 3 stellt die Ergebnisse der Mehrebenenanalyse dar. Das beobachtete Bullying auf Klassenebene stellte sich als signifikanter Prädiktor für den individuellen Differenzwert heraus (Koeffizient = 0.39, p < .01), d. h. in Klassen mit hohem Bullyingaufkommen wichen Selbst- und Fremdurteile stärker voneinander ab. Bei gleichzeitiger Berücksichtigung von Geschlecht und Migrationshintergrund als Level-1-(Mikro-)Prädiktoren blieb das Bullying auf Klassenebene weiterhin signifikanter Prädiktor und die Modellanpassung verbesserte sich weiter. Jedoch erreichte lediglich das Geschlecht die Signifikanzgrenze. Das bedeutet, dass Jungen diskrepanter beurteilt werden als Mädchen. Die Restvarianz aller getesteten Modelle deutet auf größere Anteile noch unaufgeklärter Varianz hin. Diskussion Die Befragung von Lehrkräften zum Sozialverhalten der von ihnen unterrichteten Schulkinder ist sowohl in der klinischen Praxis (vor allem bei ADHS; vgl. Makransky & Bilenberg, 2014; Mattison, Gadow, Sprafkin, Nolan & Schneider, 2003) wie auch in der Forschung (Lonigan, Allan & Phillips, 2016; Weber & Gadow, 2017) üblich. Gerne werden Lehrkräfte ergänzend zu Eltern oder den Kindern selbst befragt (Lösel et al., 2005). Leider hat sich in vergangenen Untersuchungen immer wieder herausgestellt, dass die Einschätzungen von Kind, Lehrkräften und Eltern deutlich divergieren können und meist nur Korrelationen um maximal .30 zu erwarten sind („Informantenproblem“; z. B. Lösel & Schmucker, 2003; Lösel et al., 2005; Sharpley, James & Mavroudis, 1993; Thiels et al., 2008). Auch in unserer Untersuchung fanden sich nur Korrelationen im niedrigen Bereich (zwischen .11 und .29) zwischen Lehrkräfte- und Selbst- 106 Eva Link, Maren Weiss, Maria Arnis, Mark Stemmler urteil der Kinder. Zu Recht wird darauf hingewiesen, dass verschiedene Urteilsperspektiven ergänzend und nicht konkurrent zu verwenden sind (vgl. Lösel et al., 2005), denn immerhin erleben die verschiedenen Beurteilerinnen und Beurteiler die Kinder in unterschiedlichen Kontexten. Zugleich gibt es aber kaum Hinweise, wie genau die Urteile zu integrieren sind und wodurch sie beeinflusst werden (De Los Reyes, 2013; De Los Reyes & Kazdin, 2005). Die vorliegende Arbeit untersucht, welche individuellen und kontextuellen Faktoren die Urteilsdiskrepanzen zwischen Selbst- und Lehrkräfteurteil beeinflussen. Eine genauere Betrachtung der Lehrkräfteurteile zeigte zunächst, dass diese das mögliche Antwortspektrum nicht komplett ausschöpften, sondern sich immer im gemäßigten Bereich bewegten: Bei allen SBQ-Items der Skalen Zerstörung/ Delinquenz und physische Aggression wurde die Antwortalternative „2 = trifft häufig/ genau zu“ nur in sehr wenigen Fällen angekreuzt (immer unter 5 % der Antworten), und entsprechend niedrig fielen die Skalenwerte aus. Im Selbsturteil gaben dagegen immerhin über 40 % der Kinder zu, schon einmal (im weitesten Sinne) delinquentes Verhalten gezeigt zu haben. Wir sind weiterhin davon ausgegangen, dass Lehrkräfte diejenigen Verhaltensweisen, die explizit in der Schule stattfinden (Bullying), deutlicher wahrnehmen als allgemein deviantes/ delinquentes Verhalten, das ja in großen Teilen verdeckt, nachmittags und außerhalb der Schule stattfindet. Dies konnte anhand unserer Daten nicht bestätigt werden: Die Zusammenhänge zwischen Lehrerurteil und Bullying beziehungsweise selbstberichteter Delinquenz waren sehr ähnlich. Unsere Daten weisen darauf hin, dass die Selbst- und Lehrkräfteurteile bei Jungen insgesamt stärker divergieren als bei Mädchen (vgl. Roos et al., 2016; Thiels et al., 2008). Allerdings war keine systematische Verzerrung in eine Richtung festzustellen, das heißt, die Jungen schätzten sich teils als auffälliger, teils aber auch als unauffälliger ein als die Lehrkräfte dies taten. Dasselbe gilt bei Betrachtung des Migrationshintergrundes: Auch bei Kindern mit Migrationshintergrund wichen Selbst- und Fremdeinschätzungen in beide Richtungen stärker voneinander ab als bei Kindern ohne Migrationshintergrund (vgl. Mason et al., 2014). Während also stärkere Urteilsdivergenzen bei Jungen und bei Kindern mit Migrationshintergrund festzustellen waren, legen unsere Daten immerhin keine systematische Benachteiligung bestimmter Gruppen durch die Lehrkräfte nahe. Neben diesen individuell-schülerbezogenen Einflüssen sind auch Einflüsse auf Klassenebene zu vermuten, was unseres Wissens nach aber bislang für das kindliche Sozialverhalten - im Gegensatz zu Leistungsmaßen (Südkamp & Möller, 2009) - nicht untersucht wurde. In unserer Untersuchung fanden sich erste Hinweise darauf: In Klassen mit hohem Bullyingaufkommen (beurteilt von allen befragten Kindern einer Klasse) wichen Selbst- und Fremdurteil deutlicher voneinander ab als in ruhigeren Klassen. Diese Abweichungen kamen in erster Linie dadurch zustande, dass das mittlere Lehrkräfteurteil kaum mit der von Schülerseite berichteten Auffälligkeit der Klasse zusammenhing. Es liegt also nahe, dass sich die Lehrkräfte in ihrer Beurteilung einzelner Kinder eher an einer klasseninternen Norm orientieren. Dies wirft durchaus Probleme bei der diagnostischen Beurteilung einzelner Kinder auf: Je nach Klassenzusammensetzung könnte ein Kind in einer Klasse durch die Lehrkraft noch als unauffällig, in einer anderen Klasse aber schon als auffällig eingeschätzt werden. Um der hierarchischen Datenstruktur gerecht zu werden, wurden diese Ergebnisse in einer Mehrebenenanalyse überprüft und verifiziert: Sowohl das Geschlecht der Kinder wie auch die Auffälligkeit der gesamten Klasse beeinflusste die Diskrepanz zwischen Selbst- und Fremdurteil. Aus methodischen Gründen wurde in den Mehrebenenanalysen mit dem Betrag der Urteilerdiskrepanzen als abhängiger Variable gerechnet, wobei Informationen über die Richtung der Diskrepanzen verlorengehen. Für die Integration von Angaben verschiedener Urteiler sind Abweichungen in beide Richtungen Diskrepanzen zwischen Selbst- und Lehrkräfteurteil 107 gleichermaßen problematisch, weshalb dieses Vorgehen zur Beantwortung unserer Fragestellungen gerechtfertigt erscheint, zumal in vorausgehenden Analysen keine systematische Abweichung der Urteile für bestimmte Gruppen festgestellt werden konnte. Dennoch soll an dieser Stelle darauf hingewiesen werden, dass es in Anbetracht der daraus resultierenden Konsequenzen einen Unterschied macht, ob Lehrkräfte das Verhalten ihrer Schülerinnen und Schüler als problematischer oder unproblematischer einschätzen als diese selbst. Unsere Daten sind nur etwas eingeschränkt für die Durchführung von Mehrebenenanalysen geeignet: Auf der einen Seite ist die Hierarchie der Datenstruktur wesentlich komplexer als in unserem einfachen Modell angenommen (Schüler in Klassen in Schulen in Stadtteilen), auf der anderen Seite ist die Stichprobe (320 Kinder aus 24 Klassen) recht klein. Die hier vorgestellten Befunde sollten also dringend an größeren Datensätzen überprüft werden. In weiterführenden Untersuchungen sollte auch der Klassenkontext spezifischer erhoben werden als durch die hier verwendeten Aggregatmaße. Weiterhin sind noch andere methodische Limitationen zu nennen. Aufgrund der geringen Teilnahmequote von 56 % der Schülerinnen und Schüler sind die auf Klassenebene aggregierten Daten mit Vorsicht zu betrachten, da jeweils nur die Urteile einer Teilstichprobe pro Klasse berücksichtigt werden konnten. Es ist anzunehmen, dass gerade stärker belastete Familien nicht zur Teilnahme bereit waren, weshalb mögliche Stichprobenverzerrungen zu berücksichtigen sind. Insbesondere ist bedauerlich, dass keine weiteren Informationen über die Lehrkräfte vorlagen, da z. B. die Berufserfahrung einen Einfluss auf das Urteilsverhalten haben kann (Mason et al., 2014). Auch das Geschlecht der Lehrkräfte sollte in zukünftigen Studien berücksichtigt werden, wobei dies aufgrund des äußerst geringen Anteils männlicher Grundschullehrer grundsätzlich nur schwer umzusetzen ist. In unserer Stichprobe wurden beispielsweise nur 3 von 24 Klassen von einem männlichen Lehrer geleitet. Dass Lehrkräfte und Kinder nicht genau dieselben Variablen zum Sozialverhalten bearbeiteten (DBS und BVQ bei den Kindern, SBQ bei den Lehrkräften), limitiert die möglichen Zusammenhänge zwischen Selbst- und Fremdurteil, da Urteilerdiskrepanzen somit zum Teil auch auf den Einsatz unterschiedlicher Messinstrumente zurückzuführen sind. Allerdings sind die Zusammenhänge in unserer Studie nicht wesentlich geringer als in anderen Untersuchungen, die Lehrkräften und Kindern (fast) identische Items zur Beurteilung vorlegten (z. B. Benesch, Görtz-Dorten, Breuer & Döpfner, 2013; Roos et al., 2016). Zudem gibt es Hinweise darauf, dass eine globale Fremdeinschätzung von Verhaltensauffälligkeiten - wie hier durch die Skala Störung des Sozialverhaltens erfolgt - eher gelingt als die differenziertere Beurteilung spezifischer Syndrome (Thiels et al., 2008). In Anlehnung an Lösel und Bender (2014) wurde Bullying mit nur jeweils drei Items pro Subskala (Beobachter-, Täter- und Opferperspektive) erfasst, was ebenfalls kritisch anzumerken ist, jedoch der insgesamt sehr umfangreichen Erhebung geschuldet war. Zur Erhöhung der Validität wäre in zukünftigen Studien daher - wenn möglich - eine umfassendere Erhebung des Konstrukts Bullying wünschenswert. Insbesondere sollten dabei auch relationale Formen von Bullying erfasst werden. Zur weiteren Untersuchung und Bestätigung unserer Befunde sind also Untersuchungen an größeren Stichproben nötig, wobei hier auch Kinder anderer Klassenstufen einbezogen werden sollten, um den Altersbereich der Stichprobe zu erweitern und damit eine erhöhte Generalisierbarkeit der Ergebnisse zu erreichen. Auch detaillierte Informationen über die Lehrkräfte sollten in weiteren Studien eingeholt und in den Analysen berücksichtigt werden. Für die diagnostische Praxis legen unsere Befunde nahe, dringend Algorithmen zu erarbeiten, mit denen Selbst- und Lehrkräfteurteile sinnvoll integriert werden können. Zudem sollten Diagnostiker bei der Instruktion die befragten Lehrkräfte auf mögliche Urteilsverzerrungen hinweisen. 108 Eva Link, Maren Weiss, Maria Arnis, Mark Stemmler Literatur Achenbach, T. M., McConaughy, S. H. & Howell, C.T. (1987). Child/ adolescent behavioral and emotional problems: Implications of cross-informant correlations for situational specificity. Psychological Bulletin, 101, 213 - 232. http: / / dx.doi.org/ 10.1037/ 0033-2909.101. 2.213 Archer, J. (2004). Sex differences in aggression in real-world settings: A meta-analytic review. Review of General Psychology, 8, 291 - 322. http: / / dx.doi.org/ 10.1037/ 1089- 2680.8.4.291 Baier, D., Pfeiffer, C., Rabold, S., Simonson, J. & Kappes, C. (2010). Kinder und Jugendliche in Deutschland: Gewalterfahrungen, Integration, Medienkonsum. Zweiter Bericht zum gemeinsamen Forschungsprojekt des Bundesministeriums des Innern und des KFN (Forschungsbericht Nr. 109). Hannover: Kriminologisches Forschungsinstitut Niedersachsen e.V. Zugriff am 21. 12. 2015 unter http: / / kfn.de/ versions/ kfn/ assets/ fob109.pdf Benesch, C., Görtz-Dorten, A., Breuer, D. & Döpfner, M. (2013). Erfassung aggressionsauslösender und -aufrechterhaltender Faktoren bei Kindern mit oppositionellen und aggressiven Verhaltensstörungen im Eltern-, Lehrer- und Selbsturteil. Zeitschrift für Klinische Psychologie und Psychotherapie, 42, 269 - 279. http: / / dx. doi.org/ 10.1026/ 1616-3443/ a000226 Card, N. A., Sawalani, G. M., Stucky, B. D. & Little, T. D. (2008). Direct and indirect aggression during childhood and adolescence: A meta-analytic review of gender differences, intercorrelations, and relations to maladjustment. Child Development, 79, 1185 - 1229. http: / / dx.doi.org/ 10.1111/ j.1467-8624.2008.01184.x Chang, D. F. & Sue, S. (2003). The effects of race and problem type on teachers’ assessments of student behavior. Journal of Consulting and Clinical Psychology, 71, 235 - 242. http: / / dx.doi.org/ 10.1037/ 0022-006X. 71.2.235 De Los Reyes, A. (2013). Strategic objectives for improving understanding of informant discrepancies in developmental psychopathology research. Development and Psychopathology, 25, 669 - 682. http: / / dx.doi.org/ 10. 1017/ S0954579413000096 De Los Reyes, A. & Kazdin, A. E. (2005). Informant discrepancies in the assessment of childhood psychopathology: A critical review, theoretical framework, and recommendations for further study. Psychological Bulletin, 131, 483 - 509. http: / / dx.doi.org/ 10.1037/ 0033- 2909.131.4.483 Epkins, C. C. (1995). Teachers’ ratings of inpatient children’s depression, anxiety, and aggression: A preliminary comparison between inpatient-facility and community-based teachers’ ratings and their correspondence with children’s self-reports. Journal of Clinical Child Psychology, 24, 63 - 70. http: / / dx.doi.org/ 10.1207/ s15374424jccp2401_8 Graves, S. L., Blake, J. & Kim, E. S. (2012). Differences in parent and teacher ratings of preschool problem behavior in a national sample. Journal of Early Intervention, 34, 151 - 165. http: / / dx.doi.org/ 10.1177/ 1053815112 461833 Ihle, W., Esser, G., Laucht, M. & Schmidt, M. H. (2004). Depressive Störungen und aggressiv-dissoziale Störungen im Kindes- und Jugendalter. Prävalenz, Verlauf und Risikofaktoren. Bundesgesundheitsblatt, Gesundheitsforschung, Gesundheitsschutz, 47, 728 - 735. http: / / dx.doi.org/ 10.1007/ s00103-004-0882-8 Kratzer, V. & Cwielong, I. (2014). Quantitative Befragung mit Kindern. In A. Tillmann, S. Fleischer & K.-U. Hugger (Hrsg.), Handbuch Kinder und Medien (Digitale Kultur und Kommunikation, Bd. 1, S. 183 - 198). Wiesbaden: Springer. http: / / dx.doi.org/ 10.1007/ 978- 3-531-18997-0_14 Lansford, J. E., Skinner, A.T., Sorbring, E., Di Giunta, L., Deater-Deckard, K., Dodge, K. A.,…Chang, L. (2012). Boys’ and girls’ relational and physical aggression in nine countries. Aggressive Behavior, 38, 298 - 308. http: / / dx.doi.org/ 10.1002/ ab.21433 Loeber, R. & Le Blanc, M. (1990). Toward a developmental criminology. Crime and Justice, 12, 375 - 473. http: / / dx.doi.org/ 10.1086/ 449169 Lonigan, C. J., Allan, D. M. & Phillips, B. M. (2016). Examining the predictive relations between two aspects of self-regulation and growth in preschool children’s early literacy skills. Developmental Psychology, 53, 63 - 76. http: / / 10.1037/ dev0000247 Lösel, F. (1975). Handlungskontrolle und Jugenddelinquenz. Stuttgart: Enke. Lösel, F. & Bender, D. (2011). Emotional and antisocial outcomes of bullying and victimization at school: A follow-up from childhood to adolescence. Journal of Aggression, Conflict and Peace Research, 3, 89 - 96. http: / / dx.doi.org/ 10.1108/ 17596591111132909 Lösel, F. & Bender, D. (2014). Aggressive, delinquent, and violent outcomes of school bullying: Do family and individual factors have a protective function? Journal of School Violence, 13, 59 - 79. http: / / dx.doi.org/ 10.10 80/ 15388220.2013.840644 Lösel, F. & Bliesener, T. (2003). Aggression und Delinquenz unter Jugendlichen. Untersuchung von kognitiven und sozialen Bedingungen. München: Wolters Kluwer. Lösel, F., Hacker, S., Jaursch, S., Stemmler, M. & Wallner, S. (2006). Skalen zur Messung sozialen Problemverhaltens bei Vorschul- und Grundschulkindern. Die Deutschen Versionen des Social Behavior Questionnaire (SBQ) für Erzieherinnen und Lehrer. Erlangen: Universität Erlangen. Lösel, F. & Schmucker, M. (2003). Assessor’s bias. In R. Fernández-Ballesteros (Hrsg.), Encyclopedia of psychological assessment (pp. 98 - 101). London: Sage. http: / / dx.doi.org/ 10.4135/ 9780857025753.n21 Lösel, F., Stemmler, M., Beelmann, A. & Jaursch, S. (2005). Aggressives Verhalten im Vorschulalter. Eine Untersuchung zum Problem verschiedener Informanten. In I. Seiffge-Krenke (Hrsg.), Aggressionsentwicklung zwischen Normalität und Pathologie (S. 141 - 167). Göttingen: Vandenhoeck&Ruprecht. http: / / dx.doi.org/ 10. 13109/ 9783666462337.141 Makransky, G. & Bilenberg, N. (2014). Psychometric properties of the parent and teacher ADHD Rating Scale (ADHD-RS): Measurement invariance across gender, age, and informant. Assessment, 21, 694 - 705. http: / / dx.doi.org/ 10.1177/ 1073191114535242 Mason, B. A., Gunersel, A. B. & Ney, E. A. (2014). Cultural and ethnic bias in teacher ratings of behavior: A criterion-focused review. Psychology in the Schools, 51, 1017 - 1030. http: / / dx.doi.org/ 10.1002/ pits.21800 Mattison, R. E., Gadow, K. D., Sprafkin, J., Nolan, E. E. & Schneider, J. (2003). A DSM-IV-referenced teacher rating scale for use in clinical management. Journal of the American Academy of Child and Adolescent Psychiatry, 42, 442 - 449. http: / / dx.doi.org/ 10.1097/ 01. CHI.0000046813.95464.B3 Diskrepanzen zwischen Selbst- und Lehrkräfteurteil 109 Mummendy, H. D. & Grau, I. (2008). Die Fragebogen- Methode (5. Aufl.). Göttingen: Hogrefe. Olweus, D. (1989). The Olweus Bully/ Victim Questionnaire. Norway: University of Bergen. Olweus, D. (1994). Annotation: Bullying at school: Basic facts and effects of a school based intervention program. Journal of Child Psychology and Psychiatry, 35, 1171 - 1190. http: / / dx.doi.org/ 10.1111/ j.1469-7610. 1994.tb01229.x Petermann, F. & Petermann, U. (2013). Störungen des Sozialverhaltens. Kindheit und Entwicklung, 22, 123 - 126. http: / / dx.doi.org/ 10.1026/ 0942-5403/ a000108 Ramirez, R. D. de & Shapiro, E. S. (1998). Teacher ratings of attention deficit hyperactivity disorder symptoms in hispanic children. Journal of Psychopathology and Behavioral Assessment, 20, 275 - 293. http: / / dx.doi.org/ 10. 1023/ A: 1021934705392 Remschmidt, W. (Hrsg.). (2009). Kinderdelinquenz. Gesetzesverstöße Strafunmündiger und ihre Folgen. Heidelberg: Springer Medizin. http: / / dx.doi.org/ 10.1007/ 978-3-6 42-01137-5 Roos, S., Lohbeck, A., Petermann, F., Petermann, U., Schultheiß, J., Nitkowski, D. & Petersen, R. (2016). Fremd- und Selbsturteile von Lehrern und Schülern im Rahmen psychologischer Diagnostik. Zeitschrift für Psychiatrie, Psychologie und Psychotherapie, 64, 199 - 207. http: / / dx.doi.org/ 10.1024/ 1661-4747/ a00 0279 Rønning, J. A., Sourander, A., Kumpulainen, K., Tamminen, T., Niemelä, S., Moilanen, I.,… Almgvist, F. (2009). Cross-informant agreement about bullying and victimization among eight-year-olds: Whose information best predicts psychiatric caseness 10 - 15 years later? Social Psychiatry and Psychiatric Epidemiology, 44, 15 - 22. http: / / dx.doi.org/ 10.1007/ s00127-008-03 95-0 Sharpley, C., James, A.-M. & Mavroudis, A. (1993). Selfratings versus teacher-ratings of adolescents’ type A behavior pattern in the normal classroom. Psychology in the Schools, 30, 119 - 124. http: / / dx.doi.org/ 10.10 02/ 1520-6807(199304)30: 2<119: : AID-PITS231030 0203>3.0.CO; 2-M Südkamp, A. & Möller, J. (2009). Referenzgruppeneffekte im Simulierten Klassenraum. Zeitschrift für Pädagogische Psychologie, 23, 161 - 174. http: / / dx.doi.org/ 10.10 24/ 1010-0652.23.34.161 Thiels, C. & Schmitz, G. S. (2008). Selbst- und Fremdbeurteilung von Verhaltensauffälligkeiten bei Kindern und Jugendlichen. Kindheit und Entwicklung, 17, 118 - 125. http: / / dx.doi.org/ 10.1026/ 0942-5403.17. 2.118 Tremblay, R. E., Loeber, R., Gagnon, C., Charlebois, R., Lariveé, S. & LeBlanc, M. (1991). Disruptive boys with stable and unstable high fighting behavior patterns during junior elementary school. Journal of Abnormal Child Psychology, 19, 285 - 300. http: / / dx.doi. org/ 10.1007/ BF00911232 Tremblay, R. E., Vitaro, F., Gagnon, C., Piché, C. & Royer, N. (1992). A prosocial scale for the preschool behavior questionnaire: Concurrent and predictive correlates. International Journal of Behavior Development, 15, 227 - 245. http: / / dx.doi.org/ 10.1177/ 016502549201 500204 Weber, R. J. & Gadow, K. D. (2017). Relation of psychiatric symptoms with epilepsy, asthma, and allergy in youth with ASD vs. psychiatry referrals. Journal of Abnormal Child Psychology, 45, 1247 - 1257. http: / / dx. doi.org/ 10.1007/ s10802-016-0212-2 Wolke, D., Woods, S., Stanford, K. & Schulz, H. (2001). Bullying and victimization of primary school children in England and Germany: Prevalence and school factors. British Journal of Psychology, 92, 673 - 696. http: / / dx.doi.org/ 10.1007/ s10802-013-9832-y Mag. rer. nat. Eva Link Dr. Maren Weiss Dipl.-Krim. Maria Arnis Prof. Dr. Mark Stemmler Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU) Lehrstuhl für Psychologische Diagnostik, Methodenlehre und Rechtspsychologie Nägelsbachstr. 49 c D-91052 Erlangen E-Mail: eva.link@fau.de maren.weiss@fau.de maria.arnis@fau.de mark.stemmler@fau.de
