eJournals Psychologie in Erziehung und Unterricht 64/3

Psychologie in Erziehung und Unterricht
3
0342-183X
Ernst Reinhardt Verlag, GmbH & Co. KG München
71
2017
643

Empirische Arbeit: Überprüfung der Validität der Skalen KES-R und KRIPS-R zur Erfassung der pädagogischen Qualität in Kindertageseinrichtungen

71
2017
Daniela Mayer
Kathrin Beckh
Daten der Nationalen Untersuchung zur Bildung, Betreuung und Erziehung in der Frühen Kindheit (NUBBEK) wurden analysiert, um die psychometrischen Eigenschaften der revidierten Kindergarten-Skala (KES-R) und der revidierten Krippen-Skala (KRIPS-R) zur Erfassung der pädagogischen Qualität in Kindertageseinrichtungen zu untersuchen. Die Stichprobe bestand aus n=270 Einrichtungen für Kinder im Alter von drei bis sechs Jahren und n=245 Einrichtungen für Kinder unter drei Jahren. Die vorliegende Studie repliziert bisherige Ergebnisse zur Antwortprozess-, strukturellen und Kriteriumsvalidität der amerikanischen Originalversion Early Childhood Environment Rating Scale (ECERS-R). Das Partial Credit Modell (PCM) deckte auf, dass die Ratingkategorien nicht entsprechend der angenommenen ordinalen Struktur geordnet sind. Faktorenanalysen identifizierten keinen einheitlichen globalen Qualitätsfaktor, sondern drei Faktoren bei der KES-R und zwei Faktoren bei der KRIPS-R. Im Hinblick auf die Kriteriumsvalidität ergaben Regressionsanalysen keine signifikanten Zusammenhänge der KES-R bzw. KRIPS-R mit kindlichen Entwicklungsmaßen, bei den alternativen Qualitätsmaßen waren nur die Zusammenhänge mit Arnetts Caregiver Interaction Scale signifikant. Implikationen für die Anwendung und Revision der Skalen sowie für die Entwicklung von Instrumenten zur Erfassung der Betreuungsqualität in Kindertageseinrichtungen werden diskutiert.
3_064_2017_003_0181
n Empirische Arbeit Psychologie in Erziehung und Unterricht, 2017, 64, 181 -202 DOI 10.2378/ peu2017.art12d © Ernst Reinhardt Verlag München Basel Überprüfung der Validität der Skalen KES-R und KRIPS-R zur Erfassung der pädagogischen Qualität in Kindertageseinrichtungen Ergebnisse der NUBBEK-Studie Daniela Mayer, Kathrin Beckh Staatsinstitut für Frühpädagogik, München Zusammenfassung: Daten der Nationalen Untersuchung zur Bildung, Betreuung und Erziehung in der Frühen Kindheit (NUBBEK) wurden analysiert, um die psychometrischen Eigenschaften der revidierten Kindergarten-Skala (KES-R) und der revidierten Krippen-Skala (KRIPS-R) zur Erfassung der pädagogischen Qualität in Kindertageseinrichtungen zu untersuchen. Die Stichprobe bestand aus n = 270 Einrichtungen für Kinder im Alter von drei bis sechs Jahren und n = 245 Einrichtungen für Kinder unter drei Jahren. Die vorliegende Studie repliziert bisherige Ergebnisse zur Antwortprozess-, strukturellen und Kriteriumsvalidität der amerikanischen Originalversion Early Childhood Environment Rating Scale (ECERS-R). Das Partial Credit Modell (PCM) deckte auf, dass die Ratingkategorien nicht entsprechend der angenommenen ordinalen Struktur geordnet sind. Faktorenanalysen identifizierten keinen einheitlichen globalen Qualitätsfaktor, sondern drei Faktoren bei der KES-R und zwei Faktoren bei der KRIPS-R. Im Hinblick auf die Kriteriumsvalidität ergaben Regressionsanalysen keine signifikanten Zusammenhänge der KES-R bzw. KRIPS-R mit kindlichen Entwicklungsmaßen, bei den alternativen Qualitätsmaßen waren nur die Zusammenhänge mit Arnetts Caregiver Interaction Scale signifikant. Implikationen für die Anwendung und Revision der Skalen sowie für die Entwicklung von Instrumenten zur Erfassung der Betreuungsqualität in Kindertageseinrichtungen werden diskutiert. Schlüsselbegriffe: Pädagogische Qualität, KES-R, KRIPS-R, Item-Response-Modellierung, Validität Examining the Validity of the KES-R and KRIPS-R: Results From the German National Study of Child Care in Early Childhood (NUBBEK) Summary: The psychometric properties of the revised Kindergarten-Skala (KES-R) and the revised Krippen-Skala (KRIPS-R) were examined using data from the German National Study of Child Care in Early Childhood (NUBBEK) involving n = 270 child care centers for threeto six-year-old children and n = 245 child care centers for children under the age of three. Our findings on the validity of the KES-R/ KRIPS-R replicate prior research on the American original version Early Childhood Environment Rating Scale’s (ECERS-R) response process validity, structural validity, and criterion validity. The Partial Credit Model (PCM) identified disorder of rating categories. Factor analyses did not identify a single global factor of quality of child care, but three factors for the KES-R and two factors for the KRIPS-R. Concerning the criterion validity, regression analyses revealed no significant links for predicting child outcomes, for predicting alternative measures of child care quality only associations with Arnett’s Caregiver Interaction Scale were significant. Implications for the use and revision of the scales and the development of other measures of child care quality are discussed. Keywords: Child care quality, KES-R, KRIPS-R, item response modeling, validity 182 Daniela Mayer, Kathrin Beckh In vielen Ländern haben sich die Rollen von Frauen und Männern im Familienleben in den letzten Jahrzehnten verändert und die Doppelverdiener-Familie ist häufig eine finanzielle Notwendigkeit geworden. Infolgedessen stieg die Inanspruchnahme von Kindertagesbetreuung und die Zeit, die Kinder in außerfamiliärer Betreuung verbringen, an (z. B. Bundesministerium für Familie, Senioren, Frauen und Jugend, 2014). Damit rückte auch die Frage nach der Qualität der Kindertagesbetreuung und deren Einfluss auf die kindliche Entwicklung in den Vordergrund. In Deutschland wurde die Qualität der Kindertagesbetreuung seit den 1990er Jahren meist mit der Kindergartenbzw. Krippen-Skala erfasst (KES: Tietze, Schuster & Roßbach, 1997; KES-R: Tietze, Schuster, Grenner & Roßbach, 2007; KRIPS-R: Tietze, Bolz, Grenner, Schlecht & Weller, 2007). Hierbei handelt es sich um die deutschsprachigen Adaptionen der Early Childhood Environment Rating Scale (ECERS: Harms & Clifford, 1980; ECERS-R: Harms, Clifford & Cryer, 1998) bzw. der Infant/ Toddler Environment Rating Scale (ITERS: Harms, Cryer & Clifford, 1990; ITERS-R: Harms, Cryer & Clifford, 2003), die seit mehr als 30 Jahren in den USA und mehr als 20 Ländern weltweit eingesetzt werden. KES-R und KRIPS-R wurden in der Nationalen Untersuchung zur Bildung, Betreuung und Erziehung in der Frühen Kindheit (NUBBEK) bundesweit angewandt, um die kindliche Entwicklung im Zusammenhang mit der Qualität familiärer und außerfamiliärer Betreuung zu betrachten (Beckh, Mayer, Berkic & Becker- Stoll, 2015; Tietze et al., 2013). Vergleichbar mit den Ergebnissen der Untersuchungen Mitte der 1990er Jahre bescheinigen die Daten der NUBBEK-Studie den deutschen Kindergärten und Krippen trotz großer Umstrukturierungsmaßnahmen im Früherziehungssystem in Deutschland (z. B. Einführung von Bildungsplänen, Curricula für den Vorschulbereich) im Durchschnitt nur „mittelmäßige“ Qualität. Die Ergebnisse „mittelmäßiger“ Qualität sind konsistent sowohl mit anderen europäischen Studien als auch mit Studien in den USA und weltweit (vgl. Meta-Analyse Vermeer, van IJzendoorn, Cárcamo & Harrison, 2016). Daher stellt sich die Frage, ob in den letzten Jahrzehnten tatsächlich keine Veränderungen in der Prozessqualität in Kindertageseinrichtungen stattgefunden haben oder ob das Ergebnis einer konstant „mittelmäßigen“ Qualität vielmehr ein Problem der Validität der verwendeten Beobachtungsinstrumente zur Erfassung der Betreuungsqualität darstellt. Der vorliegende Beitrag untersucht die Validität der Skalen KES-R und KRIPS-R anhand der Daten der NUBBEK-Studie. Qualitätskonzept und Aufbau von KES-R und KRIPS-R Die Definition von Prozessqualität der KES-R/ KRIPS-R basiert auf empirischem Wissen zur außerfamiliären Kindertagesbetreuung und stellt Qualitätsstandards dar, die von Expertinnen bzw. Experten, Forscherinnen bzw. Forschern und Praktikerinnen bzw. Praktikern unabhängig ihres kulturellen oder theoretischen Hintergrundes als bedeutsam angesehen werden (Tietze, Schuster et al., 2007). Prozessqualität bezieht sich dabei auf die Erfahrungen, die Kinder im Umfeld der außerfamiliären Betreuung machen, wobei der Fokus auf den Interaktionen mit Betreuungspersonen und Kindern, der Ausstattung und den Aktivitäten liegt (Phillipsen, Burchinal, Howes & Cryer, 1997). Entsprechend des Qualitätskonzepts der Skalen sollte die außerfamiliäre Kindertagesbetreuung folgende Grundbedürfnisse von Kindern befriedigen (Clifford, Reszka & Rossbach, 2010): Sicherheit, Unterstützung des Aufbaus und der Aufrechterhaltung von positiven Beziehungen sowie Lernmöglichkeiten durch eigene Erfahrung. Diese drei Qualitätskomponenten müssen gegeben sein, um eine hohe Betreuungsqualität gewährleisten zu können. Obwohl KES-R und KRIPS-R weder auf einem bestimmten pädagogischen Konzept noch auf einer spezifischen entwicklungspsychologischen Theorie beruhen, ist der Fokus auf die Befriedigung von physiologischen und psychologischen Grundbedürfnissen von Kindern als Pädagogische Qualität in Kindertageseinrichtungen 183 wichtige Voraussetzung für eine gesunde Entwicklung konsistent mit entwicklungspsychologischen Theorien, wie beispielsweise der Selbstbestimmungstheorie (vgl. Deci & Ryan, 1985; Ryan & Deci, 2000) oder der Bindungstheorie (vgl. Ainsworth, 1979; Bowlby, 1969). Beide Theorien betonen die Bedeutung von sicheren und vertrauensvollen Beziehungen sowie die Rolle von selbstständigem Explorieren und Lernen als wichtige Determinanten für eine gesunde Entwicklung. KES-R und KRIPS-R sind analog aufgebaut und bestehen aus 43 bzw. 41 Merkmalen, die sieben Subskalen zugeordnet sind (vgl. Tab. 1). Diese Subskalen beinhalten Aspekte von (1) Platz und Ausstattung, (2) Betreuung und Pflege der Kinder, (3) sprachliche und kognitive Anregungen, (4) Aktivitäten, (5) Interaktionen, (6) Strukturierung der pädagogischen Arbeit sowie (7) Eltern und Erzieherinnen. Die Beurteilung erfolgt auf einer siebenstufigen Einschätzskala von unzureichender bis ausgezeichneter Qualität, dabei sind die ungeraden Kategorien jedes Items anhand qualitativer Indikatoren beschrieben. Die qualitativen Indikatoren sollen erfassen, inwieweit die Grundbedürfnisse der Kinder (Sicherheit, Beziehungen, Lernanregung) in einem bestimmten Kontext berücksichtigt sind. Um hohe Werte in einem Item zu erzielen, müssen auch alle qualitativen Indikatoren der niedrigeren Kategorien erfüllt sein. Zwar sollten idealerweise in Einrichtungen mit hoher Qualität alle Qualitätskomponenten erfüllt sein, aus methodischer Sicht ist es jedoch problematisch, dass die Indikatoren eines einzelnen Items unterschiedliche Qualitätskomponenten umfassen. Das fällt insbesondere deshalb ins Gewicht, da Indikatoren von höheren Kategorien nur dann bewertet werden, wenn die Indikatoren der niedrigeren Kategorien erfüllt sind (sogenannte Stop-Scoring-Regel). Die meisten Items sind so aufgebaut, dass Indikatoren hinsichtlich der Aspekte Sicherheit und Verfügbarkeit von Materialien sowie Platz und Ausstattung in den niedrigeren Kategorien abgebildet sind, wohingegen die Qualität der Interaktionen und Instruktion in den mittleren und hohen Antwortkategorien eines Items dargestellt sind. So umfasst beispielsweise das KES-R-Item 10 Mahlzeiten/ Zwischenmahlzeiten in verschiedenen Antwortkategorien mehrere Dimensionen, wie z. B. Ernährung, Hygiene, Fachkraft-Kind-Interaktion, Sprache etc. Wenn z. B. eine Einrichtung hohe Ausprägungen auf einzelnen Dimensionen (z. B. Fachkraft-Kind-Interaktion, Sprache), aber gleichzeitig niedrige Ausprägungen auf anderen Dimensionen (z. B. Hygiene) zeigt, müsste entsprechend der Stop-Scoring-Regel hier ein niedriger Wert vergeben werden, da die Voraussetzungen hinsichtlich Hygiene nicht erfüllt sind. Um die höhere Ausprägung in anderen Qualitätsaspekten abbilden zu können, müsste man auf die Anwendung der Stop-Scoring- Regel verzichten. Validität der KES-R und KRIPS-R Es ist davon auszugehen, dass die Vermischung verschiedener Qualitätsaspekte zu Validitätsproblemen der KES-R/ KRIPS-R führt. Antwortprozess-Validität In der Item-Response-Theorie (IRT) wird der Antwortprozess der Bearbeitung eines Items modelliert. Die Abbildung von verschiedenen Qualitätsaspekten in den Antwortkategorien eines einzelnen Items kann zu Problemen der Antwortprozess-Validität führen. Bei Anwendung der Stop-Scoring-Regel wird bei einem Item aufgrund der Indikatoren einer Dimension ein niedriger Wert vergeben, aber die höhere Qualität der Einrichtung in anderen Dimensionen wird nicht erfasst. Wenn man alternativ auf die Anwendung der Stop-Scoring-Regel verzichten würde, würde bei demselben Item aufgrund von Indikatoren anderer Dimensionen ein höherer Wert vergeben werden. In diesem Fall würde die niedrigere Qualität der Einrichtung in der anderen Dimension nicht erfasst werden. In jedem Fall ist es nicht möglich, alle Dimensionen gleichzeitig in einem Item zu erfassen. Probleme der Antwortprozess-Validität haben Auswirkungen auf die strukturelle Validität und Kriteriumsvalidität der Skala. 184 Daniela Mayer, Kathrin Beckh Strukturelle Validität Aufgrund der Vermischung von mehreren Qualitätsaspekten innerhalb eines Items ist anzunehmen, dass sich die Struktur der Skala empirisch als instabil erweist, da diese stark von Merkmalen der jeweiligen Stichprobe an Einrichtungen abhängig ist. Wenn beispielsweise die Stichprobe viele Einrichtungen umfasst, die die Gesundheits- und Sicherheitsanforderungen (abgebildet in den unteren Kategorien der Skala) nicht erfüllen, werden diese Items vermutlich auf einem Sicherheits-Faktor laden. Wenn die meisten Einrichtungen allerdings diesen Anforderungen gerecht werden, werden dieselben Items wahrscheinlich auf einem anderen Faktor laden (z. B. Sprache/ Interaktion oder Aktivitäten). Kriteriumsvalidität Des Weiteren ist davon auszugehen, dass die Zusammenhänge zwischen Betreuungsqualität und kindlichen Entwicklungsmaßen und anderen Qualitätsmaßen aufgrund der schwachen psychometrischen Eigenschaften der Skalen KES-R und KRIPS-R unterschätzt werden. In einer aktuellen Studie untersuchten Gordon, Fujimoto, Kaestner, Korenman und Abner (2013) anhand einer breiten analytischen Vorgehensweise verschiedene Validitätsaspekte. Mithilfe von IRT-Modellen identifizierten Gordon und Kollegen (2013) nicht geordnete Antwortkategorien und zeigten damit Probleme der Antwortprozess-Validität der Skala auf. In Faktorenanalysen wurden weder ein globaler Qualitätsfaktor noch die Subskalen gefunden, dies repliziert die Ergebnisse früherer Studien (z. B. Burchinal et al., 2008; Cassidy, Hestenes, Hegde, Hestenes & Mims, 2005; Clifford et al., 2010; Early et al., 2006; Perlman et al., 2004; Sakai, Whitebook, Wishard & Howes, 2003). Ergebnisse zur Kriteriumsvalidität stimmen ebenfalls mit früheren Studien (z. B. Early et al., 2006; Howes et al., 2008; Kuger, Kluczniok, Kaplan & Roßbach, 2015; Mashburn et al., 2008; Sylva et al., 2006; Tietze et al., 2013) überein und zeigten geringe Zusammenhänge mit kindlichen Entwicklungsmaßen und geringe bis moderate Zusammenhänge mit anderen Qualitätsmaßen (z. B. Ausbildung und Weiterbildung der Fachkräfte, Fachkraft-Kind-Schlüssel, Fachkraft-Kind-Interaktion). In einer eigenen Studie konnten die Ergebnisse von Gordon und Kollegen (2013) hinsichtlich der Validität der ECERS-R für die deutsche Version der Skala KES-R repliziert werden (Mayer & Beckh, 2016). In der vorliegenden Studie wird darüber hinaus die bisher kaum untersuchte Validität der KRIPS-R hinsichtlich der drei Aspekte Antwortprozess-Validität, strukturelle Validität und Kriteriumsvalidität betrachtet. Da der Einsatz von KRIPS-R und KES-R in Forschung und Praxis im deutschsprachigen Raum weit verbreitet ist, werden im Folgenden die Ergebnisse zur Validität beider Skalen dargestellt. Methode Daten Für die Analysen wurden Daten der Nationalen Untersuchung zur Bildung, Betreuung und Erziehung in der Frühen Kindheit (NUBBEK) herangezogen. Bei NUBBEK handelt es sich um eine national angelegte Studie, in deren Mittelpunkt die Zusammenhänge zwischen der Qualität familiärer und außerfamiliärer Betreuung und der kindlichen Entwicklung stehen. Da ein Schwerpunkt der Studie auf Familien mit Migrationshintergrund lag, sind Immigrantinnen und Immigranten aus der Türkei und der früheren Sowjetunion, die die beiden größten Zuwanderergruppen in Deutschland darstellen, in der Stichprobe überrepräsentiert. Die Datenerhebungen fanden 2010/ 2011 statt. Die Stichprobe besteht aus allen Kindertageseinrichtungen der NUBBEK-Studie, für die Beobachtungen auf den Skalen KES-R bzw. KRIPS-R vorlagen. In die vorliegenden Analysen gingen Daten von 270 Einrichtungen für Kinder im Alter von drei bis sechs Jahren und 245 Einrichtungen für Kinder unter drei Jahren ein. Die Rekrutierung der NUBBEK- Stichprobe erfolgte in einem mehrstufigen Verfahren. In acht Bundesländern 1 wurden 32 Gebiets- 1 Bayern, Baden-Württemberg, Berlin, Brandenburg, Niedersachen, Nordrhein-Westfalen, Sachsen und Sachsen-Anhalt. Pädagogische Qualität in Kindertageseinrichtungen 185 einheiten ausgewählt, die in ihrer Gesamtheit den Durchschnitt und die Streuung der Bundesrepublik Deutschland im Hinblick auf relevante Merkmale der sozialen und wirtschaftlichen Lage sowie der Versorgung und Nutzung frühkindlicher Betreuungseinrichtungen widerspiegeln (Bien, 2011). Innerhalb der ausgewählten Gebietseinheiten erfolgte eine Zufallsziehung aus der Gesamtheit aller öffentlich geförderten institutionellen Betreuungseinrichtungen. In diesen Einrichtungen wurden Kinder für die Teilnahme rekrutiert, die den Studienkriterien (Alter zwischen 47 und 60 Monaten bzw. zwischen 29 und 36 Monaten, mindestens 15 Stunden pro Woche in außerfamiliärer Betreuung) entsprachen und deren Eltern ihr Einverständnis gaben. Im Durchschnitt nahmen je Einrichtung 2.80 Kinder (SD = 1.50, Spannweite 1 bis 8) teil. Die Stichprobe der Vierjährigen umfasste insgesamt 714 Kinder (M = 53.92 Monate, SD = 3.72) und ihre Familien, davon 48,7 % Jungen und 29,8 % Kinder mit türkischem oder russischem Migrationshintergrund. Die Stichprobe der Zweijährigen bestand aus insgesamt 553 Kindern (M = 33.14 Monate, SD = 2.02) und ihren Familien, davon 51,4 % Jungen und 18,3 % Kinder mit türkischem oder russischem Migrationshintergrund. Erhebungsinstrumente Pädagogische Qualität Geschulte Beobachterinnen und Beobachter beurteilten jede Einrichtung mit Kindern im Alter von drei bis sechs Jahren mithilfe der KES-R (Tietze, Schuster et al., 2007) bzw. jede Einrichtung mit Kindern unter drei Jahren mithilfe der KRIPS-R (Tietze, Bolz et al., 2007). Die Items und Subskalen der KES-R bzw. KRIPS-R sind in Tabelle 1 dargestellt. Von den ursprünglich 43 KES-R-Items gingen 34 und von den 41 KRIPS-R-Items 30 in die Analysen ein ( α KES-R = .88; α KRIPS-R = .86). Drei KES-R-Items (11 Ruhe/ Schlafzeiten: 15,6 %, 27 Nutzung von Fernsehen, Video und/ oder Computer: 74,4 %, 37 Vorkehrungen für Kinder mit Behinderungen: 83,0 %) bzw. zwei KRIPS-R-Items (23 Nutzung von Fernsehen, Video und/ oder Computer: 90,2 %, 32 Vorkehrungen für Kinder mit Behinderungen: 86,5 %) wurden von den Analysen ausgeschlossen, da diese Items für einen Großteil der Einrichtungsgruppen als Nicht anwendbar kodiert wurden (siehe Prozentangaben in Klammern). Die auf den Berichten der pädagogischen Fachkräfte beruhende Subskala Eltern und Erzieherinnen (KES-R-Items 38 - 43 bzw. KRIPS-R-Items 33 - 37) sowie die beiden zusätzlichen KRIPS-R-Items (40 Eingewöhnung, 41 Einbezug der familialen Lebenswelt), die ebenfalls nicht beobachtet, sondern von den Fachkräften erfragt werden müssen, wurden von den Analysen ausgeschlossen, um die Vergleichbarkeit der Ergebnisse mit der Publikation von Gordon et al. (2013) zu gewährleisten. Der Ausschluss dieser Items ist außerdem konsistent mit früheren Studien (z. B. Clifford et al., 2005; Mashburn et al., 2008; Perlman et al., 2004) und der neuen amerikanischen Version ECERS-3 (Harms, Clifford & Cryer, 2015). Die KES-R/ KRIPS-R-Items werden auf einer siebenstufigen Ratingskala eingeschätzt, dabei steht 1 für unzureichende Qualität, 3 für minimale Qualität, 5 für gute Qualität und 7 für ausgezeichnete Qualität. Es wurde die Stop-Scoring-Regel angewandt, d. h., höhere Werte wurden nur dann vergeben, wenn Indikatoren von niedrigeren Kategorien erfüllt waren. Ein Gesamtwert der Betreuungsqualität wurde jeweils durch Bildung eines Mittelwerts über alle in die Analysen eingeschlossenen Items berechnet. In Übereinstimmung mit früheren Studien (z. B. Gordon et al., 2013) zeigten die Faktorenanalysen die konzeptuell entwickelten Subskalen nicht. Daher wurden keine weiteren Analysen auf Basis der Subskalen vorgenommen. Alternative Maße der Betreuungsqualität Zur Überprüfung der Kriteriumsvalidität von KES-R/ KRIPS-R wurden die Fachkraft-Kind-Interaktionsqualität, das pädagogische Ausbildungsniveau der Fachkraft und die Fachkraft-Kind-Beziehung herangezogen. Bei den alternativen Qualitätsmaßen wurden die im Datensatz vorhandenen relevanten erfassten Merkmale herangezogen, auf weitere Strukturmerkmale wurde verzichtet, da es um die Validierung und nicht um die Vorhersage der Prozessqualität ging. Diese alternativen Qualitätsmaße wurden entweder durch dieselbe Beobachterin bzw. Beobachter, die bzw. der auch die KES-R/ KRIPS-R beurteilte, eingeschätzt oder durch Interviews oder schriftliche Fragebögen erfasst. Interaktionsqualität. Arnetts Caregiver Interaction Scale (CIS; Arnett, 1989) ist eine auf Beobachtung basierende vierstufige Ratingskala zur Erfassung von Interaktionen zwischen Betreuungspersonen und Kindern anhand von 26 Items in vier Dimensionen (Feinfühligkeit, Bestrafung/ Härte, Distanziertheit/ Zurückweisung, Nachgiebigkeit/ Vernachlässigung). Wie bei 186 Daniela Mayer, Kathrin Beckh Cryer, Tietze, Burchinal, Leal und Palacios (1999) wurde die drei-Faktoren-Struktur (ohne die Items der Subskala Nachgiebigkeit/ Vernachlässigung) von Whitebook, Howes und Phillips (1989) beibehalten und ein Mittelwert aus 23 Items gebildet ( α = .94). Pädagogische Ausbildung der Fachkraft. Die pädagogische Fachkraft wurde zum Niveau ihrer pädagogischen Ausbildung befragt. Für die Analysen wurde unterschieden, ob die Fachkraft über eine pädagogische Ausbildung auf (a) einem höheren Niveau als ein staatlich anerkannte Erzieherin bzw. ein staatlich anerkannter Erzieher (z. B. Bachelor- oder Master- Abschluss in Erziehungswissenschaften, Psychologie oder Soziale Arbeit), (b) auf dem Niveau einer staatlich anerkannten Erzieherin bzw. eines staatlich anerkannten Erziehers oder (c) auf einem niedrigeren Niveau als eine staatlich anerkannte Erzieherin bzw. ein staatlich anerkannter Erzieher (z. B. Kinderpflegerin bzw. -pfleger, Praktikantin bzw. Praktikant) verfügte. Fachkraft-Kind-Beziehung. Die Qualität der Fachkraft-Kind-Beziehung wurde anhand der ins Deutsche übersetzten Kurzform der Student Teacher Relationship Scale (STRS; Pianta, 1992) erhoben. Die Fachkraft schätzte für jedes der 15 Items die Beziehung zwischen sich und dem Kind in den Aspekten Nähe und Konflikt auf einem fünfstufigen Antwortformat selbst ein. Aus den einzelnen Ratings wurde durch Mittelwertbildung ein Skalenwert gebildet ( α = .83). Kindliche Entwicklungsmaße Maße der kindlichen Entwicklung dienten ebenfalls als Kriterium zur Überprüfung der Kriteriumsvalidität von KES-R/ KRIPS-R. Bei der Auswahl der kindlichen Entwicklungsmaße wurde angestrebt, die vier wichtigsten Entwicklungsbereiche kognitive, sprachliche, soziale und emotionale Entwicklung abzubilden. Die kindlichen Entwicklungsmaße wurden entweder durch einen standardisierten psychologischen Test oder durch Einschätzungen der Mutter und der pädagogischen Fachkraft erfasst. Kognitive Entwicklung. Um einen Indikator für die kognitive Entwicklung 2 der vierjährigen Kinder zu erhalten, wurde der Mosaik-Test des Hannover-Wechsler-Intelligenztest für das Vorschulalter-III (HAWIVA-III; Ricken, Fritz, Schuck & Preuß, 2007) durchgeführt. Die Kinder wurden dazu aufgefordert, innerhalb einer vorgegebenen Zeit als Modell oder Bild dargebotene Muster von steigender Schwierigkeit mit ein- oder zweifarbigen Bauklötzen nachzubauen. Die in den 17 Aufgaben für richtige Lösungen erzielten Punkte wurden zu einem Summenwert addiert ( α = .85). Sprachliche Fähigkeiten. Der rezeptive Wortschatz in Deutsch wurde anhand einer modifizierten und ins Deutsche übersetzten Version des Peabody Picture Vocabulary Test (PPVT IV; Dunn & Dunn, 2007) erfasst. Die Kinder wurden dazu aufgefordert, zu einem präsentierten Wort auf das dazugehörige Bild der vier dargebotenen Bilder zu zeigen. Für jede richtige Antwort wurde ein Punkt vergeben und zu einem Summenwert addiert. Die Version für die Vierjährigen umfasste 60 Items ( α = .90), die für die Zweijährigen 40 Items ( α = .92). Sozial-emotionale Kompetenzen. Die sozial-emotionalen Kompetenzen der vierjährigen Kinder wurden anhand einer gekürzten, deutschsprachigen Version des Social Skills Improvement Rating System (SSIS; Gresham & Elliot, 2008) erhoben. SSIS umfasst 33 Items, die den Bereichen Selbstbehauptung, Kooperation, Empathie, Engagement und Selbstkontrolle zugeordnet sind. Die Mütter bzw. pädagogischen Fachkräfte bewerteten auf einer vierstufigen Skala für jedes Item, wie oft das Kind das beschriebene Verhalten innerhalb der letzten zwei Monate zeigte. Die Einschätzungen der Mutter bzw. der Fachkraft wurden durch Mittelwertbildung jeweils zu einem Gesamtwert zusammengefasst ( α = .87 bzw. .93). Bei den zweijährigen Kindern wurde eine gekürzte, deutschsprachige Version der Infant Toddler Social Emotional Assessment (ITSEA) von Carter und Briggs-Gowan (2000) durchgeführt. Die Mütter bzw. pädagogischen Fachkräfte bewerteten auf einer dreistufigen Ratingskala für jedes der 26 Items, die die Aspekte Leistungsvermögen, Folgsamkeit, Empathie und prosoziale Peerbeziehungen umfassen, wie deutlich oder oft das genannte Verhalten während des letzten Monats zu beobachten war. Die Einschätzungen der Mutter bzw. der Fachkraft wurden durch Mittelwertbildung jeweils zu einem Gesamtwert zusammengefasst ( α = .79 bzw. .90). 2 Die kognitive Entwicklung der zweijährigen Kinder konnte anhand des Hannover-Wechsler-Intelligenztest für das Vorschulalter-III (Ricken et al., 2007) nicht valide erfasst werden und wurde daher aus den vorliegenden Analysen ausgeschlossen. Pädagogische Qualität in Kindertageseinrichtungen 187 Problemverhalten. Das Problemverhalten der Kinder wurde mittels einer gekürzten, 40 Items umfassenden Version der Child Behavior Checklist (CBCL; Arbeitsgruppe Deutsche Child Behavior Checklist, 2002) von Achenbach (1991, 1992) zu den Bereichen sozialer Rückzug, Ängstlichkeit/ Depression, Aufmerksamkeitsprobleme und aggressives Verhalten erfasst. Die Mütter bzw. pädagogischen Fachkräfte bewerteten auf einer dreistufigen Skala, wie charakteristisch das jeweilige Item das Verhalten des Kindes während der letzten zwei Monate beschreibt. Aus den Bewertungen der Mutter bzw. Fachkraft wurde durch Mittelwertbildung jeweils ein Gesamtwert gebildet ( α = .90 bzw. .91). Kontrollvariablen Um die unterschiedliche Geschichte der außerfamiliären Betreuung in Ost- und West-Deutschland zu berücksichtigen, wurden Dummy-Variablen für die Regionen in die Analysen aufgenommen. Im Hinblick auf Kindmerkmale wurde für Geschlecht, Alter und Migrationshintergrund des Kindes kontrolliert. Kovariaten der Familie umfassten Familiensprache (ob in der Familie überwiegend Deutsch gesprochen wurde oder nicht), Alter der Mutter, Bildung der Mutter (entsprechend der International Standard Classification of Education 1997 [ISCED-97]; Schneider, 2008), Familienstand der Mutter, ob der Partner der Mutter im Haushalt lebte, Erwerbstätigkeit der Mutter und sozio-ökonomischer Status (SES) der Familie. Da etablierte SES-Indizes aufgrund von fehlenden Informationen zur Berufstätigkeit (z. B. ISCO-08) nicht angewandt werden konnten, wurde ein SES-Index aus dem höchsten Bildungsabschluss und der beruflichen Stellung der Mutter bzw. ihres Partners, dem berechneten Nettoäquivalenzeinkommen und der subjektiven Einschätzung der Mutter hinsichtlich der ökonomischen Situation der Familie gebildet. Dieser Index fasst die kombinierten Effekte der sozio-ökonomischen Ressourcen der Familie sowie auch die subjektiven Einschätzungen der Mütter hinsichtlich ihrer finanziellen Situation in einem geschätzten Faktorwert zusammen. Der Index wurde von 0 niedrigster Status bis 100 höchster Status skaliert (siehe auch NUBBEK-Dokumentation der Erhebungsinstrumente; Eckhardt et al., 2012). Analytisches Vorgehen In dem vorliegenden Beitrag wurden drei Validitätsaspekte betrachtet: 1.) Antwortprozess-Validität, 2.) Strukturelle Validität und 3.) Kriteriumsvalidität. 1.) Antwortprozess-Validität Ein Beobachtungsinstrument verfügt über Antwortprozess-Validität, wenn die Kategorien der Ratingskala in der beabsichtigten Art und Weise angewandt werden (Joint Committee on Standards for Educational and Psychological Testing, 1999). Mithilfe von Item-Response-Modellierung wurde die Ordnung der Antwortkategorien jedes KES-R-/ KRIPS-R-Items untersucht. Die Daten wurden anhand des Partial Credit Models (PCM) als ein logistisches Messmodell für polytome Items (Embretson & Reise, 2000; Masters, 1982; Wright & Masters, 1982) mithilfe der Item-Response-Modellierungs- Software ConQuest (Wu, Adams & Wilson, 2005) analysiert. Anhand des PCM kann die Ordnung von Antwortkategorien untersucht werden, da in den Modellrestriktionen benachbarte Kategorienschwellen nicht geordnet sein müssen (Andrich, 1996; Andrich, de Jong & Sheridan, 1997). Um die Ordnung von zwei benachbarten Kategorien eines Items zu untersuchen, wurden die Schwellenparameter (Deltas) betrachtet, die benachbarte Kategorien auf dem latenten Konstrukt der Betreuungsqualität trennen. Dabei wurde basierend auf 95 %-Konfidenzintervallen unterschieden zwischen: (a) geordneten Schwellenparametern, wenn die obere Grenze des Konfidenzintervalls der unteren Schwelle unter der unteren Grenze des Konfidenzintervalls der nächst höheren Schwelle lag; (b) Äquivalenz, wenn sich das Konfidenzintervall der unteren Schwelle und der nächst höheren Schwelle überschnitten, aber die Schwellenparameter der niedrigeren Schwelle und der höheren Schwelle sich richtig anordneten; und (c) nicht geordneten Schwellenparametern, wenn die obere Grenze des Konfidenzintervalls für die nächst höhere Schwelle unter der unteren Grenze des Konfidenzintervalls der nächst niedrigeren Schwelle lag oder wenn die nächst höhere Schwelle unter die niedrigere Schwelle fiel und sich die Konfidenzintervalle dabei überlappten. Darüber hinaus wurden die punktbiserialen Korrelationskoeffizienten der Antwortkategorien untersucht, da diese ein übliches Maß für die Itemqualität darstellen. Punktbiseriale Korrelationen setzen Item- 188 Daniela Mayer, Kathrin Beckh werte mit dem Testgesamtwert in Zusammenhang und zeigen an, ob ein Item zwischen Einrichtungen mit niedriger und hoher Qualität differenziert. Für polytome Items sollen punktbiseriale Korrelationen von negativen Werten für die niedrigen Kategorien zu positiven Werten für die hohen Kategorien ansteigen. 2.) Strukturelle Validität Um die Dimensionalität der KES-R/ KRIPS-R zu untersuchen, wurden Maximum-Likelihood-Faktorenanalysen mit obliquer Rotation mithilfe von Mplus (Muthén & Muthén, 1998 - 2012) berechnet. Zur Interpretation wurden nur Items mit Faktorladungen über .30 berücksichtigt. Zur Beurteilung der Modellanpassung wurden der Comparative-Fit-Index (CFI) und der Root- Mean-Square-Error-of-Approximation (RMSEA) herangezogen. CFI-Werte größer als .95 und RMSEA- Werte um .06 oder niedriger beschreiben einen guten Modell-Fit (Bühner, 2004; Hu & Bentler, 1999). Das Bayesian Information Criteria (BIC) wurde betrachtet, um zu untersuchen, ob ein Modell mit einem globalen Qualitätsfaktor oder ein Modell mit der gefundenen Faktorenstruktur die Daten besser beschreibt. Bei einem Unterschied von zehn oder mehr in den Informationskriteriumswerten stellt das Modell mit dem geringeren Wert das relativ angemessenere Modell dar (Burnham & Anderson, 2002; Raftery, 1995). 3.) Kriteriumsvalidität Ein Instrument verfügt über Kriteriumsvalidität, wenn das Maß signifikant mit etablierten Maßen von ähnlichen Konstrukten und mit relevanten Outcome- Maßen zusammenhängt (Wolfe & Smith, 2007). Eine Überprüfung der Kriteriumsvalidität der KES-R bzw. KRIPS-R bestimmt die Höhe des Zusammenhangs der KES-Rbzw. KRIPS-R-Werte mit alternativen Qualitätsmaßen, wie beispielsweise Arnetts Caregiver Interaction Scale, und kindlichen Outcome- Maßen der kognitiven, sprachlichen und sozialemotionalen Entwicklung. Zur Untersuchung der Kriteriumsvalidität wurden Regressionsanalysen zur Vorhersage von alternativen Qualitätsmaßen und kindlichen Entwicklungsmaßen durch den KES-Rbzw. KRIPS-R-Gesamtwert bzw. durch die gefundenen Faktoren berechnet 3 . Der KES-R-/ KRIPS-R-Gesamtwert bzw. die KES-R-/ KRIPS-R-Faktorwerte wurden jeweils als ein Prädiktor der alternativen Qualitätsmaße bzw. der kindlichen Outcome-Maße in 36 bzw. 24 separaten Regressionsmodellen aufgenommen. Jedes Modell wurde für Merkmale der Region (Ost-/ West-Deutschland), des Kindes (Geschlecht, Alter und Migrationshintergrund) und der Familie (Familiensprache, Alter, Bildung und Familienstand der Mutter, ob der Partner der Mutter im Haushalt lebte, Erwerbstätigkeit der Mutter und SES) kontrolliert. Ergebnisse Die deskriptiven Statistiken der Skalen KES-R und KRIPS-R befinden sich in Tabelle 1. Die deskriptiven Statistiken aller anderen Maße sind im Anhang dargestellt. Antwortprozess-Validität: Ordnung der Antwortkategorien Zur Beurteilung der Antwortprozess-Validität wurden deskriptive Itemstatistiken und IRT- Analysen betrachtet. Sowohl für die KES-R als auch für die KRIPS-R lag die Mehrheit der Items der Subskala Betreuung und Pflege im unteren Bereich der Ratingskala, die Mehrheit der Items der Subskalen Platz und Ausstattung, Aktivitäten, Strukturierung der Pädagogischen Arbeit und Sprachliche und kognitive Anregungen/ Zuhören und Sprechen im mittleren Skalenbereich sowie die Mehrheit der Items der Subskala Interaktionen im mittleren bis oberen Bereich der Skala (aus Platzgründen sind die Ergebnisse nicht abgedruckt, können aber bei den Autorinnen erfragt werden). 3 Um die Abhängigkeit der Kinddaten (Gruppierung der Kinder in Einrichtungsgruppen) zu berücksichtigen, wurden Mehrebenenanalysen mit Mplus berechnet. Aufgrund von Schwankungen in den Clustergrößen (1 bis 8 Zielkinder) und der Clusterzusammensetzung (z. B. Kinder mit Migrationshintergrund sind nicht zufällig auf die Cluster verteilt) kam es bei manchen Variablen zu großen standardisierten Koeffizienten, die jedoch aufgrund von großen Standardfehlern keine Signifikanz erreichten. Die Ergebnisse unterscheiden sich inhaltlich nicht von den hier berichteten Regressionsergebnissen. Pädagogische Qualität in Kindertageseinrichtungen 189 Subskalen / Items M SD KES-R (α = .88) KRIPS-R (α = .86) KES-R / KRIPS-R KES-R / KRIPS-R Platz und Ausstattung 1. Innenraum 2. Mobiliar für Pflege und Spiel 3. Ausstattung für Entspannung 4. Raumgestaltung 5. Rückzugsmöglichkeiten 6. Kindbezogene Ausgestaltung 7. Platz für Grobmotorik 8. Ausstattung für Grobmotorik Platz und Ausstattung 1. Innenraum 2. Mobiliar für Pflege und Spiel 3. Ausstattung für Entspannung 4. Raumgestaltung 5. Kindbezogene Ausgestaltung 3.67 / 3.85 3.69 / 3.44 3.90 / 3.64 4.70 / 3.93 3.73 / - 4.00 / 3.69 4.34 / - 5.08 / - 1.87 / 1.83 2.66 / 2.05 1.47 / 1.24 1.66 / 2.08 1.74 / - 1.38 / 1.00 2.11 / - 1.88 / - Betreuung und Pflege der Kinder 9. Begrüßung / Verabschiedung 10. Mahlzeiten / Zwischenmahlzeiten 11. Ruhe- / Schlafzeiten a 12. Toilette 13. Gesundheitsvorsorge 14. Sicherheit Betreuung und Pflege der Kinder 6. Begrüßung / Verabschiedung 7. Mahlzeiten / Zwischenmahlzeiten 8. Ruhe- / Schlafzeiten 9. Wickeln / Toilette 10. Gesundheitsvorsorge 11. Sicherheit 5.88 / 5.49 1.63 / 1.61 - / 1.69 1.68 / 1.47 2.18 / 1.62 1.48 / 1.51 1.79 / 1.72 1.55 / 1.40 - / 1.55 1.81 / 1.42 1.84 / 1.23 1.43 / 1.23 Sprachliche und kognitive Anregungen 15. Bücher und Bilder 16. Anregung zur Kommunikation 17. Sprache / kognitive Fähigkeiten 18 Allgemeiner Sprachgebrauch Zuhören und Sprechen 14. Nutzung von Büchern 12. Sprachverstehen 13. Sprachgebrauch 3.55 / 3.21 5.19 / 4.91 3.90 / - 4.77 / 4.91 1.56 / 1.56 1.44 / 1.51 1.53 / - 1.59 / 1.63 Aktivitäten 19. Feinmotorische Aktivitäten 20. Künstlerisches Gestalten 21. Musik und Bewegung 22. Bausteine 23. Sand / Wasser 24. Rollenspiel 25. Naturerfahrungen / Sachwissen 26. Mathematisches Verständnis 27. Fernsehen, Video, Computer a 28 Verschiedenartigkeit / Individualität Aktivitäten 15. Feinmotorische Aktivitäten 16. Körperliche Bewegung 17. Künstlerisches Gestalten 18. Musik und Bewegung 19. Bausteine 21. Sand / Wasser 20. Rollenspiel 22. Naturerfahrungen / Sachwissen 23. Fernsehen, Video, Computer a 24. Verschiedenartigkeit / Individualität 4.90 / 4.62 - / 4.18 4.67 / 2.75 3.46 / 2.97 4.63 / 4.22 4.66 / 4.11 4.35 / 4.51 3.79 / 4.61 3.90 / - 2.64 / 2.06 1.40 / 1.47 - / 1.73 1.57 / 2.12 1.47 / 1.53 1.43 / 1.51 1.41 / 1.75 1.20 / 1.07 1.52 / 1.60 1.46 / - 1.38 / 1.14 Interaktionen 29. Beaufsichtigung grobmotor. Aktivit. 30. Allgemeine Beaufsichtigung 31. Verhaltensregeln / Disziplin 32. Erzieher-Kind-Interaktion 33. Kind-Kind-Interaktion Interaktionen 25. Beaufsichtig. Spiel- / Lernaktivitäten 28. Verhaltensregeln / Disziplin 27. Erzieher-Kind-Interaktion 26. Kind-Kind-Interaktion 2.71 / - 2.63 / 2.98 4.29 / 4.42 5.66 / 5.21 5.59 / 5.15 2.09 / - 2.16 / 2.28 1.96 / 1.96 1.85 / 1.90 1.61 / 1.49 Strukturierung der päd. Arbeit 34. Tagesablauf 35. Freispiel 36. Gruppenstruktur 37. Kinder mit Behinderung a Strukturierung der päd. Arbeit 29. Tagesablauf 30. Freispiel 31. Spiel- / Lernangebote in Kleingruppen 32. Kinder mit Behinderung a 2.91 / 4.53 3.36 / 3.56 5.04 / 4.62 1.78 / 1.96 1.91 / 1.87 1.61 / 1.84 Tab. 1: Subskalen und Items der KES-R (Tietze, Schuster et al., 2007; n = 270) bzw. KRIPS-R (Tietze, Bolz et al., 2007; n = 245) u 190 Daniela Mayer, Kathrin Beckh Um die Berechnung des PCM durchführen zu können, sollten pro Antwortkategorie eines Items mindestens zehn Fälle vorhanden sein; falls diese Bedingung nicht erfüllt ist, wird empfohlen, benachbarte Antwortkategorien zusammenzufassen, um eine genügend große Anzahl an Ratings zu erhalten (Linacre, 2004; Wright & Linacre, 1992). Bei der KES-R wurden für 33 von 34 Items benachbarte Kategorien zusammengefasst (aus Platzgründen sind die Ergebnisse nicht abgedruckt, können aber bei den Autorinnen erfragt werden). Dies führte zu einem Item mit sieben Antwortkategorien, 19 Items mit sechs statt sieben Kategorien, 10 Items mit fünf Kategorien, 2 Items mit vier Kategorien und 2 Items mit drei Kategorien. Bei der KRIPS-R mussten für 28 von 30 Items benachbarte Kategorien zusammengelegt werden. Das bedeutet, es blieben 2 Items mit sieben Antwortkategorien bestehen, 14 Items mit sechs Kategorien, 7 Items mit fünf Kategorien, 4 Items mit vier und 3 Items mit drei Kategorien. Tabelle 2 stellt das Ausmaß an nicht geordneten Schwellenparametern gemäß des PCM dar. Bei der Skala KES-R zeigte keines der rekodierten 34 Items die postulierte Ordnung der Schwellenparameter, bei der Skala KRIPS-R nur ein einziges Item (das nach der Zusammenfassung von Kategorien vierstufige Item 5 Kindbezogene Ausgestaltung). Das bedeutet, alle KES-R-Items bzw. 97 % der KRIPS-R-Items zeigten mindestens eine Verletzung der postulierten Ordnung der Antwortkategorien. Außerdem zeigten die punktbiserialen Korrelationen der Antwortkategorien für 68 % der rekodierten KES-R-Items und 63 % der rekodierten KRIPS-R-Items nicht die postulierten ansteigenden Werte von niedrigeren zu höheren Kategorien (aus Platzgründen sind die Ergebnisse nicht abgedruckt, können aber bei den Autorinnen erfragt werden), was aufzeigt, dass höhere Werte nicht konsistent mit höherer Qualität zusammenhängen. Subskalen / Items M SD KES-R (α = .88) KRIPS-R (α = .86) KES-R / KRIPS-R KES-R / KRIPS-R Eltern und Erzieherinnen 38. Zusammenarbeit mit Familien b 39. persönliche Bedürfnisse EZ b 40. fachliche Bedürfnisse b 41. Interaktion und Kooperation EZ b 42. Fachl. Unterstützung / Evaluation EZ b 43. Fortbildungsmöglichkeiten b Eltern und Erzieherinnen 33. Elternarbeit b 34. persönliche Bedürfnisse EZ b 35. fachliche Bedürfnisse b 36. Interaktion und Kooperation EZ b 38. Fachl. Unterstützung / Evaluation EZ b 39. Fortbildungsmöglichkeiten b 37. Kontinuität der Erzieherinnen b Zusätzliche Merkmale KRIPS-R 40. Eingewöhnung b 41. Einbezug der familialen Lebenswelt b KES-R-Gesamtwert Faktorwert 1: Lernanregung Faktorwert 2: Interaktion / Sprache Faktorwert 3: Sicherheit KRIPS-R-Gesamtwert Faktorwert 1: Lernanregung / Sicherheit Faktorwert 2: Interaktion / Sprache 3.90 / 3.65 4.26 / 3.13 5.05 / 4.87 2.24 / - 0.76 / 0.74 0.87 / 0.92 1.22 / 1.34 1.13 / - Anmerkungen: EZ = Erzieherinnen. a Diese Items (KES-R 11, KES-R 27 bzw. KRIPS-R 23 und KES-R 37 bzw. KRIPS-R 32) wurden von den Analysen ausgeschlossen, da die Daten für einen Großteil der Einrichtungen als Nicht anwendbar kodiert wurden. b Die Subskala Eltern und Erzieherinnen (KES-R-Items 38 - 43 bzw. KRIPS-R-Items 33 - 37) und die zusätzlichen KRIPS-R-Items (40 und 41) wurden aus den Analysen ausgeschlossen, um die Vergleichbarkeit mit anderen Studien (z. B. Early et al., 2006; Gordon et al., 2013; Mashburn et al., 2008) und der neuen Version ECERS-3 (Harms et al., 2015) zu gewährleisten. u Pädagogische Qualität in Kindertageseinrichtungen 191 Strukturelle Validität: Anzahl der Dimensionen Zur Untersuchung der Dimensionalität der KES-R bzw. KRIPS-R wurden explorative Faktorenanalysen berechnet. Velcier’s Minimum Average Partial (MAP)-Test ergab drei Faktoren bei der KES-R und zwei Faktoren bei der KRIPS-R. Tabelle 3 stellt die Faktorladungen der explorativen Faktorenanalysen für eine einfaktorielle und eine dreibzw. zweifaktorielle Lösung dar. Die Model-Fit-Statistiken der Faktorenanalysen deuten darauf hin, dass eine einfaktorielle Lösung die Daten nicht gut beschreibt (CFI KES-R = .58 / CFI KRIPS-R = .62 und RMSEA KES-R = .08 / RMSEA KRIPS-R = .09). In Anbetracht der ungenügenden Itemstatistiken waren die Model-Fit-Statistiken des dreifaktoriellen Models der KES-R (CFI = .84 und RMSEA = .05) bzw. des zweifaktoriellen Modells der KRIPS-R (CFI = .81 und RMSEA = .06) akzeptabel. Der Vergleich der Informationskriteria BIC zeigte auf, dass der globale Model-Fit des dreifaktoriellen KES-R- Modells (BIC = 33963.36) bzw. des zweifaktoriellen KRIPS-R-Modells (BIC = 26512.04) besser war als der des jeweiligen einfaktoriellen Modells (BIC KES-R = 34315.37 bzw. BIC KRIPS-R = 26732.07). Faktor 1 der KES-R erfasst vor allem Aspekte der Lernanregung ( α = .83). Er bestand aus allen Items der Subskala Aktivitäten sowie einigen Items der Subskalen Platz und Ausstattung (4 Raumgestaltung, 8 Ausstattung für Grobmotorik), Strukturierung der pädagogischen Arbeit (36 Gruppenstruktur) und Sprachliche und kognitive Anregungen (15 Bücher). Faktor 2 der KES-R ( α = .84) scheint die Fachkraft-Kind-Interaktion zu erfassen und beinhaltete fast alle Items der Subskalen Sprachliche und kognitive Anregungen und Interaktionen sowie ein Item der Subskala Betreuung und Pflege (9 Begrüßung/ Verabschiedung). Faktor 3 der KES-R ( α = .72) scheint überwiegend den Bereich Sicherheit zu erfassen. Er umfasste vor allem Items der Subskala Betreuung und Pflege (10 Mahlzeiten/ Zwischenmahlzeiten, 12 Toiletten, 13 Gesundheitsvorsorge) sowie ein Item der Subskala Strukturierung der pädagogischen Arbeit (35 Freispiel) und zwei Items der Subskala Interaktionen (29 Beaufsichtigung bei grobmotorischen Aktivitäten, 30 Allgemeine Beaufsichtigung). Die drei Faktoren zeigten moderate Interkorrelationen (.35 bis .42). Die zwei Faktoren der KRIPS-R erfassen zum einen Aspekte der Lernanregung und Sicherheit sowie zum anderen die Bereiche Fachkraft-Kind-Interaktionen und sprachliche Anregungen. Der Faktor Lernanregung/ Sicherheit ( α = .82) bestand aus allen Items der Subskala Platz und Ausstattung sowie einigen Items der Subskalen Aktivitäten (16 Körperliche Bewegung, 17 Künstlerisches Gestalten, 21 Sand/ Wasser), Strukturierung der pädagogischen Arbeit (29 Ta- Anzahl der Items mit Items Geordneten Schwellenparametern Nur nicht geordneten Schwellenparametern Nur Äquivalenz Sowohl nicht geordneten Schwellenparametern als auch Äquivalenz KES-R (34 Items) 0 22 0 12 KRIPS-R (30 Items) 1 18 0 11 Tab. 2: Anzahl der KES-Rbzw. KRIPS-R-Items mit nicht geordneten Schwellenparametern (Deltas) des Partial Credit Modells (PCM) Anmerkung: Nicht geordnete Schwellenparameter und Äquivalenz wurden auf der Grundlage von 95 %-Konfidenzintervallen der Schwellenparameter definiert. Bei nicht geordneten Schwellenparametern liegt das Konfidenzintervall der niedrigeren benachbarten Schwelle höher als das Konfidenzintervall der nächst höheren Schwelle. Bei Äquivalenz überlappen die Konfidenzintervalle der benachbarten Schwellen. 192 Daniela Mayer, Kathrin Beckh KES-R Subskala / Item 1-Faktor Lösung 3-Faktor-Lösung KRIPS-R Subskala / Item 1-Faktor Lösung 2-Faktor-Lösung Faktor 1 Faktor 2 Faktor 3 Faktor 1 Faktor 2 Platz und Ausstattung 1. Innenraum 2. Mobiliar für Pflege / Spiel 3. Ausstattung Entspannung 4. Raumgestaltung 5. Rückzugsmöglichkeiten 6. Kindbezogene Ausgestaltung 7. Platz für Grobmotorik 8. Ausstattung für Grobmotrik .325 .505 .357 .321 .301 .453 .444 .438 Platz und Ausstattung 1. Innenraum 2. Mobiliar für Pflege / Spiel 3. Ausstattung Entspannung 4. Raumgestaltung 5. Kindbezogene Ausgestaltung .337 .384 .439 .387 .488 .386 .569 .324 Aktivitäten 19. Feinmotorische Aktivitäten 20. Künstlerisches Gestalten 21. Musik und Bewegung 22. Bausteine 23. Sand / Wasser 24. Rollenspiel 25. Natur / Sachwissen 26. Mathematisches Verständnis 28. Akzeptanz Verschiedenartigkeit .472 .441 .362 .462 .377 .450 .463 .594 .355 .649 .603 .501 .601 .450 .586 .586 .636 .464 Aktivitäten 15. Feinmotorische Aktivitäten 16. Körperliche Bewegung 17. Künstlerisches Gestalten 18. Musik und Bewegung 19. Bausteine 21. Sand / Wasser 20. Rollenspiel 22. Natur / Sachwissen 24. Akzeptanz Verschiedenartigkeit .506 .365 .461 .404 .354 .353 .423 Strukturierung der päd. Arbeit 34. Tagesablauf 35. Freispiel 36. Gruppenstruktur .352 .490 .596 .383 .738 Strukturierung der päd. Arbeit 29. Tagesablauf 30. Freispiel 31. Kleingruppen .587 .684 .539 .428 .655 .502 Betreuung und Pflege 9. Begrüßung / Verabschiedung 10. Mahlzeiten / Zwischenmahlzeiten 12. Toilette 13. Gesundheitsvorsorge 14. Sicherheit .348 .357 .403 .363 .312 .362 .405 .416 Betreuung und Pflege 6. Begrüßung / Verabschiedung 7. Mahlzeiten / Zwischenmahlzeiten 8. Ruhe / Schlafzeiten 9. Wickeln / Toilette 10. Gesundheitsvorsorge 11. Sicherheit .357 .329 .345 .328 .563 .411 .498 .564 Tab. 3: Faktorladungen aus explorativen Faktorenanalysen u Pädagogische Qualität in Kindertageseinrichtungen 193 gesablauf, 30 Freispiel) und Betreuung und Pflege (7 Mahlzeiten/ Zwischenmahlzeiten, 9 Wickeln/ Toilette, 10 Gesundheitsvorsorge, 11 Sicherheit). Der Faktor Interaktion/ Sprache der KRIPS-R ( α = .86) umfasste fast alle Items der Subskalen Zuhören und Sprechen und Interaktionen sowie ein Item der Subskala Strukturierung der pädagogischen Arbeit (31 Kleingruppen). Die beiden Faktoren zeigten eine moderate Interkorrelation (.46). Kriteriumsvalidität: Zusammenhänge mit kindlichen Entwicklungsmaßen und alternativen Qualitätsmaßen Zur Untersuchung der Kriteriumsvalidität wurden Regressionsanalysen zur Vorhersage von alternativen Qualitätsmaßen und kindlichen Entwicklungsmaßen durch den KES-R-/ KRIPS-R- Gesamtwert bzw. die gefundenen Faktorwerte unter Berücksichtigung der Kontrollvariablen berechnet. Es wurde dabei das Signifikanzniveau für mehrfaches Testen mithilfe der Bonferroni-Holm-Korrektur angepasst. In Tabelle 4.1 und 4.2 sind die standardisierten Regressionskoeffizienten für jedes alternative Qualitätsmaß und jedes kindliche Entwicklungsmaß dargestellt, dabei ist jeweils ein KES-R-/ KRIPS-R- Maß (Gesamtwert, Faktorwerte) der Prädiktor (Spalte) und eines der alternativen Qualitätsmaße bzw. eines der kindlichen Entwicklungsmaße ein Kriteriumsmaß (Zeile). Die standardisierten Regressionskoeffizienten für die kindlichen Entwicklungsmaße waren klein, wobei der größte Zusammenhang bei der KES-R bei β = .10 und bei der KRIPS-R bei β = .12 lag. Im Hinblick auf die Kriteriumsvalidität mit alternativen Qualitätsmaßen erwies sich nur der Zusammenhang mit Arnetts Caregiver Interaction Scale (CIS) signifikant. Der höchste standardisierte Regressionskoeffizient fand sich hierbei für den Interaktion-/ Sprache-Faktor, der bestehend aus Items der Subskalen Sprachliche und kognitive Anregungen und Interaktionen ein der CIS sehr ähnliches Konstrukt erfasst ( β = .77 bei der KES-R und β = .80 bei der KRIPS-R). KES-R Subskala / Item 1-Faktor Lösung 3-Faktor-Lösung KRIPS-R Subskala / Item 1-Faktor Lösung 2-Faktor-Lösung Faktor 1 Faktor 2 Faktor 3 Faktor 1 Faktor 2 Sprachl. und kognitive Anregungen 15. Bücher 16. Anregung zur Kommunikation 17. Sprache / kognitive Fähigkeiten 18. Allgemeiner Sprachgebrauch .405 .653 .589 .650 .429 .576 .528 .717 Sprachl. und kognitive Anregungen 14. Bücher 12. Sprachverstehen 13. Sprachgebrauch .404 .693 .635 .754 .753 Interaktionen 29. Beaufsicht. grobmotor. Aktivit. 30. Allg. Beaufsichtigung 31. Disziplin / Verhaltensregeln 32. Erzieher-Kind-Interaktion 33. Kind-Kind-Interaktion .357 .378 .537 .580 .604 .608 .826 .784 .437 .620 Interaktionen 25. Beaufsichtigung 28. Disziplin / Verhaltensregeln 27. Erzieher-Kind-Interaktion 26. Kind-Kind-Interaktion .632 .723 .684 .628 .669 .655 .808 .756 Anmerkung: Es sind nur Faktorladungen größer als .30 abgebildet. u 194 Daniela Mayer, Kathrin Beckh Faktorwerte Variable KES-R Gesamtwert Faktor 1 Lernanregung Faktor 2 Interaktion / Sprache Faktor 3 Sicherheit Alternative Qualitätsmaße Interaktionsqualität (CIS, N = 270) Berufliche Ausbildung (N = 270) Fachkraft-Kind-Beziehung (STRS, N = 677) .54*** .11 -.02 .27*** .13 -.02 .77*** .07 .04 .27*** .01 -.05 Kindliche Entwicklungsmaße Kognitive Entwicklung (HAWIVA-Mosaik, N = 664) Sprachliche Fähigkeiten (PPVT-IV, N = 674) Sozial-emotionale Kompetenzen (SSIS) Muttereinschätzung (N = 677) Erzieherineinschätzung (N = 677) Problemverhalten (CBCL) Muttereinschätzung (N = 677) Erzieherineinschätzung (N = 677) .09 .03 .01 .00 -.04 .01 .08 .02 -.03 -.03 .00 -.03 .08 .08 .03 .09 -.03 .02 .05 -.03 .03 -.04 -.03 .10 Tab. 4.1: Standardisierte Regressionskoeffizienten zur Vorhersage von alternativen Qualitätsmaßen und kindlichen Entwicklungsmaßen durch den Gesamtwert und die Faktorwerte der KES-R Anmerkungen: Lernanregung = Items der Subskalen Platz und Ausstattung, Aktivitäten, Strukturierung der pädagogischen Arbeit; Interaktion / Sprache = Items der Subskalen sprachliche und kognitive Anregungen und Interaktionen; Sicherheit = Items der Subskala Betreuung und Pflege. * p < .05, ** p < .01, *** p < .001 unter Berücksichtigung der Bonferroni-Holm- Korrektur für mehrfaches Testen (es werden positive Werte erwartet, außer für die Zusammenhänge mit Problemverhalten). Die Tabelle fasst die Ergebnisse von 36 Modellen unter Berücksichtigung der Kontrollvariablen zusammen, dabei ist jeweils ein KES-R-Maß (Gesamtwert, Faktorwerte) der Prädiktor (Spalte) und eines der alternativen Qualitätsmaße bzw. eines der kindlichen Entwicklungsmaße ein Outcome-Maß (Zeile). Kontrollvariablen: Ost- / West-Deutschland; Geschlecht, Alter und Migrationshintergrund des Kindes; Familiensprache, Alter, Bildung und Familienstand der Mutter, ob der Partner der Mutter im Haushalt lebte, Erwerbstätigkeit der Mutter, SES. Faktorwerte Variable KRIPS-R Gesamtwert Faktor 1 Lernanregung / Sicherheit Faktor 2 Interaktion / Sprache Alternative Qualitätsmaße Interaktionsqualität (CIS, N = 245) Berufliche Ausbildung (N = 245) Fachkraft-Kind-Beziehung (STRS, N = 537) .64*** .12 .00 .44*** .10 -.05 .80*** .10 .11 Kindliche Entwicklungsmaße Sprachliche Fähigkeiten (PPVT-IV, N = 526) Sozial-emotionale Kompetenzen (ITSEA) Muttereinschätzung (N = 537) Erzieherineinschätzung (N = 537) Problemverhalten (CBCL) Muttereinschätzung (N = 537) Erzieherineinschätzung (N = 537) .07 .02 .11 .06 -.04 .07 -.06 .07 .07 -.01 .04 .11 .12 -.01 -.09 Tab. 4.2: Standardisierte Regressionskoeffizienten zur Vorhersage von alternativen Qualitätsmaßen und kindlichen Entwicklungsmaßen durch den Gesamtwert und die Faktorwerte der KRIPS-R Anmerkungen: Lernanregung / Sicherheit = Items der Subskalen Platz und Ausstattung, Aktivitäten, Strukturierung der pädagogischen Arbeit und Betreuung und Pflege; Interaktion / Sprache = Items der Subskalen Zuhören und Sprechen, Interaktionen und Strukturierung der pädagogischen Arbeit. * p < .05, ** p < .01, *** p < .001 unter Berücksichtigung der Bonferroni-Holm-Korrektur für mehrfaches Testen (es werden positive Werte erwartet, außer für die Zusammenhänge mit Problemverhalten). Die Tabelle fasst die Ergebnisse von 24 Modellen unter Berücksichtigung der Kontrollvariablen zusammen, dabei ist jeweils ein KRIPS-R-Maß (Gesamtwert, Faktorwerte) der Prädiktor (Spalte) und eines der alternativen Qualitätsmaße bzw. eines der kindlichen Entwicklungsmaße ein Outcome-Maß (Zeile). Kontrollvariablen: Ost- / West- Deutschland; Geschlecht, Alter und Migrationshintergrund des Kindes; Familiensprache, Alter, Bildung und Familienstand der Mutter, ob der Partner der Mutter im Haushalt lebte, Erwerbstätigkeit der Mutter, SES. Pädagogische Qualität in Kindertageseinrichtungen 195 Diskussion Ziel des vorliegenden Beitrags war es, die psychometrischen Eigenschaften der KES-R und KRIPS-R im Hinblick auf die Aspekte Antwortprozess-Validität, strukturelle Validität und Kriteriumsvalidität zu untersuchen. Die Studie repliziert die Ergebnisse von Gordon und Kollegen (2013) hinsichtlich der Validität der amerikanischen Originalversion ECERS-R. Im Hinblick auf die Antwortprozess-Validität zeigten die Ergebnisse der IRT-Skalierung auf, dass basierend auf den Schwellenparametern keines der KES-R-Items und nur ein KRIPS-R-Item geordnete Antwortkategorien aufweist. Bei allen KES-R-Items bzw. 97 % der KRIPS-R-Items bestand das Problem von nicht geordneten Antwortkategorien. Die punktbiserialen Korrelationen zeigten ebenfalls nicht die postulierten ansteigenden Werte von niedrigeren zu höheren Antwortkategorien. Der IRT- Ansatz bestätigte die postulierte ordinale Struktur der Kategorien nicht, die steigende Qualität von niedrigeren zu höheren Kategorien annimmt. Das bedeutet, dass höhere Antwortkategorien empirisch nicht notwendigerweise auch höhere Qualität abbilden. Der empirische Befund der Verletzung der Ordnung der Antwortkategorien ist vermutlich darauf zurückzuführen, dass innerhalb eines Items jeweils mehrere Dimensionen abgebildet sind (vgl. auch Gordon et al., 2013, 2015). Die Überprüfung der strukturellen Validität durch Faktorenanalysen erbrachte weder einen Nachweis für ein einfaktorielles Modell der Skala noch für die Struktur der Subskalen. Vielmehr identifizierten Modellvergleiche drei Faktoren (KES-R) bzw. zwei Faktoren (KRIPS-R), was den Ergebnissen früherer Studien entspricht (z. B. Cassidy et al., 2005; Clifford et al., 2010; Early et al., 2006; Gordon et al., 2013; Sakai et al., 2003). Die hier identifizierten Faktoren können beschrieben werden als (a) Lernanregung mit Items aus den Subskalen Platz und Ausstattung, Aktivitäten und Strukturierung der pädagogischen Arbeit, (b) Interaktionen und sprachliche Unterstützung vor allem mit Items der Subskalen Sprachliche und kognitive Anregungen/ Zuhören und Sprechen und Interaktionen sowie (c) Sicherheit mit dem Großteil der Items der Subskala Betreuung und Pflege der Kinder und einzelnen Items anderer Subskalen, die Sicherheitsaspekte erfassen. Bei der KRIPS-R laden die Aspekte Lernanregung und Sicherheit auf einem Faktor. Hinsichtlich der Kriteriumsvalidität zeigten Regressionsanalysen zur Vorhersage von alternativen Qualitätsmaßen und kindlichen Entwicklungsmaßen durch den KES-R-/ KRIPS- R-Gesamtwert sowie die Faktorwerte keine signifikanten Zusammenhänge zu kindlichen Entwicklungsmaßen und im Hinblick auf alternative Qualitätsmaße nur einen signifikanten Zusammenhang zu Arnetts Caregiver Interaction Scale (CIS). Auch andere nationale und internationale Studien fanden nur geringe Zusammenhänge mit kindlichen Entwicklungsmaßen (z. B. Early et al., 2006; Howes et al., 2008; Mashburn et al., 2008; Sylva et al., 2006). Die größten Zusammenhänge wurden zwischen dem Interaktion/ Sprache-Faktor und der CIS gefunden, die ein ähnliches Konstrukt erfasst. Bei der Interpretation der Ergebnisse muss jedoch berücksichtigt werden, dass die beiden Qualitätsmaße KES-R/ KRIPS-R und CIS jeweils von derselben Beobachterin bzw. Beobachter zu ein- und demselben Beobachtungszeitpunkt eingeschätzt wurden, wodurch die Zusammenhänge möglicherweise überschätzt werden. Die Ergebnisse haben folgende Implikationen für die zukünftige Revision der ECERS-R/ KES-R, ITERS-R/ KRIPS-R bzw. der kürzlich veröffentlichten dritten amerikanischen Fassung ECERS-3 (Harms et al., 2015): Erstens zeigten die Ergebnisse der IRT-Skalierungen nicht geordnete Antwortkategorien bei nahezu allen Items auf, was darauf hindeutet, dass die Beschreibungen der Antwortkategorien nicht gut gewählt sind. Problematisch erscheint dabei insbesondere die Tatsache, dass in den meisten Items verschiedene Qualitätsdimensionen vermischt werden. Während im unteren Wertebereich vor allem die Einhaltung von Sicherheits- und Hygienestandards bewertet wird (z. B. Händewaschen mit Seife vor und nach dem Essen/ vor und nach dem Toilettengang, ausreichender Abstand zwischen den 196 Daniela Mayer, Kathrin Beckh Betten/ Matratzen), beinhalten die höheren Ratings Aspekte wie beispielsweise die Förderung von Selbstständigkeit oder das Interaktionsverhalten. Für Einrichtungen, bei denen Mängel im Bereich Sicherheit/ Hygiene bestehen, fehlen dementsprechend die Informationen zur Förderung von Selbstständigkeit oder zum Interaktionsverhalten in dem entsprechenden Bereich, was zu einer Ungenauigkeit der Ergebnisse führt. Dies stellt den Hauptkritikpunkt der KES-R/ KRIPS-R dar, da hierdurch die Aussagekraft der Daten und damit zusammenhängend der Nutzen der Daten bei der Implementierung von evidenzbasierten Maßnahmen zur Verbesserung der Qualität in Kindertageseinrichtungen stark eingeschränkt wird. Die Ergebnisse der NUBBEK-Studie verweisen beispielsweise auf ein durchgehend schlechtes Abschneiden der untersuchten Einrichtungen in der Skala Betreuung und Pflege, wobei zum Teil mehr als 80 % der Einrichtungen sehr niedrige Itemwerte erzielten. Unter Berücksichtigung von bindungstheoretischen Überlegungen wurde aus diesem Ergebnis die Empfehlung abgeleitet, Pflegesituationen (Wickeln, Mahlzeiten, Schlafen) als wichtige Beziehungssituationen zu verstehen und gezielt zum Aufbau und zur Aufrechterhaltung von vertrauensvollen Fachkraft-Kind-Beziehungen zu nutzen (Beckh et al., 2015; Wertfein, Müller & Kofler, 2012). Demgegenüber steht jedoch der Befund, dass die Mehrheit der Einrichtungen mittlere bis hohe Werte in Items erzielte, die die Interaktionsqualität erfassen. Das schlechte Abschneiden der Einrichtungen im Bereich Betreuung und Pflege könnte also auch lediglich Mängel bei der Einhaltung von Hygiene- und Sicherheitsvorschriften widerspiegeln, während die Ergebnisse im Hinblick auf die Interaktionsgestaltung in Pflegesituationen möglicherweise deutlich besser ausfallen würden. In Übereinstimmung mit Gordon et al. (2013, 2015) empfehlen wir Forscherinnen bzw. Forschern und Praktikerinnen bzw. Praktikern, die die KES-R/ KRIPS-R weiterhin verwenden (z. B. in Längsschnittstudien), alle Indikatoren der einzelnen Items wie eine Checkliste jeweils separat zu bewerten. Dadurch können mehr Informationen darüber gesammelt werden, was in den Einrichtungen bereits gut gemacht wird und was verbessert werden sollte. Die Einschätzung von allen Indikatoren ermöglicht es zudem, sowohl einen Wert basierend auf der Stop-Scoring-Regel zu bilden (um die Vergleichbarkeit mit früheren Studien oder vorherigen Messzeitpunkten zu gewährleisten) als auch einen Wert zu berechnen, bei dem auf die Anwendung der Stop-Scoring-Regel verzichtet wird. Zweitens zeigten die Ergebnisse der explorativen Faktorenanalysen, dass KES-R/ KRIPS-R verschiedene Qualitätsdimensionen erfassen, die nicht in einer globalen Skala abgebildet werden können. In der vorliegenden Studie konnten drei KES-R-Faktoren identifiziert werden: (a) Qualität der Interaktionen, (b) Qualität der Lernanregung in einer breiten Auswahl an Aktivitäten sowie (c) Sicherheit und Schutz vor Gefahren. Bei der KRIPS-R wurden dagegen nur zwei Faktoren gefunden, wobei Faktor 1 die Aspekte Lernanregung und Sicherheit und Faktor 2 Interaktionen beinhaltet. Die empirisch gefundene dreifaktorielle Lösung entspricht weitestgehend der KES-R-/ KRIPS-R-Definition von hoher Einrichtungsqualität, die sich an den drei Grundbedürfnissen von Kindern orientiert. Aufgrund der Vermischung der Dimensionen innerhalb der Items ist davon auszugehen, dass der Faktor, auf den ein spezifisches Item lädt, stark von Merkmalen der Stichprobe abhängig ist. Zum Beispiel laden zwei KES-R-Items der Subskala Interaktionen (29 Beaufsichtigung von grobmotorischen Aktivitäten und 30 Allgemeine Beaufsichtigung) auf dem Sicherheit-Faktor, da ungefähr 60 % der Einrichtungen die Sicherheitsstandards nicht erfüllen und folglich in die niedrigen Antwortkategorien fallen. Im Gegensatz dazu lädt das Item 9 Begrüßung/ Verabschiedung der Subskala Betreuung und Pflege auf dem Sprache/ Interaktion-Faktor, weil 84 % der Einrichtungen in den oberen Bereich der Antwortskala fallen, der Interaktionsaspekte wie freundliche Begrüßung von ankommenden Kindern erfasst. Dies könnte zudem auch die Unterschiede in den faktoranalytischen Lösungen über verschiedene Studien hinweg erklären (vgl. Clifford et al., 2010). Pädagogische Qualität in Kindertageseinrichtungen 197 Drittens zeigten die Ergebnisse von Regressionsanalysen keine signifikanten Zusammenhänge bei der Vorhersage von kindlichen Entwicklungsmaßen. Auch wenn die Zusammenhänge zwischen Maßen der Betreuungsqualität und kindlichen Entwicklungsmaßen generell klein sind (z. B. Burchinal, Kainz & Cai, 2011; Colwell, Gordon, Fujimoto, Kaestner & Korenman, 2013; Mashburn et al., 2008), erbringen die Faktor- und IRT-Analysen empirische Evidenz dafür, dass die geringen Zusammenhänge zwischen Betreuungsqualität und kindlicher Entwicklung möglicherweise zumindest teilweise auch auf die schwachen psychometrischen Eigenschaften der Skala zurückzuführen sind. Dies kann dazu führen, dass der Zusammenhang zwischen Betreuungsqualität und der Entwicklung von Kindern unterschätzt wird. Daher sollten bei der Entwicklung von neuen Instrumenten zur Erfassung der Betreuungsqualität relevante Qualitätsdimensionen sorgfältig vor dem Hintergrund von entwicklungspsychologischen Theorien ausgewählt und definiert werden. Interessanterweise stimmen die empirisch gefundenen drei Faktoren gut mit entwicklungspsychologischen Theorien wie der Bindungstheorie (vgl. Ainsworth, 1979; Bowlby, 1969) oder der Selbstbestimmungstheorie (vgl. Deci & Ryan, 1985; Ryan & Deci, 2000) überein. Bindungstheoretischen Annahmen zufolge sind in der außerfamiliären Kindertagesbetreuung für die Unterstützung von sozialer, emotionaler und kognitiver Entwicklung sowohl sichere und vertrauensvolle Beziehungen zwischen Kindern und Betreuungspersonen als auch eine anregende Entwicklungsumwelt, die Exploration und Lernen unterstützt, notwendig. In Übereinstimmung damit betonen Deci und Ryan (1985), dass eine gesunde Entwicklung von der Befriedigung grundlegender psychologischer Bedürfnisse nach sozialer Zugehörigkeit, Autonomie und Kompetenz abhängig ist. Bei der Beurteilung der Ergebnisse müssen folgende Limitationen berücksichtigt werden. Obwohl die Stichprobengröße groß genug war, um theoretisch alle KES-R-/ KRIPS-R-Antwortkategorien abzubilden (mindestens 10 Ratings pro Kategorie), verfügten 33 von 34 KES-R-Items bzw. 28 von 30 KRIPS-R-Items in mindestens einer Antwortkategorie über eine geringe Anzahl an Ratings. Zur Berechnung der IRT-Analysen mussten daher benachbarte Antwortkategorien zusammengefasst werden. Die Generalisierbarkeit der Ergebnisse zu den psychometrischen Eigenschaften der Items ist daher eingeschränkt. Dies war allerdings ein notwendiger Kompromiss, um für die Analysen möglichst viele Antwortkategorien und Items zu erhalten. Auch in Large-Scale-Untersuchungen werden von geringen Häufigkeiten in bestimmten Antwortkategorien des Instrumentes berichtet (z. B. Gordon et al., 2013), was zeigt, dass die Antwortskala nicht voll ausgeschöpft wird. Insbesondere fanden sich für Antwortkategorien in der Mitte der Antwortskala geringe Häufigkeiten, was darauf hindeutet, dass diese Indikatoren möglicherweise nicht relevant sind. Darüber hinaus wurden einige kindliche Entwicklungsmaße aus Erhebungsgründen gekürzt und modifiziert. Es ist denkbar, dass die Zusammenhänge zwischen der durch die KES-R/ KRIPS-R erfassten Betreuungsqualität und den vollständigen Maßen der kindlichen Entwicklung größer wären. Außerdem handelt es sich lediglich um eine Querschnittsstudie, sodass aufgrund der fehlenden längsschnittlichen Daten keine Aussagen über längerfristige Auswirkungen der über die KES-R/ KRIPS-R erfassten Betreuungsqualität in Kindertageseinrichtungen auf die kindliche Entwicklung getroffen werden können. Schließlich muss erwähnt werden, dass die berichteten Ergebnisse auf der Grundlage der KES-R/ KRIPS-R entstanden sind und nicht auf der im Jahr 2015 erschienenen neuen Fassung ECERS-3. Da die grundlegende Struktur jedoch auch in der neuen Fassung beibehalten wurde, ist davon auszugehen, dass die hier berichteten Validitätsprobleme auch bei der neuen Skala bestehen bleiben. Aus den Ergebnissen der vorliegenden Studie lassen sich wichtige Schlussfolgerungen für die Entwicklung von neuen Instrumenten zur Erfassung der Betreuungsqualität ableiten. Bei der Revision der KES-R/ KRIPS-R 198 Daniela Mayer, Kathrin Beckh und bei der Entwicklung neuer Qualitätsmaße ist es empfehlenswert, relevante Dimensionen der Betreuungsqualität auf der Grundlage von entwicklungspsychologischen Theorien auszuwählen und zu definieren und IRT- Methoden zur Überprüfung der psychometrischen Eigenschaften des Instrumentes anzuwenden. Literatur Achenbach, T. M. (1991). Manual for the child behavior checklist/ 4 - 18 and 1991 profile. Burlington, VT: University of Vermont, Department of Psychiatry. Achenbach, T. M. (1992). Manual for the child behavior checklist/ 2 - 3 and 1992 profile. Burlington, VT: University of Vermont, Department of Psychiatry. Ainsworth, M. D. S. (1979). Infant-mother attachment. American Psychologist, 34, 932 - 937. http: / / dx.doi. org/ 10.1037/ 0003-066X.34.10.932 Andrich, D. (1996). Measurement criteria for choosing among models with graded responses. In A. von Eye & C. C. Clogg (Eds.), Categorical variables in developmental research: Methods of analysis (pp. 3 - 35). San Diego, CA: Academic Press. http: / / dx.doi.org/ 10.10 16/ B978-012724965-0/ 50004-3 Andrich, D., de Jong, J. H. & Sheridan, B. E. (1997). Diagnostic opportunities with the Rasch model for ordered response categories. In J. Rost & R. Langeheine (Eds.), Applications of latent trait and latent class models in the social sciences (pp. 58 - 68). New York, NY: Waxmann. Arbeitsgruppe Deutsche Child Behavior Checklist. (2002). Elternfragebogen für Klein- und Vorschulkinder (CBCL/ 1 ½ - 5). Köln: Arbeitsgruppe Kinder-, Jugend- und Familiendiagnostik. Arnett, J. (1989). Caregivers in day-care centers: Does training matter? Journal of Applied Developmental Psychology, 10, 541 - 552. http: / / dx.doi.org/ 10.1016/ 0193- 3973(89)90026-9 Beckh, K., Mayer, D., Berkic, J. & Becker-Stoll, F. (2015). Ergebnisse der NUBBEK-Studie zu Qualitätsdimensionen in der Kindertagesbetreuung: Interpretation aus bindungstheoretischer Sicht. Diskurs Kindheits- und Jugendforschung, 2015/ 2, 183 - 201. http: / / dx.doi.org/ 10.3224/ diskurs.v10i2.19418 Bien, W. (2011). NUBBEK-Kreisstatistiken mit Zuordnung zu Stadt und Land. Unveröffentlichtes Arbeitspapier. Bowlby, J. (1969). Attachment and loss: Vol. 1 attachment. New York, NY: Basic Books. Bühner, M. (2004). Einführung in die Test- und Fragebogenkonstruktion. München: Pearson-Education. Bundesministerium für Familie, Senioren, Frauen und Jugend. (Hrsg.). (2014). Familienreport 2014. Leistungen, Wirkungen, Trends. Berlin: Bundesministerium für Familie, Senioren, Frauen und Jugend. Burchinal, M. R., Howes, C., Pianta, R., Bryant, D., Early, D., Clifford, R. & Barbarin, O. (2008). Predicting child outcomes at the end of kindergarten from the quality of pre-kindergarten teacher-child interactions and instruction. Applied Developmental Science, 12, 140 - 153. http: / / dx.doi.org/ 10.1080/ 108886908021 99418 Burchinal, M. R., Kainz, K. & Cai, Y. (2011). How well do our measures of quality predict child outcomes? A meta-analysis and coordinated analysis of data from large-scale studies of early childhood settings. In M. Zaslow, I. Martinez-Beck, K. Tout & T. Halle (Eds.), Quality measurement in early childhood settings (pp. 11 - 31). Baltimore, MD: Brookes. Burnham, K. P. & Anderson, D. R. (2002). Model selection and multimodel inference: A practical information-theoretic approach. New York, NY: Springer. Carter, A. S. & Briggs-Gowan, M. J. (2000). The infanttoddler social emotional assessment (ITSEA). Unpublished manual, Yale University of Massachusetts Boston, Department of Psychology. Cassidy, D. J., Hestenes, L. L., Hegde, A., Hestenes, S. & Mims, S. (2005). Measurement of quality in preschool child care classrooms: An exploratory and confirmatory factor analysis of the early childhood environment rating scale - revised. Early Childhood Research Quarterly, 20, 345 - 360. http: / / dx.doi.org/ 10.1016/ j. ecresq.2005.07.005 Clifford, R. M., Barbarin, O., Chang, F., Early, D., Bryant, D., Howes, C. & Pianta, R. (2005). What is pre-kindergarten? Characteristics of public pre-kindergartenprograms. Applied Developmental Science, 9, 126 - 143. http: / / dx.doi.org/ 10.1207/ s1532480xads0903_1 Clifford, R. M., Reszka, S. S. & Rossbach, H. (2010). Reliability and validity of the early childhood environment rating scale. Zugriff am 2. 1. 2017 unter ers.fpg.unc. edu/ sites/ ers.fpg.unc.edu/ files/ ReliabilityEcers.pdf Colwell, N., Gordon, R. A., Fujimoto, K., Kaestner, R. & Korenman, S. (2013). New evidence on the validity of the Arnett caregiver interaction scale: Results from the early childhood longitudinal study - Birth cohort. Early Childhood Research Quarterly, 28, 218 - 233. http: / / dx.doi.org/ 10.1016/ j.ecresq.2012.12.004 Cryer, D., Tietze, W., Burchinal, M., Leal, T. & Palacios, J. (1999). Predicting process quality from structural quality in preschool programs: A cross-country comparison. Early Childhood Research Quarterly, 14, 339 - 361. http: / / dx.doi.org/ 10.1016/ S0885-2006(99)000 17-4 Deci, E. L. & Ryan, R. M. (1985). Intrinsic motivation and self-determination in human behavior. New York, NY: Plenum Publishing. http: / / dx.doi.org/ 10.1007/ 978-1- 4899-2271-7 Dunn, D. M. & Dunn, L. M. (2007). Peabody picture vocabulary test, fourth edition, manual. Minneapolis, MN: NCS Pearson. Early, D. M., Bryant, D. M., Pianta, R. C., Clifford, R. M., Burchinal, M. R., Ritchie, S.,… Barbarin, O. (2006). Are teachers’ education, major, and credentials related to classroom quality and children’s academic gains in pre-kindergarten? Early Childhood Research Quarterly, 21, 174 - 195. http: / / dx.doi.org/ 10.1016/ j.ecresq.20 06.04.004 Eckhardt, A., Egert, F., Beckh, K., Berkic, J., Kalicki, B. & Quehenberger, J. (2012). NUBBEK - Dokumentation der Erhebungsinstrumente. Unveröffentlichter Forschungsbericht der NUBBEK-Studienpartner. Embretson, S. E. & Reise, S. P. (2000). Item response theory for psychologists. Mahwah, NJ: Erlbaum. Gordon, R. A., Fujimoto, K., Kaestner, R., Korenman, S. & Abner, K. (2013). An assessment of the validity of the ECERS-R with implications for measures of child care quality and relations to child development. Developmental Psychology, 49, 146 - 160. http: / / dx.doi.org/ 10.1037/ a0027899 Pädagogische Qualität in Kindertageseinrichtungen 199 Gordon, R. A., Hofer, K. G., Fujimoto, K., Risk, N., Kaestner, R. & Korenman, S. (2015). Identifying highquality preschool programs: New evidence on the validity of the early childhood environment rating scale - revised (ECERS-R) in relation to school readiness goals. Early Education and Development, 26, 1086 - 1110. http: / / dx.doi.org/ 10.1080/ 10409289. 2015.1036348 Gresham, F. M. & Elliott, S. M. (2008). Social skills improvement system (SSIS). Rating scale manual. San Antonio: Pearson. Harms, T. & Clifford, R. M. (1980). Early childhood environment rating scale. New York, NY: Teachers College Press. Harms, T., Clifford, R. M. & Cryer, D. (1998). Early childhood environment rating scale - revised edition. New York, NY: Teachers College Press. Harms, T., Clifford, R. M. & Cryer, D. (2015). Early childhood environment rating scale, third edition. New York, NY: Teachers College Press. Harms, T., Cryer, D. & Clifford, R. (1990). Infant/ toddler environment rating scale. New York, NY: Teachers College Press. Harms, T., Cryer, D. & Clifford, R. (2003). Infant/ toddler environment rating scale. Revised edition. New York, NY: Teachers College Press. Howes, C., Burchinal, M., Pianta, R., Bryant, D., Early, D., Clifford, R. & Barbarin, O. (2008). Ready to learn? Children’s pre-academic achievement in pre-kindergarten programs. Early Childhood Research Quarterly, 23, 27 - 50. http: / / dx.doi.org/ 10.1016/ j.ecresq.2007.05. 002 Hu, L. & Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling: A Multidisciplinary Journal, 6, 1 - 55. http: / / dx.doi.org/ 10.1080/ 10705519909540118 Joint Committee on Standards for Educational and Psychological Testing. (1999). Standards for educational and psychological testing. Washington, DC: American Educational Research Association. Kuger, S., Kluczniok, K., Kaplan, D. & Roßbach, H.-G. (2015). Stability and patterns of classroom quality in German early childhood education and care. School Effectiveness and School Improvement, 27, 418 - 440. http: / / dx.doi.org/ 10.1080/ 09243453.2015.111 2815 Linacre, J. M. (2004). Optimizing rating scale category effectiveness. In E. V. Smith, Jr. & R. M. Smith (Eds.), Introduction to Rasch measurement (pp. 258 - 278). Maple Grove, MN: Journal of Applied Measurement Press. Mashburn, A. J., Pianta, R. C., Hamre, B., Downer, J., Barbarin, O., Bryant, D.,… Howes, C. (2008). Measures of classroom quality in prekindergarten and children’s development of academic, language, and social skills. Child Development, 79, 732 - 749. http: / / dx.doi.org/ 10.1111/ j.1467-8624.2008.01154.x Masters, G. N. (1982). A Rasch model for partial credit scoring. Psychometrika, 47, 149 - 174. http: / / dx.doi. org/ 10.1007/ BF02296272 Mayer, D. & Beckh, K. (2016). Examining the validity of the ECERS-R: Results from the German national study of child care in early childhood. Early Childhood Research Quarterly, 36, 415 - 426. http: / / dx.doi.org/ 10.1016/ j.ecresq.2016.01.001 Muthén, L. K. & Muthén, B. O. (1998 - 2012). Mplus user’s guide. Seventh edition. Los Angeles, CA: Muthén & Muthén. Perlman, M., Zellman, G. L. & Le, V. (2004). Examining the psychometric properties of the early childhood environment rating scale - revised (ECERS-R). Early Childhood Research Quarterly, 19, 398 - 412. http: / / dx. doi.org/ 10.1016/ j.ecresq.2004.07.006 Phillipsen, L. C., Burchinal, M. R., Howes, C. & Cryer, D. (1997). The prediction of process quality from structural features of child care. Early Childhood Research Quarterly, 12, 281 - 303. http: / / dx.doi.org/ 10.1016/ S0885-2006(97)90004-1 Pianta, R. C. (1992). Student teacher relationship scale. Charlottesville, VA: University of Virginia. Raftery, A. E. (1995). Bayesian model selection in social research. Sociological Methodology, 25, 111 - 163. http: / / dx.doi.org/ 10.2307/ 271066 Ricken, G., Fritz, A., Schuck, K.-D. & Preuß, U. (2007). Hannover-Wechsler-Intelligenztest für das Vorschulalter - III. Bern: Huber. Ryan, R. M. & Deci, E. L. (2000). Self-determination theory and the facilitation of intrinsic motivation, social development, and well-being. American Psychologist, 55, 68 - 78. http: / / dx.doi.org/ 10.1037/ 0003-066X.55.1.68 Sakai, L. M., Whitebook, M., Wishard, A. & Howes, C. (2003). Evaluating the early childhood environment rating scale (ECERS): Assessing differences between the first and revised editions. Early Childhood Research Quaterly, 18, 427 - 445. http: / / dx.doi.org/ 10.1016/ j.ecresq.2003.09.004 Schneider, S. L. (2008). Applying the ISCED-97 to the German educational qualifications. In S. L. Schneider (Ed.), The international standard classification of education (ISCED-97). An evaluation of content and criterion validity for 15 European countries (pp. 76 - 102). Mannheim: Mannheimer Zentrum für Europäische Sozialforschung. Sylva, K., Siraj-Blatchford, I., Taggart, B., Sammons, P., Melhuish, E., Elliot, K. & Totsika, V. (2006). Capturing quality in early childhood through environmental rating scales. Early Childhood Research Quarterly, 21, 76 - 92. http: / / dx.doi.org/ 10.1016/ j.ecresq.2006.01. 003 Tietze, W., Becker-Stoll, F., Bensel, J., Eckhardt, A. G., Haug-Schnabel, G., Kalicki, B., … Leyendecker, B. (Hrsg). (2013). NUBBEK - Nationale Untersuchung zur Bildung, Betreuung und Erziehung in der frühen Kindheit. Forschungsbericht. Berlin: das Netz. Tietze, W., Bolz, M., Grenner, K., Schlecht, D. & Weller, B. (2007). Krippen-Skala (KRIPS-R). Revidierte Fassung. Feststellung und Unterstützung pädagogischer Qualität in Krippen. Berlin: Cornelsen Scriptor. Tietze, W., Schuster, K.-M. & Roßbach, H.-G. (1997). Kindergarteneinschätzskala (KES) (Deutsche Fassung der Early Childhood Environment Rating Scale von T. Harms und R.-M. Clifford). Neuwied: Luchterhand. Tietze, W., Schuster, K.-M., Grenner, K. & Roßbach, H.-G. (2007). Kindergarten-Skala (KES-R). Feststellung und Unterstützung pädagogischer Qualität in Kindergärten. Berlin: Cornelsen Scriptor. Vermeer, H. J., van IJzendoorn, M. H., Cárcamo, R. A. & Harrison, L. J. (2016). Quality of child care using the environment rating scales: A meta-analysis of international studies. International Journal of Early Childhood, 200 Daniela Mayer, Kathrin Beckh 48, 33 - 60. http: / / dx.doi.org/ 10.1007/ s13158-015- 0154-9 Wertfein, M., Müller, K. & Kofler, A. (2012). Kleine Kinder - großer Anspruch! 2010. Zweite IFP-Krippenstudie zur Qualitätssicherung in Kinderkrippengruppen (IFP-Projektbericht 18/ 2012). München: Staatsinstitut für Frühpädagogik. Whitebook, M., Howes, C. & Phillips, D. (1989). Who cares? Child care teachers and the quality of care in America: Final report, national child care staffing study. Berkeley, CA: Child Care Employee Project. Wolfe, E. W. & Smith, E. V. (2007). Instrument development tools and activities for measure validation using Rasch models: Part II - Validation activities. In E. V. Smith, Jr. & R. M. Smith (Eds.), Rasch measurement: Advanced and specialized applications (pp. 243 - 290). Maple Grove, MN: Journal of Applied Measurement Press. Wright, B. D. & Linacre, J. M. (1992). Combining and splitting categories. Rasch Measurement Transactions, 6, 233 - 235. Wright, B. D. & Masters, G. N. (1982). Rating scale analysis. Chicago, IL: MESA Press. Wu, M., Adams, R. & Wilson, M. (2005). ACER ConQuest. Australian Council for Educational Research. Dr. Daniela Mayer Dr. Kathrin Beckh Winzererstraße 9 Eckbau Nord D-80797 München E-Mail: Daniela.Mayer@ifp.bayern.de Kathrin.Beckh@ifp.bayern.de Pädagogische Qualität in Kindertageseinrichtungen 201 Variable N M oder % SD Min Max Alternative Qualitätsmaße Interaktionsqualität (CIS) Berufliche pädagogische Ausbildung Höher als staatlich anerkannte Erzieherin Staatlich anerkannte Erzieherin Niedriger als staatlich anerkannte Erzieherin Fachkraft-Kind-Beziehung (STRS) 270 270 677 3.30 6.3 87.4 6.3 0.48 1.71 4.00 Kindliche Entwicklungsmaße Kognitive Entwicklung (HAWIVA-Mosaik) Sprachliche Fähigkeiten (PPVT-IV) Sozial-emotionale Kompetenzen (SSIS) Muttereinschätzung Erzieherineinschätzung Problemverhalten (CBCL) Muttereinschätzung Erzieherineinschätzung 700 709 714 714 714 714 16.44 45.99 2.98 2.95 1.41 1.30 6.71 8.86 0.30 0.41 0.24 0.24 0 8.0 1.91 1.36 1.00 1.00 46.0 60.0 3.79 3.94 2.60 2.33 Regionale Merkmale der Einrichtungen Ost-Deutschland West-Deutschland 270 41.1 58.9 Kindmerkmale Geschlecht (Kind ist männlich) Alter (in Monaten) Migrationshintergrund 714 714 714 48.7 53.92 29.8 3.72 47.31 60.91 Familienmerkmale Familiensprache (nicht Deutsch) Alter der Mutter (in Jahren) Bildung der Mutter (ISCED-97) Level 1: Primärbildung (Grundschule) Level 2: Sekundarbildung Unterstufe (Hauptschule) Level 2.5: Sekundarbildung Unterstufe (Realschule) Level 3: Sekundarbildung Oberstufe (Abitur) Level 4: Postsekundäre nicht-tertiäre Bildung (Lehrabschluss und Abitur; Fachoberschulen und Berufskollegs) Level 5: Tertiäre Bildung (Fach- und Hochschulabschlüsse; Meisterbildung) Level 6: Tertiärbildung und weiterführende Forschungsausbildung (Promotion, Habilitation) Familienstand der Mutter (verheiratet) Partner der Mutter lebt im Haushalt Erwerbstätigkeit der Mutter (erwerbstätig) Sozio-ökonomischer Status (SES) 703 714 714 714 714 695 714 14.7 34.78 2.4 4.8 5.8 40.1 15.1 29.0 2.8 77.2 87.7 59.6 51.85 5.37 12.23 18.14 14.93 51.41 99.91 Anhang Deskriptive Statistiken für alle verwendeten Maße der Stichprobe der Einrichtungen für Kinder im Alter von drei bis sechs Jahren bzw. der Altersgruppe der Vierjährigen. 202 Daniela Mayer, Kathrin Beckh Variable N M oder % SD Min Max Alternative Qualitätsmaße Interaktionsqualität (CIS) Berufliche pädagogische Ausbildung Höher als staatlich anerkannte Erzieherin Staatlich anerkannte Erzieherin Niedriger als staatlich anerkannte Erzieherin Fachkraft-Kind-Beziehung (STRS) 245 245 553 3.36 8.2 82.4 9.4 4.36 0.42 0.43 1.67 2.60 4.00 5.00 Kindliche Entwicklungsmaße Sprachliche Fähigkeiten (PPVT-IV) Sozial-emotionale Kompetenzen (ITSEA) Muttereinschätzung Erzieherineinschätzung Problemverhalten (CBCL) Muttereinschätzung Erzieherineinschätzung 541 553 553 553 553 27.20 2.53 2.45 1.42 1.34 7.90 0.22 0.32 0.24 0.25 0 1.73 1.31 1.00 1.00 40.00 3.00 3.00 2.43 2.23 Regionale Merkmale der Einrichtungen Ost-Deutschland West-Deutschland 245 44.5 55.5 Kindmerkmale Geschlecht (Kind ist männlich) Alter (in Monaten) Migrationshintergrund 553 553 553 51.4 33.14 18.3 2.02 29.17 38.11 Familienmerkmale Familiensprache (nicht Deutsch) Alter der Mutter (in Jahren) Bildung der Mutter (ISCED-97) Level 1: Primärbildung (Grundschule) Level 2: Sekundarbildung Unterstufe (Hauptschule) Level 2.5: Sekundarbildung Unterstufe (Realschule) Level 3: Sekundarbildung Oberstufe (Abitur) Level 4: Postsekundäre nicht-tertiäre Bildung (Lehrabschluss und Abitur; Fachoberschulen und Berufskollegs) Level 5: Tertiäre Bildung (Fach- und Hochschulabschlüsse; Meisterbildung) Level 6: Tertiärbildung und weiterführende Forschungsausbildung (Promotion, Habilitation) Familienstand der Mutter (verheiratet) Partner der Mutter lebt im Haushalt Erwerbstätigkeit der Mutter (erwerbstätig) Sozio-ökonomischer Status (SES) 544 551 552 552 552 545 553 9.7 33.95 0 2.9 5.6 33.3 12.9 39.9 5.4 65.4 86.2 68.4 53.59 5.42 12.50 18.70 17.75 47.04 81.94 Deskriptive Statistiken für alle verwendeten Maße der Stichprobe der Einrichtungen für Kinder unter drei Jahren bzw. der Altersgruppe der Zweijährigen.