eJournals Psychologie in Erziehung und Unterricht 67/2

Psychologie in Erziehung und Unterricht
3
0342-183X
Ernst Reinhardt Verlag, GmbH & Co. KG München
10.2378/peu2019.art17d
41
2020
672

Empirische Arbeit: Implementationsqualität unter der Lupe: Unterscheiden sich Eltern und Lesecoachs in der Umsetzung eines Trainings zur Förderung der Leseflüssigkeit?

41
2020
Catherine Näpflin
Manuela Frommelt
Isabelle Hugener
Annette Tettenborn
Kathrin Krammer
Caroline Villiger
Silke Hauri
Erich Hartmann
Die Implementation zentraler Elemente einer Intervention stellen wesentliche Gelingensbedingungen von Interventionsstudien dar und bestimmen letztlich die Güte und Interpretierbarkeit der Ergebnisse. Hierzu gehören auch eine gut strukturierte Schulung und deren programmkonforme Ausführung durch die Beteiligten. Ziel des vorliegenden Beitrags ist es, am Beispiel des Interventionsprojektes LiT – Lesen im Tandem aufzuzeigen, wie unterschiedliche Aspekte von Implementationsqualität multimethodisch erfasst werden können. Die Auswertungen der Videodaten und Lesetagebücher zeigen, dass die geschulten Elemente der Paired-Reading-Methode von beiden Trainergruppen (Eltern/Lesecoachs) größtenteils wie intendiert umgesetzt wurden. Wenige signifikante Gruppenunterschiede ergaben sich (a) in der Häufigkeit der Trainingssitzungen, (b) beim Einsatz von Lob und (c) in der buchbezogenen Kommunikation. Die Ergebnisse lassen vermuten, dass die hohe Strukturiertheit der Fördermethode Paired-Reading unabhängig vom Setting die Implementationsqualität begünstigt.
3_067_2020_2_0003
n Empirische Arbeit Psychologie in Erziehung und Unterricht, 2020, 67, 95 -111 DOI 10.2378/ peu2019.art17d © Ernst Reinhardt Verlag München Basel Implementationsqualität unter der Lupe: Unterscheiden sich Eltern und Lesecoachs in der Umsetzung eines Trainings zur Förderung der Leseflüssigkeit? Catherine Näpflin 1 , Manuela Frommelt 1 , Isabelle Hugener 1a , Annette Tettenborn 1 , Kathrin Krammer 1 , Caroline Villiger 2 , Silke Hauri 3 , Erich Hartmann 4 1 Pädagogische Hochschule Luzern 2 Pädagogische Hochschule Bern 3 Pädagogische Hochschule Fribourg 4 Universität Fribourg Zusammenfassung: Die Implementation zentraler Elemente einer Intervention stellen wesentliche Gelingensbedingungen von Interventionsstudien dar und bestimmen letztlich die Güte und Interpretierbarkeit der Ergebnisse. Hierzu gehören auch eine gut strukturierte Schulung und deren programmkonforme Ausführung durch die Beteiligten. Ziel des vorliegenden Beitrags ist es, am Beispiel des Interventionsprojektes LiT - Lesen im Tandem aufzuzeigen, wie unterschiedliche Aspekte von Implementationsqualität multimethodisch erfasst werden können. Die Auswertungen der Videodaten und Lesetagebücher zeigen, dass die geschulten Elemente der Paired-Reading-Methode von beiden Trainergruppen (Eltern/ Lesecoachs) größtenteils wie intendiert umgesetzt wurden. Wenige signifikante Gruppenunterschiede ergaben sich (a) in der Häufigkeit der Trainingssitzungen, (b) beim Einsatz von Lob und (c) in der buchbezogenen Kommunikation. Die Ergebnisse lassen vermuten, dass die hohe Strukturiertheit der Fördermethode Paired-Reading unabhängig vom Setting die Implementationsqualität begünstigt. Schlüsselbegriffe: Implementationsqualität, Paired-Reading, Videoanalyse, außerschulische Leseförderung, Eltern, Lesecoachs Scrutinizing Implementation Quality: Do Parent Tutors and Volunteer Tutors Differ in the Implementation of a Reading Fluency Training? Summary: The implementation of central elements of an intervention represent essential conditions for the success of intervention studies and ultimately determine the quality and interpretability of the results. This includes well-structured training and its program-compliant execution by the participants. The aim of this paper is to show how various aspects of implementation quality can be measured in a multi-methodological way, taking the intervention project LiT - Reading in Tandem as an example. The evaluation of the video data and reading diaries suggest that the trained central elements of the paired-reading method were largely implemented by both coaching groups (parents/ volunteers) as intended. There were few significant group differences (a) in the frequency of training sessions, (b) in the use of praise and (c) in book-related communication. The results suggest that the highly structured method of reading promotion favors the implementation quality, regardless of the setting. Keywords: Implementation quality, paired-reading, video analysis, out-of-school reading promotion, parents, volunteers a Plötzlich und unerwartet verstarb Prof. Dr. Isabelle Hugener während der Erstellung dieses Beitrags. Ihr Tod bedeutet einen enormen persönlichen Verlust für alle ihre Kolleginnen und Kollegen. Wir widmen diesen Beitrag einer hervorragenden Forscherin und lieben Freundin. 96 Catherine Näpflin et al. Interventionsstudien zur Förderung der Lesekompetenz erfahren aus verschiedenen Gründen besondere Aufmerksamkeit. Zum einen ist die Lesekompetenz eines der zentralen Merkmale schulischen Erfolgs (Artelt, Stanat, Schneider & Schiefele, 2001) und generell Grundlage von Bildungsprozessen und gesellschaftlicher Partizipation (z. B., OECD & Statistics Canada, 2000). Zum anderen erreichen gerade Interventionsstudien eine breite Legitimationsbasis, weil insbesondere Wirkungsanalysen im Rahmen randomisiert-kontrollierter Designs (randomized controlled trial, RCT) helfen, valides Veränderungswissen zu generieren (Galuschka & Schulte- Körne, 2015). Interventionsstudien im pädagogischen Kontext sind in hohem Maße auf die Kooperationsbereitschaft und das Engagement der Beteiligten angewiesen (Astleitner, 2010; Becker-Mrotzek & Butterworth, 2018). Die Implementation zentraler Elemente eines Programms und deren programmkonforme Ausführung durch die Beteiligten stellen dabei wesentliche Gelingensbedingungen dar und bestimmen letztlich die Güte und Interpretierbarkeit der Ergebnisse (vgl. Carroll et al., 2007; Durlak & DuPre, 2008), denn ohne genaue Prüfung der Umsetzung einer Intervention können die Interventionseffekte - seien sie positiv oder negativ - entweder auf die intendierte Wirkung der Elemente der Intervention oder aber auf deren mangelhafte oder nicht programmkonforme Umsetzung zurückgeführt werden (Chen, 1990; Durlak & DuPre, 2008). Die datengestützte Überprüfung der Umsetzung einer Intervention im Bereich der Leseförderung besteht bislang jedoch meist darin, von den Teilnehmenden Angaben zu Häufigkeit und Dauer der Trainingseinheiten und ggf. auftretenden Schwierigkeiten zu erheben sowie rückblickend Selbsteinschätzungen zur Qualität der Schulungen und zur Intervention insgesamt zu erhalten (vgl. Philipp & Souvignier, 2016). Eher selten wurde der Fokus auf die Durchführung der Intervention selbst und die Genauigkeit der Umsetzung gelegt (vgl. McElvany & van Steensel, 2009; Topping, Thurston, McGavock & Conlin, 2012). Erst die Beobachtung bzw. die Analyse videografierter Trainingseinheiten entlang trainingsspezifischer Qualitätskriterien ermöglicht es - zusammen mit anderen Datenquellen - zuverlässige Aussagen zur Implementationsqualität einer Intervention zu machen (vgl. McElvany & van Steensel, 2009). Dieser Beitrag setzt hier an und zeigt Möglichkeiten zur Erfassung der Implementationsqualität am Beispiel des Leseförderprojekts LiT - Lesen im Tandem und berichtet Ergebnisse zur Implementationsqualität. Implementationsqualität im Kontext von Interventionsstudien Umgangssprachlich wird der Begriff Implementation oft synonym mit Umsetzen, Einsetzen oder Installieren von Innovationen verwendet (vgl. Souvignier & Philipp, 2016, S. 9). Auch bei Becker-Mrotzek und Butterworth (2018) wird Implementation als Prozess der Umsetzung von Maßnahmen oder Neuerungen in die Praxis zum Zwecke ihrer Optimierung verstanden (2018, S. 49). Inwiefern eine Umsetzung gelungen ist, kann nach Petermann (2014) an der von den Beteiligten wahrgenommenen Akzeptanz, der Angemessenheit und Machbarkeit im entsprechenden Setting und der Wiedergabetreue der intendierten Maßnahmen festgemacht werden. In der Wiedergabetreue ist die Qualität der Implementation implizit bereits angesprochen. Die Implementationsqualität bezieht sich entsprechend auf die Gesamtheit von Faktoren, welche die Güte der Umsetzung von Maßnahmen (meist mehrperspektivisch oder multimethodisch) bestimmen bzw. messen. Hierfür gibt es in der englischsprachigen Literatur unterschiedliche Formulierungen wie z. B. fidelity (Mowbray, Holter, Teague & Bybee, 2003), programme fidelity (Powell & Carey, 2012), fidelity of implementation (O’Donnell, 2008), treatment integrity (Schulte, Easton & Parker, 2009) oder intervention fidelity (Swanson, Wanzek, Haring, Ciullo & McCulley, 2013). Implementationsqualität eines Lesetrainings 97 Im vorliegenden Artikel wird der Term Implementationsqualität in Anlehnung an die Konzeptualisierung von McElvany und van Steensel (2009) verwendet, welche drei Bereiche unterscheiden: In einem ersten Bereich geht es um die oben erwähnten Aspekte, welche die Umsetzung einer Fördermaßnahme auszeichnen (Häufigkeit der Aktivitäten, Genauigkeit und Qualität der Umsetzung einzelner Programminhalte, Qualität der Interaktionen). Als zweiten Bereich nennen die Autoren die Intensität und Qualität der Schulung der Trainer sowie die Intensität und Qualität von Unterstützungsmaßnahmen während der Intervention, wie etwa ein begleitendes Coaching oder Maßnahmen gegen Drop-Outs. Der dritte Bereich erfasst die Teilnahmebereitschaft der beabsichtigten Zielgruppe (z. B., Drop-Out- Quote, Selektivität in Bezug auf den sozioökonomischen Status). Powell und Carey (2012) verwenden eine vergleichbare Konzeptualisierung. Mit Receipt bezeichnen sie Aspekte der Trainingsumsetzung, mit Delivery Aspekte der Schulung zur Umsetzung einer Intervention. In Erweiterung zu McElvany und van Steensel (2009) bezeichnet Enactment die Wirkungen der Intervention auf die Interaktionen von Eltern und Kind außerhalb des Trainings oder nach der Intervention. Ein engeres Verständnis von Implementationsqualität umfasst zumeist allein den erstgenannten Punkt. Dem vorliegenden Beitrag liegt denn auch dieses von McElvany und van Steensel (2009) enger gefasste Verständnis von Implementationsqualität zugrunde. Relevanz von Implementationsqualität In der Interventionsforschung wird solchen Aspekten der Implementationsqualität noch zu wenig Beachtung geschenkt (Gräsel & Parchmann, 2004; O’Donnell, 2008; van Steensel, McElvany, Kurvers & Herppich, 2011), obwohl deren grundsätzliche Bedeutung anerkannt ist (u. a. De la Rie, van Steensel & van Gelderen, 2017; Durlak & DuPre, 2008; Schulte et al., 2009). Daten zur Implementationsqualität von Interventionen liefern wichtige Hinweise zur Erklärung von deren Wirksamkeit (interne Validität) und zur Einschätzung, inwieweit die Ergebnisse generalisiert werden können bzw. was bei einer erneuten Durchführung der Intervention beachtet werden müsste (externe Validität; Mowbray et al., 2003; Swanson et al., 2013). Gerade bei Interventionen im familiären Umfeld erscheint es wahrscheinlich, dass das schulungskonforme Umsetzen durch alltägliche Belange erschwert werden kann. Van Steensel et al. (2011) bezeichnen deshalb die Überprüfung der Implementationsqualität als zentral für den validen Nachweis von kausalen Zusammenhängen zwischen der implementierten Intervention und den beobachteten Outcomes (z. B., Lesefortschritten) der Studienteilnehmenden (vgl. auch Carroll et al., 2007). In ihrer Metaanalyse konnten sie entsprechende Wirkungszusammenhänge aber nicht prüfen, da nur in weniger als der Hälfte der untersuchten Studien Daten zur Implementationsqualität vorlagen. Gemäß einer Metaanalyse von Swanson et al. (2013) enthalten ca. zwei Drittel (n = 50) der 76 untersuchten Studien im Bereich des Lesens, Schreibens oder der Mathematik Angaben zur Implementationsqualität - Ergebnisse von datenbasierten Auswertungen zur Implementationsqualität werden jedoch in nur 7,0 % der analysierten Studien berichtet. Hinzu kommt, dass diese Ergebnisse indes nicht immer eindeutig oder überzeugend sind. So fanden z. B. Topping et al. (2012) lediglich schwache Beziehungen zwischen Prozessfaktoren und Leistungsfortschritt. Für die Klärung dieser Zusammenhänge sind weitere Untersuchungen dringend notwendig. Methoden zur Erfassung von Implementationsqualität Zur Überprüfung der Implementationsqualität bieten sich unterschiedliche methodische Möglichkeiten an, wobei bei der Auswahl geeigneter Instrumente die jeweiligen Vor- und Nachteile abzuwägen sind. So nennen McKenna, Flower 98 Catherine Näpflin et al. und Ciullo (2014), die sich mit der Implementationsqualität von Interventionen im Rahmen des Schulunterrichts beschäftigen, als mögliche Methoden z. B. Beobachtungen (live, Audio oder Video), Selbstauskünfte der Beteiligten (Interviews, Fragebögen, Tagebücher, Protokolle) oder Schülerprodukte (z. B. Aufsätze). Bei audio- und videobasierten Daten ergibt sich ein hoher Aufwand sowohl bei der Datenerhebung als auch bei der Analyse. Zudem kann die Präsenz einer Videokamera die interne Validität der Daten gefährden. Selbstauskünfte können Wahrnehmungsverzerrungen enthalten und der sozialen Erwünschtheit unterliegen und folglich weniger reliabel sein. Erstrebenswert ist es sicherlich, mehrere Perspektiven (Selbst- und Fremdberichte) gleichzeitig zu erfassen. Auch Philipp und Souvignier (2016, S. 145) sehen in einem „klug gewählten Mixed-Methods-Design“ ein großes Potenzial, um die Implementationsqualität einer Maßnahme möglichst genau zu bestimmen. Auf diese Weise können subjektive Einschätzungen der Teilnehmenden durch externe Einschätzungen bestätigt, relativiert oder widerlegt werden. Vergleiche interner und externer Perspektiven können sich dabei gegenseitig ergänzen. In ihrer Literaturübersicht zur Implementationsqualität in Studien zu familienbasierter Leseförderung fanden De la Rie et al. (2017) große Unterschiede bezüglich der Informationen zur Messung der Implementationsqualität. In vielen Studien waren die Angaben ungenau, fehlten nachvollziehbare Daten gänzlich oder beschränkten sich auf eine quantitative Beschreibung durchgeführter Trainingssitzungen. Eine mögliche Erklärung für das Fehlen von Daten und Auswertungen zu beobachtbaren Qualitätsmerkmalen in der Umsetzung z. B. von zentralen Elementen liegt womöglich darin, dass die Datenerhebung und -auswertung im Vergleich zu Selbstberichten zeitaufwendiger und kostenintensiver sind. Ebenfalls wird ein Mangel an Informationen zur Schulung deutlich. Selten wird genau beschrieben, wie Inhalte vermittelt wurden, wer die Schulungen durchführte und wie lange diese dauerten. O’Donnell (2008) empfiehlt als allgemeine Richtlinie zur Überprüfung der Implementationsqualität, in einem ersten Schritt die zentralen Elemente der Intervention klar zu definieren und festzulegen, was unter einer genügenden Implementation verstanden wird. Anschließend sollen Instrumente zur Datenerhebung recherchiert oder entwickelt werden. Ferner sind die Reliabilität und die Validität der erhobenen Daten zu prüfen. Abschließend sind die Ergebnisse zur Implementationsqualität in die Wirksamkeitsanalyse miteinzubeziehen. Hauptfokus der vorliegenden Publikation ist es, anhand einer außerschulischen Interventionsstudie zur Förderung der Leseflüssigkeit exemplarisch konkrete Möglichkeiten zur Überprüfung der Implementationsqualität aufzuzeigen. Dabei wird der Frage nachgegangen, wie Aspekte der Intensität und Qualität des implementierten Lesetrainings operationalisiert werden können und wie zuverlässig geschulte Fördermaßnahmen hinsichtlich zeitlicher Aspekte (Intensität) und technischer Aspekte (zentrale Elemente des Trainings) umgesetzt werden. Überprüfung der Implementationsqualität eines Trainings zur Leseflüssigkeit am Beispiel der LiT-Studie (LiT = Lesen im Tandem) Im Mittelpunkt des Forschungsinteresses der Interventionsstudie Lesen im Tandem (LiT) stand die Überprüfung der differenziellen Wirksamkeit eines außerschulischen Trainings der Leseflüssigkeit bei Drittklässlern mit Leseschwierigkeiten durch (a) Eltern und (b) freiwillige Lesecoachs. Leseflüssigkeit wird allgemein definiert als ein Produkt aus Lesegenauigkeit und automatisierter Worterkennung, was sich im mühelosen und zuverlässigen Dekodieren von Texten ausdrückt. Daher begründet sich der in der Studie gelegte Fokus auf die Leseflüssigkeit (reading fluency) durch die Wichtigkeit dieser Grundfertigkeit des verstehenden Lesens, insbesondere im Kontext von kindlichen Leselernschwierigkeiten. Flüssiges Lesen charakterisiert sich zudem durch ein angemessenes Lesetempo und eine sinnhafte Implementationsqualität eines Lesetrainings 99 prosodische Gestaltung (Phrasierung, Intonation, Betonung u. a.) des Gelesenen (National Reading Panel, 2000; Rasinski & Nageldinger, 2016). Flüssiges Lesen ist wichtig, weil es den Leseprozess entlastet und dem Leser so mehr kognitive Ressourcen für höhere Verarbeitungsprozesse bzw. das Leseverstehen zur Verfügung stellt. Leseflüssigkeit ist insofern auch bedeutsam für das Lernen aus Texten und somit für den Schulerfolg (Kuhn & Stahl, 2003; Wolf & Katzir-Cohen, 2001). Als Fördermethode wurde das Paired-Reading (PR) nach Topping (1995, 2001) eingesetzt, das auf einem strukturierten Verfahren des gemeinsamen lauten Lesens (Kind und Coach) beruht und als Form der Eins-zu-Eins-Betreuung bei der Unterstützung von Leseschwierigkeiten verbreitet ist. Die Wirksamkeit des PR auf die Leseflüssigkeit, aber auch auf das Textverständnis wurde mehrfach empirisch bestätigt (Elbaum, Vaughn, Hughes & Moody, 2000; Ritter, Barnett, Denny & Albin, 2009; Topping et al., 2012). Zusätzlich zur Wirksamkeit interessierte im LiT-Projekt die hier im Vordergrund stehende Frage, wie gut die zentralen Elemente des Trainings von den Eltern und Lesecoachs umgesetzt wurden und ob sich die beiden Gruppen darin unterscheiden. Geschulte Kernelemente der LiT-Studie Die Lesetandems wurden angehalten, während 20 Wochen 2bis 3-mal pro Woche (also mind. 40 Trainingssitzungen) jeweils 15 Minuten lang zu trainieren. Zur Förderung des Textverständnisses und der Lesemotivation wurde die PR- Methode durch textbasierte Kommunikation zwischen Coach und Kind ergänzt (Overett & Donald, 1998), indem der Coach jeweils zu Beginn und am Ende jeder PR-Trainingseinheit ein Gespräch über die Lektüre initiierte (z. B., „Wo waren wir das letzte Mal stehen geblieben, was war da passiert? “ „Was meinst Du, wie wird das jetzt weitergehen? “). Folgende vier Aktivitäten bilden die Kernelemente der PR-Methode, welche an der Schulung ins Zentrum gestellt wurden: 1. Gemeinsames, synchrones, lautes Lesen. Dieses Element soll das leseschwache Kind beim Lesen unterstützen, wobei das Kind das Tempo vorgibt und sich der Coach anpasst. Der Coach achtet darauf, sich auch bezüglich der Lautstärke anzupassen, damit das Kind gut hörbar ist. Während des gemeinsamen Lesens hat das Kind die Möglichkeit, mit einem vorgängig vereinbarten Zeichen zu signalisieren, dass es alleine lesen möchte. Passiert in der Alleinlesephase ein Lesefehler, wird dieser, wenn möglich, vom Kind korrigiert und beide lesen gemeinsam weiter. 2. Steuerung des Leseprozesses mit dem Finger. Dies soll das gemeinsame laute Lesen steuern und das Kind anleiten, genauer zu lesen. So wird keine Zeile übersprungen und beide Leser wissen jederzeit, wo gerade gelesen wird. Zudem kann der Coach auf Lesefehler hinweisen, indem er die Vorwärtsbewegung des Fingers stoppt. Der Lesecoach fungiert hier als Modell im Sinne des Scaffoldings (Gibbons, 2002). 3. Fehler korrigieren. Der Coach bleibt mit dem Finger beim falsch gelesenen Wort stehen und wartet ab, ob das Kind den Fehler selber korrigieren kann. Geschieht dies nicht innerhalb von 3 - 5 Sekunden, liest der Coach das Wort langsam richtig vor und das Kind repetiert das Wort. 4. Loben. Dieses Kernelement dient zur Förderung der Motivation des leseschwachen Kindes und soll so auch sein Selbstkonzept wie auch die Leistung begünstigen (Brophy, 1981). Der Lesecoach würdigt dadurch die Anstrengung oder den Fortschritt (z. B., das Lesen eines schwierigen Wortes) des Kindes und wird dem Bedürfnis nach Kompetenzerleben gerecht (Deci & Ryan, 1985). Forschungsleitende Fragestellungen Der vorliegenden Studie liegen die folgenden beiden Fragen zugrunde: 1. Wurde das Lesetraining hinsichtlich der Intensität (Häufigkeit), der zeitlichen Vorgaben sowie der zentralen Elemente der PR-Methode gemäß der vorgängigen Schulung umgesetzt? 2. Wurden diese Aspekte von den Eltern und den Lesecoachs vergleichbar umgesetzt? Die detaillierten Fragestellungen sind in Tabelle 1 dargestellt. 100 Catherine Näpflin et al. Methode Stichprobe Die Stichprobe bestand aus N = 198 leseschwachen Drittklässlerinnen und Drittklässlern (davon 37,9 % Mädchen) im durchschnittlichen Alter von 8.9 Jahren (SD = 0.51), die zufällig den drei Bedingungen (Eltern, freiwilliger Lesecoach und Kontrollgruppe) zugeteilt wurden (Randomisierungsgrad: 90,6 % 1 ). Zur Identifikation leseschwacher Schulbzw. Risikokinder dienten das Screeningverfahren Stolperwörter-Test (Metze, 2009) sowie die Beurteilung der Lehrpersonen. Kinder mit einem Prozentrang < 33 und einer Empfehlung der Lehrperson wurden in die Stichprobe aufgenommen. Kinder mit einer diagnostizierten Lese-Rechtschreibstörung und einer entsprechenden sonderpädagogischen Förderung wurden aus pädagogischen und methodischen Gründen von der Teilnahme im Projekt ausgeschlossen. Insgesamt 67 Kinder der Interventionsgruppe trainierten mit ihren Eltern zu Hause und 64 Kinder mit einem Lesecoach jeweils an der Schule. Die restlichen 67 Kinder erhielten keine Intervention (= KG) und werden deshalb in diesem Beitrag auch nicht weiter berücksichtigt. Die N = 131 Lesetandems bildeten die Grundlage der nachfolgenden Analysen. Aufgrund der sorgfältigen Rekrutierung und Stichprobenpflege gab es nur vereinzelte Drop-Outs: Während der Trainingsphase mussten drei Kinder das Training abbrechen (Überforderung des Kindes oder krankheitsbedingte Ausfälle von Lesecoachs 2 ). Bezüglich der abhängigen Variable Leseflüssigkeit 3 bestanden zum Messzeitpunkt t1 (vor dem Trainingsbeginn) keine signifikanten Unterschiede zwischen den beiden Gruppen (F [2,195] = 0.586, p = .558). Die Rekrutierung der Lesecoachs verlief über Zeitungsinserate und Anschreiben von Senioren-, Quartier- und Elternvereine sowie der projekteigenen Homepage. Weiter konnte durch Hinweise lokaler Schulleitungen direkt auf Personen zugegangen werden. Nach dem Informationsanlass haben sich 64 Lesecoachs (28 Frauen, 36 Männer) bereit erklärt, an zwei Schulungsabenden teilzunehmen und anschließend während ca. 20 Wochen jeweils 2 - 3 mal wöchentlich je 20 Minuten mit einem zugeteilten Kind an der Schule zu lesen. Allen Lesecoachs und Eltern wurde vor der Intervention ein Fragebogen zur Ermittlung von Angaben zur Person und zur Einstellung gegenüber dem LiT- Projekt vorgelegt. Die Eltern und Lesecoachs unterschieden sich bezüglich des Alters (t [1,104] = 10.50***), des ISEIs (t [1,124] = 2.49*) sowie der Anzahl Bücher zu Hause (t [1,119] = 3.97***) signifikant voneinander, 1 Die restlichen 9,4 % der Kinder und deren Eltern zogen sich entweder aus der Eltern- oder Coachgruppe zurück oder konnten der Kontrollgruppe zugeteilt werden. 2 Diese Trainingspaare sind in den 131 Tandems daher nicht enthalten. 3 Die Leseflüssigkeit wurde mit dem standardisierten und normierten Lesetest LDL (Walter, 2010) erhoben. Er misst die Anzahl richtig gelesener Wörter pro Minute Häufigkeit des Lesetrainings F 1: Wie oft haben sich die Lesetandems getroffen? Zeitaspekte des Trainingsablaufs F 2 a: Wie lange dauerten die Trainingssitzungen durchschnittlich? F 2 b: Wie lange lasen der Coach (Lesecoach bzw. Eltern) und das Kind gemeinsam (gemeinsames Lautlesen)? F 2 c: Wie lange dauerte die buchbezogene bzw. nicht buchbezogene Kommunikation? Kernelemente F 3: Wie gut gelang es den Coachs (Lesecoach bzw. Eltern), sich dem Lesetempo und der Lautstärke des Kindes anzupassen? F 4: Inwiefern wurde der Finger bzw. ein anderes Hilfsmittel als Steuerungselement im Leseprozess schulungsgemäß eingesetzt? F 5: Wurden die Kinder von den Coachs (Lesecoach bzw. Eltern) während des Lesetrainings gelobt? F 6: Umgang mit Lesefehlern: Wie oft ermöglichten die Coachs (Lesecoach bzw. Eltern) dem Kind eine Selbstkorrektur? Tab. 1: Leitfragen zur Überprüfung der Interventionsqualität Implementationsqualität eines Lesetrainings 101 jedoch nicht in der Einschätzung, ob die Kinder durch die Teilnahme im LiT-Projekt ihr Lesen verbessern können (t [1,120] = 1.51, n. s.). Im Anschluss an das Training erhielten sie einen Fragebogen zur Ermittlung ihrer Erfahrungen und generellen Einstellung gegenüber dem Projekt. Die Ergebnisse aus dem Rückmeldefragebogen zeigten, dass sie das Projekt als wertvoll erachteten (t [119] = 0.578, p = .565) und die Anwendung der Methode von beiden Coach- Gruppen als eher einfach bis einfach eingeschätzt wurde (t [119] = 0.949, p = .344). Ferner waren sowohl die Eltern wie auch die Lesecoachs der Ansicht, die Methode sei in der Schulung ausreichend erklärt worden (t [119] = .392, p = .695). Auf eine Überprüfung der Lesekompetenz der Eltern und Lesecoachs mittels eines formalen Testverfahrens wurde verzichtet. Angaben der Lehrpersonen zur Einschätzung der Eignung der involvierten Eltern, Hinweise der Schulleitungen, welche Lesecoachs empfohlen hatten und eigene Beobachtungen an den beiden Schulungsabenden, an denen die Eltern und Lesecoachs mit der PR-Methode durch praktische Übungen vertraut gemacht wurden, lieferten ausreichend Hinweise zur Lesekompetenz der potenziell teilnehmenden Personen. Niemand musste aufgrund dessen vom Projekt ausgeschlossen werden. Schulung der Eltern und Lesecoachs Die Schulung umfasste zwei Abendveranstaltungen von je 90 Minuten, an denen Eltern und Lesecoachs zeitgleich teilnahmen. Sie fand dezentral an neun verschiedenen Standorten statt, was die lokale Durchführung der Veranstaltungen in Kleingruppen ermöglichte. Die Schulungen wurden von insgesamt fünf qualifizierten Projektmitarbeitenden mit profunden Kenntnissen im Bereich Leseförderung durchgeführt und folgten einem zuvor festgelegten Ablaufskript. Dies gewährleistete eine identische Durchführung, um so allen Teilnehmenden dasselbe Wissen über das Projekt und dessen Inhalte zu vermitteln. Während am ersten Schulungsabend der Fokus auf den Erläuterungen zur Leseentwicklung, der Bedeutung der Leseflüssigkeit für das verstehende Lesen (Pikulski & Chard, 2005) sowie den vier Kernelementen der PR-Methode, illustriert anhand von Videobeispielen, lag, widmete sich der zweite Schulungsabend, an welchem auch die Kinder teilnahmen, dem Einüben der PR-Methode. So erhielten die Kinder der Lesecoachgruppe die Gelegenheit, ihren Coach kennenzulernen. Die Tandems konnten anschließend die Methode anhand von Schulungsvideos, welche den Eltern und Lesecoachs auch später online zur Verfügung standen, einüben. Ein wesentliches Ziel dieses zweiten Schulungsabends war die Einübung des synchronen Lesens. Dies erfordert, dass sich der Lesecoach der Lesefähigkeit des Kindes (v. a. Lesetempo und Lautstärke) anpassen kann (Corno & Snow, 1986). Zusätzlich wurde allen Eltern und Lesecoachs ein Schulungsmanual ausgehändigt, das die vier Kernelemente der PR-Methode sowie Hinweise zur Umsetzung enthielt. Für den Austausch von Erfahrungen und zur Klärung von Fragen wurden einige Wochen nach dem Start der Intervention Austauschtreffen an den Schulen organisiert (nicht verpflichtend). Zusätzlich wurden den Lesecoachs und den Eltern persönliche Beratungen während der gesamten Intervention angeboten. Auswahl der Bücher Eine erfolgversprechende Leseförderung soll mit Texten auf dem sogenannten Instruktionsniveau erfolgen (vgl. Hartmann & Niedermann, 2007, S. 7). Dies bedeutet, dass die Kinder die gestellten sprachlichen und lesetechnischen (auch inhaltlichen) Anforderungen des Textes mit unterstützender Hilfe (Erwachsener) bewältigen können. Für das LiT- Lesetraining wurden Kisten mit bis zu 28 Büchern zusammengestellt, die von drei Expertinnen und Experten in Bezug auf ihre Eignung eingeschätzt wurden. Diese erfolgte anhand von sechs Qualitätskriterien (Erscheinungsbild, Thema/ Inhalt, Textgestaltung, Lesbarkeit [Wörter], Sprache, Kommunikation). In einem einfachen Beurteilungsbogen notierten sie, ob das Lesematerial bezüglich der Qualitätskriterien als ungeeignet, bedingt geeignet, geeignet oder gut geeignet eingestuft werden sollte. Den Eltern und Lesecoachs der LiT-Studie wurde eine Liste der Bücher und deren Textschwierigkeit (eher einfach - mäßig - eher anspruchsvoll) zur Verfügung gestellt. Dies sollte die Auswahl von angemessenen Texten (Instruktionsniveau) für die Leseförderung vereinfachen. Damit alle Lesetandems Zugang zu den Büchern hatten, wurden die Kisten in den Schulbibliotheken oder im Klassenzimmer aufgestellt. 102 Catherine Näpflin et al. Erhebungsinstrumente und Datenauswertungen Lesetagebuch Die Häufigkeit und Dauer des Lesetrainings wurde anhand eines Lesetagebuches 4 (N = 130) erhoben, das der Lesecoach bzw. die Eltern im Anschluss an jedes Training zusammen mit dem Kind ausfüllten. Mit dem Lesetagebuch hielten die Tandems wichtige Angaben zu jeder Trainingssitzung fest (Datum, Zeit, Dauer, Titel des Buches, Anzahl gelesener Seiten, besondere Vorkommnisse). Gleichzeitig wurde damit für das Kind erkennbar, wie viel es jeweils gelesen hatte, was motivierend wirken kann. In Folge konnte die Intensität des Trainings anhand der dokumentierten Anzahl Trainingssitzungen, der Anzahl Trainingswochen und der jeweiligen Dauer des Lesetrainings ausgewertet werden. Videoaufnahmen Zusätzlich zu den Selbstberichten der Lesetandems in Form des Lesetagebuches wurden weitere Aspekte der Implementationsqualität auf der Basis von Videoaufnahmen überprüft. Zur Erfassung dieser Außenperspektive wurden die Lesetandems nach etwa der Hälfte der Intervention während einer Trainingssitzung videografiert. Die Lesetandems wurden aufgefordert, das Training so durchzuführen, wie sie es üblicherweise taten. Da 18 Lesetandems der Videoaufnahme nicht zustimmten, lagen zur Auswertung die Videoaufnahmen von N = 113 Lesetandems vor. Die Videoaufnahmen wurden mit niedrig und hoch inferenten Beobachtungsinstrumenten in Bezug auf die Umsetzung zentraler Elemente des Trainings analysiert. Mittels niedrig inferenten Codierungen wurde die Dauer von Teilsequenzen des Lesetrainings (z. B. gemeinsames Lesen) und das Vorhandensein von Lob erfasst. In Ergänzung dazu wurde mit hoch inferenten Ratings die Qualität der Umsetzung einzelner zentraler Elemente des Trainings eingeschätzt (z. B. Synchronizität). Die Beobachtungsinstrumente wurden anhand der Schulungsvideos für die Eltern und Lesecoachs sowie einzelner Aufnahmen aus der vorliegenden Stichprobe theorie- und datengeleitet entwickelt (Hugener, 2006; Lotz, Lipowsky & Faust, 2013; Seidel, Prenzel & Kobarg, 2005). Für die Analyse der Videoaufnahmen wurde ein Manual mit detaillierten Beschreibungen der Beobachtungsdimensionen erstellt, danach wurden die Videoaufnahmen von jeweils zwei geschulten Beobachtern in mehreren Durchgängen codiert. Nachfolgend werden für beide Analyseverfahren die Dimensionen genauer beschrieben. Niedrig inferente Dimensionen und Codes Zeitaspekte des Trainingsablaufs In einem ersten Schritt wurde erfasst, wie lange das Lesetraining gedauert und wie viel Zeit einzelne Sequenzen wie: gemeinsames Lesen von Coach und Kind, Alleine-Lesen des Kindes sowie buchbezogene Kommunikation und nicht-buchbezogene Kommunikation des Lesetrainings beansprucht haben. Einsatz von Lob Eine weitere Dimension, welche in Anlehnung an Lotz et al. (2013) sowie Gabriel und Lipowsky (2013) entwickelt wurde, erfasste das Auftreten von Lob während des Lesetrainings. Da die Lob-Vorkommnisse qualitativ kaum Unterschiede aufwiesen (größtenteils nur kurze, knappe Äußerungen), wurde dieser Aspekt nicht hoch inferent geratet, sondern lediglich das Auftreten mit kommt vor (1) und kommt nicht vor (0) codiert. Lediglich ein Nicken oder das Wiederholen des vom Kind korrigierten Wortes wurde nicht als Lob gewertet, es sei denn, eine lobende Äußerung folgte darauf. Es wurde nicht unterschieden, ob der Coach nur ein kurzes Lob (z. B. „Gut“) äußerte oder darüber hinaus noch weitere Erläuterungen, was z. B. besonders gut war, folgten. Umgang mit Lesefehlern Zur Codierung dieser Dimension wurde ein Beobachtungsinstrument entwickelt, das bei jedem auftretenden Lesefehler erfasst, wie der Coach auf den Fehler reagierte. Die Hauptunterscheidung zwischen den Codes richtete sich danach, ob Fehler übergangen oder aufgegriffen und bearbeitet wurden bzw. ob das Kind die Gelegenheit erhielt, die Fehler selbstständig zu korrigieren oder nicht: „Fehler wird übergangen“, „Fehlerhinweis ohne Selbstkorrekturmöglichkeit“, „Kind und Coach korrigieren zeitgleich“, „Fehlerhinweis mit Möglichkeit zur Selbstkorrektur“, „Kind korrigiert den Fehler ohne Fehlerhinweis“. 4 Darunter ist nicht ein Buch als solches zu verstehen, vielmehr sind es einzelne Kontrollblätter, auf welchen der Coach und das Kind die Trainingssitzung protokollierten. Implementationsqualität eines Lesetrainings 103 Als Maß für die Interrater-Reliabilität wurde bei den niedrig inferenten Dimensionen die prozentuale Übereinstimmung (> .85) verwendet. Nach der Schulung wurde die Übereinstimmung mit der Modellcodierung des Entwicklerteams und nach der Hälfte der zu codierenden Videos die Übereinstimmung zwischen den zwei Beobachtern gemessen (Hugener, 2006). Nicht übereinstimmende Codierungen wurden mit der für die Entwicklung der Kategorien verantwortlichen Person besprochen. Die prozentuale Übereinstimmung der Dimension Lob betrug 97 %. Hoch inferente Dimensionen und Codes Ziel des hoch inferenten Ratings war die Qualitätseinschätzung der beiden zentralen Elemente des Trainings Synchronizität und Steuerung des Leseprozesses mit dem Finger. Die Qualität der hoch inferenten Dimensionen wurde auf einer vierstufigen Ratingskala von sehr geringe Ausprägung (1) bis sehr hohe Ausprägung (4) eingeschätzt. Bei der Beurteilung sind schlussfolgernde Interpretationen (Inferenzen) notwendig (Hugener, 2006). Die Beurteilung basierte auf der Berücksichtigung der beiden Aspekte zeitlicher Anteil und Ausprägung des geschulten Verhaltens (Rakoczy & Pauli, 2006). Aufgrund der höheren Inferenz der Beobachtungsdimensionen wurden alle Videos von beiden Beobachtern eingeschätzt. Für die Auswertung wurden anschließend die Mittelwerte der beiden Beobachter verwendet. Synchronizität beim gemeinsamen Lesen Diese Dimension erfasste, wie stark sich der Coach dem Kind bezüglich Lesetempo und Lautstärke anpasste. Kind und Coach sollten während des gemeinsamen Lesens zeitgleich lesen und gleich gut hörbar sein. Je besser die Synchronizität (= je höher der Wert), desto mehr wurde das Kind beim eigenen Dekodieren akustisch unterstützt. Finger zur Steuerung des Leseprozesses Mit dieser Dimension wurde ermittelt, ob der Coach den Leseprozess mit dem Finger steuerte, d. h. durch konstantes Nachfahren mit dem Finger die zu lesende Stelle markierte und Lesefehler durch Stoppen signalisierte. Eine nicht adäquate Umsetzung zeigte sich dann, wenn der Coach gar nicht, nur phasenweise mit dem Finger steuerte oder wenn er nur auf die Zeile statt auf das Wort zeigte. Bei den hoch inferenten Dimensionen wurde die Reliabilität als relative Konsistenz (Rakoczy & Pauli, 2006) durch den Generalisierbarkeitskoeffizienten 5 ermittelt. Dabei wird ausdifferenziert, welcher Anteil der insgesamt beobachteten Variation zwischen den Ratingurteilen (a) auf Unterschiede zwischen den gefilmten Tandem-Lesetrainings zurückgeführt werden konnte (konstruktbezogene oder wahre Varianz), (b) durch Urteilstendenzen der einzelnen Raterinnen zustande kam (systematische Fehlervarianz) und (c) wie viel unsystematische Variation (unsystematische Fehlervarianz) in die Beurteilung des betreffenden Merkmals einfloss (Lotz et al., 2013). Die ermittelten Generalisierbarkeitskoeffizienten waren mit > .92 für alle Dimensionen sehr zufriedenstellend. Ergebnisse Häufigkeit des Trainings Die Analyse der Lesetagebücher zeigte, dass die Lesetandems - bei einem vorgegebenen Minimum von 40 Trainingssitzungen - durchschnittlich 47 Trainingssitzungen (M = 46.78, SD = 9.61) absolviert haben. In der Gruppe der Kinder, die mit ihren Eltern trainiert hatten (M = 49.64, SD = 11.45), fanden signifikant mehr Sitzungen statt als in der Lesecoach-Gruppe (M = 43.73, SD = 5.84; t [99.50] = -3.74, p < .001) 6 . Insgesamt 26 Lesetandems (15 Lesecoachs und 11 Eltern) absolvierten weniger als 40 Trainingssitzungen. Zudem gab es in der Gruppe der Kinder, die mit den Eltern gelesen hatten, sieben Lesetandems, die mehr als 65 Sitzungen aufwiesen. Die Anzahl Trainingssitzungen verteilte sich über durchschnittlich 20 Wochen (M = 19.59, SD = 2.34), wobei pro Woche im Durchschnitt etwas mehr als zweimal trainiert wurde (M = 2.39, SD = 0.41). Durchschnittliche Dauer des Lesetrainings Gemäß den Lesetagebüchern dauerte eine Trainingssitzung im Durchschnitt 16 min und 25 sek (SD = 2 min 41 sek). Hier zeigten sich keine signifikanten Unterschiede zwischen den beiden Trainingsgruppen (Mann-Whitney-U- Test: z = -0.97, p = .33). Die Analyse der Videoauf- 5 Berechnet mit dem Programm GT (Ysewijn, 1997). 6 Bei den hier berichteten Ergebnissen wurde für den statistischen Vergleich der beiden Gruppen (Lesecoachs/ Eltern) bei normalverteilten Daten t-Tests und bei fehlender Normalverteilung Mann-Whitney-U-Tests gerechnet (Irrtumswahrscheinlichkeit α = 1,0 %). 104 Catherine Näpflin et al. nahmen bestätigte die Selbstauskunft der Coachs und Eltern bezüglich der Dauer des Lesetrainings pro Treffen (vgl. Tab. 2). Auch hier konnten keine statistisch signifikanten Gruppenunterschiede gefunden werden (t [111] = 0.47, p = .64). Phasen des Lesetrainings Grundsätzlich wurden folgende Phasen des Lesetrainings unterschieden: gemeinsames Lesen, Alleine-Lesen, buchbezogene und nicht-buchbezogene Kommunikation. Die Dauer des gemeinsamen Lesens variierte in den aufgezeichneten Trainingssitzungen stark, von gar keinem bis zu mehr als 23 Minuten gemeinsamen Lesens. Es zeigte sich, dass 6 der 113 Lesetandems in der videografierten Trainingssitzung nie gemeinsam lasen. Zwei dieser Tandems stammten aus der Lesecoach- und vier aus der Elterngruppe. Das gemeinsame Lesen nahm in beiden Gruppen durchschnittlich den größten Teil des Lesetrainings ein (Lesecoachs: 66,8 %, Eltern: 65,1 %) und lag bei knapp 11 Minuten. Signifikante Gruppenunterschiede wurden jedoch keine gefunden (t [111] = 0.76, p = .45; vgl. Tab. 2). Das Alleine-Lesen nahm in beiden Gruppen den zweitgrößten Teil des Lesetrainings ein (Lesecoachs: 27,4 %, Eltern: 31,8 %). Die Dauer variierte zwischen gar keinem bis knapp 25 Minuten. Bei 89 von 113 Lesetandems gab es mindestens eine Phase, in der das Kind alleine las. Durchschnittlich dauerte das Alleine-Lesen über beide Gruppen hinweg genau 5 Minuten. Zwischen den Lesecoachs und den Eltern zeigte sich diesbezüglich kein signifikanter Unterschied (Mann- Whitney-U-Test: z = 0.51, p = .61; vgl. Tab. 2). Die buchbezogene Kommunikation nahm in der Lesecoachgruppe durchschnittlich 4,8 % des Lesetrainings ein und in der Elterngruppe 2,3 %. Die Dauer variierte von 0 bis etwas mehr als 5 Minuten. Bei dieser Variable gab es signifikante Gruppenunterschiede: In der Gruppe der Lesecoachs wurde länger über das gelesene Buch gesprochen als in der Gruppe der Eltern (Mann- Whitney-U-Test: z = -2.50, p < .05; vgl. Tab. 2). Die nicht-buchbezogene Kommunikation (z. B. über ein klingelndes Telefon oder Geschwister) nahm in der Elterngruppe 0,8 % und in der Lesecoachgruppe 1,0 % des Lesetrainings ein. Die längste nicht-buchbezogene Kommunikation innerhalb eines Trainings dauerte insgesamt etwas mehr als 2 Minuten (vgl. Tab. 2). Hier gab es keine signifikanten Gruppenunterschiede (Mann-Whitney-U-Test: z = -0.11, p = .91). Variablen Gruppe Min Max M SD z p Dauer Lesetraining insgesamt Lesecoach Eltern Total 09 : 16 06 : 32 06 : 32 24 : 40 26 : 31 26 : 31 16 : 36 16 : 17 16 : 27 03 : 34 03 : 46 03 : 38 -0.70 .48 Dauer gemeinsames Lesen Lesecoach Eltern Total 00 : 00 00 : 00 00 : 00 23 : 32 18 : 57 23 : 32 11 : 06 10 : 18 10 : 42 05 : 34 05 : 36 05 : 34 -0.39 .69 Dauer Alleine-Lesen Lesecoach Eltern Total 00 : 00 00 : 00 00 : 00 24 : 21 24 : 43 24 : 43 04 : 34 05 : 28 05 : 00 05 : 16 06 : 11 05 : 43 -0.50 .62 Dauer Kommunikation buchbezogen Lesecoach Eltern Total 00 : 00 00 : 00 00 : 00 05 : 33 03 : 55 05 : 32 00 : 47 00 : 23 00 : 35 01 : 06 00 : 48 00 : 59 -2.51 .01 Dauer Kommunikation nicht-buchbezogen Lesecoach Eltern Total 00 : 00 00 : 00 00 : 00 02 : 16 01 : 07 02 : 15 00 : 09 00 : 07 00 : 08 00 : 25 00 : 15 00 : 20 -0.13 .90 Tab. 2: Dauer des Lesetrainings, des gemeinsamen sowie Alleine-Lesens und der trainingsbegleitenden Kommunikation (Videodaten) Anmerkungen: Angaben in Minuten : Sekunden. Coach n = 59, Eltern n = 54, Total N = 113. Implementationsqualität eines Lesetrainings 105 Ergebnisse zu den geschulten vier Kernelementen der PR-Methode Synchronizität beim gemeinsamen Lesen Die Videoaufnahmen wurden auch dahingehend ausgewertet, ob die Lesecoachs und die Eltern hinsichtlich des Lesetempos und der Lautstärke synchron mit dem Kind lasen. Es zeigte sich, dass es den Eltern und Lesecoachs größtenteils gut gelang, synchron (bzgl. Lesetempo und Lautstärke) mit dem Kind zu lesen (vgl. Tab. 3). Hinsichtlich der Synchronizität zeigten sich keine signifikanten Gruppenunterschiede (Mann-Whitney-U-Test: Tempo: z = -0.36, p = .72; Lautstärke: z = 1.10, p = .27). Steuerung des Leseprozesses mit dem Finger In beiden Gruppen wurde der Leseprozess mehrheitlich konstant mit dem Finger gesteuert. Dennoch gab es in beiden Gruppen wenige Lesetandems, in denen der Leseprozess nur phasenweise mit dem Finger gesteuert oder nur die Zeile mit dem Finger angezeigt wurde. In einzelnen Tandems gab es keine Steuerung durch den Finger (Lesecoachgruppe: n = 7, Elterngruppe: n = 1; vgl. Tab. 4). Insgesamt zeigte sich diesbezüglich kein signifikanter Gruppenunterschied (Mann- Whitney-U-Test: z = 0.41, p = .68). Einsatz von Lob Bei 91 von 113 Lesetandems konnte in der gefilmten Trainingssitzung mindestens eine Sequenz mit Lob beobachtet werden. Einen signifikanten Gruppenunterschied gab es jedoch nicht (Mann-Whitney-U-Test: z = -3.02, p < .05). In der Gruppe der Eltern konnte bei 16 Tandems kein Lob beobachtet werden, bei den Lesecoachs traf dies bei 6 Tandems zu. Umgang mit Lesefehlern Die Analysen der videografierten Trainingssitzungen zeigten, dass in der Elterngruppe 32,3 % und in der Lesecoachgruppe 36,3 % der Lesefehler übergangen wurden (Mann-Whitney-U-Test: z = -1.31, p < .19). Wenn Lesefehler korrigiert wurden, geschah dies in beiden Gruppen größtenteils so, dass die Coachs einen Fehlerhinweis Variablen Gruppe M SD Median z p Lesetempo Lesecoach Eltern Total 3.36 3.38 1.00 0.83 0.68 4.00 4.00 3.50 3.37 -0.36 .72 Lautstärke Lesecoach Eltern Total 3.41 3.61 1.00 0.76 0.54 4.00 4.00 4.00 3.50 -1.10 .27 Tab. 3: Synchronizität von Lesetempo und Lautstärke (Videodaten) Anmerkungen: Skalierung: kaum Steuerung (1), Steuerung mit Unterbrüchen (2), größtenteils konstante Steuerung (3), konstante Steuerung (4). Coach n = 59, Eltern n = 54, Total N = 103. Von den 113 videografierten Trainingssitzungen konnte bei 10 Lesetandems die Synchronizität nicht eingeschätzt werden, da als Analysekriterium eine Minute gemeinsames Lesen als Mindestmaß galt. Davon betroffen sind zwei Tandems aus der Coach- und acht aus der Elterngruppe. Dies erklärt die abweichenden N. Variable Gruppe M SD Median z p Steuerung mit dem Finger Lesecoach Eltern Total 3.49 3.67 1.00 1.01 0.67 4.00 4.00 4.00 3.58 -0.41 .68 Tab. 4: Steuerung des Leseprozesses mit dem Finger (Videodaten) Anmerkungen: Skalierung: kaum Steuerung (1), Steuerung mit Unterbrüchen (2), größtenteils konstante Steuerung (3), konstante Steuerung (4). Coach n = 59, Eltern n = 54, Total N = 113. 106 Catherine Näpflin et al. gaben und das Kind die Möglichkeit zur Selbstkorrektur hatte. Dies entspricht der geschulten Umgangsweise mit Lesefehlern. Die gemeinsame Korrektur der Lesefehler von Coach und Kind konnte in der Elterngruppe bei 19,8 % und in der Lesecoachgruppe bei 16,8 % beobachtet werden (Mann-Whitney-U-Test: z = -0.54, p < .59). Weniger häufig kam die Vorgabe der korrekten Lesart durch den Coach (11,5 %) bzw. die Eltern (10,6 %) vor (Mann-Whitney-U-Test: z = -0.18, p < .86). Selten korrigierte das Kind den Fehler selbst, ohne einen Hinweis vom Coach zu erhalten (Mann-Whitney-U-Test: z = -0.96, p < .96). Es konnte bei keiner Dimension bezüglich des Umgangs mit Lesefehlern ein signifikanter Gruppenunterschied gefunden werden (vgl. Tab. 5). Diskussion Ziel des Beitrags war, am Beispiel des Interventionsprojekts LiT - Lesen im Tandem Möglichkeiten zur Beurteilung der Implementationsqualität anhand unterschiedlicher Datenquellen und Perspektiven (Lesetagebücher, Videodaten) aufzuzeigen. Der Hauptfokus galt der objektiven Analyse der Implementationsqualität aus der Beobachterperspektive. Die Auswertungen der Videodaten und der Lesetagebücher zeigten, dass die geforderte Häufigkeit und Dauer der Trainingssitzungen sowie die geschulten vier Kernelemente der Intervention (Synchronizität in Lautstärke und Tempo, mit dem Finger nachfahren, Einsatz von Lob, Umgang mit Lesefehlern) von beiden Interventionsgruppen größtenteils wie intendiert umgesetzt wurden. So lag die durchschnittliche Anzahl Trainingssitzungen mit 47 Sitzungen und deren durchschnittliche Dauer mit ca. 16 Minuten im erwarteten Bereich. In der Elterngruppe wurden signifikant mehr Trainingssitzungen vermerkt als in der Coachgruppe. Dies ist überraschend wie auch erwartungswidrig, da aufgrund der oft hohen zeitlichen Belastungen von Familien, etwa durch geplante Freizeitaktivitäten der Kinder oder berufsbedingte Abwesenheit der Eltern, die Durchführung von regelmäßigen Leseaktivitäten im Elternhaus erschwert ist (McElvany & van Steensel, 2009). Der Unterschied könnte daher rühren, dass Eltern über die Woche hinweg (inkl. Wochenende) mehr Möglichkeiten hatten, das Training einzuplanen. Die Lesecoachs waren dagegen an die vereinbarten Termine während der Woche gebunden. Etwaige z. B. krankheitsbedingte Ausfälle konnten dann meist nicht mehr nachgeholt werden. Bezüglich Variablen Gruppe M SD Median z p Fehler wird übergangen Lesecoach Eltern Total .36 .32 .34 .20 .18 .19 .37 .32 .33 -1.31 .19 Fehler ohne Möglichkeit zur Selbstkorrektur (Lösung wird vorgegeben) Lesecoach Eltern Total .12 .11 .11 .13 .11 .12 .07 .08 .08 -0.18 .86 Kind und Coach korrigieren gemeinsam Lesecoach Eltern Total .17 .20 .18 .14 .18 .16 .13 .18 .15 0.54 .59 Fehlerhinweis mit Möglichkeit zur Selbstkorrektur Lesecoach Eltern Total .30 .32 .29 .20 .22 .12 .26 .28 .26 0.43 .67 Kind korrigiert den Fehler ohne Fehlerhinweis Lesecoach Eltern Total .06 .05 .05 .06 .05 .06 .04 .04 .04 0.96 .96 Tab. 5: Prozentuale Anteile der einzelnen Fehlerkorrekturen an der Gesamtzahl der Lesefehler (Videodaten) Anmerkungen: Coach n = 59, Eltern n = 54, Total N = 113. Implementationsqualität eines Lesetrainings 107 der Dauer der Trainingseinheit gab es keine signifikanten Gruppenunterschiede, was auf die einfache und klare Instruktion hinsichtlich der Zeitstruktur der Fördermethode („15 Minuten gemeinsam lesen“) zurückgeführt werden dürfte. Die Ergebnisse zu den einzelnen Phasen des Lesetrainings zeigten, dass ein Großteil der Tandems gemäß der Schulung die meiste Zeit gemeinsam, laut gelesen hat. Die Wahrung der Möglichkeit des Kindes, auf ein Zeichen hin auch Abschnitte alleine zu lesen, wurde wie intendiert umgesetzt. Über beide Gruppen hinweg las das Kind durchschnittlich während 5 Minuten alleine. Es konnten wiederum keine Gruppenunterschiede beobachtet werden. Dagegen unterschieden sich die beiden Gruppen in der buchbezogenen Kommunikation signifikant. Lesecoachs sprachen deutlich länger mit dem Kind über das Gelesene als Eltern. Eine Erklärung dafür könnte sein, dass die Lesecoachs, die mit dem Kind weniger vertraut waren, der Interaktion und Kommunikation während des Trainings insgesamt mehr Beachtung schenkten. Für Eltern hingegen war die Durchführung des Trainings in den familiären Alltag eingebettet, wo bereits diverse Kommunikationsmuster und -möglichkeiten bestehen (Koerner & Fitzpatrick, 2002). Vorkommnisse oder Gespräche, welche nicht das Buch betrafen (z. B. Telefon klingelt, Geschwister lenken ab u. a.), traten in beiden Gruppen äußerst selten auf. Erfreulich sind die Ergebnisse zu den geschulten vier Kernelementen Synchronizität, Steuerung mit dem Finger, Lob und Umgang mit Fehlern. Sie wurden großmehrheitlich wie vermittelt umgesetzt. Es gelang den Tandems beider Gruppen, bezüglich Lesetempo und Lautstärke synchron zu lesen. Es gab aber auch hier Abweichungen, beispielsweise in der Fingerführung, welche phasenweise ausgesetzt wurde oder teils gar nicht zu beobachten war, oder im Umgang mit Fehlern, wobei in beiden Gruppen nicht jeder Fehler korrigiert wurde. Möglicherweise wollten die Lesecoachs bzw. die Eltern den Lesefluss des Kindes nicht unterbrechen oder sie befürchteten, das Kind mit häufigem Korrigieren zu demotivieren (vermindertes Kompetenzerleben; Deci & Ryan, 1985). Dennoch ist hervorzuheben, dass in beiden Gruppen der Großteil der Fehlervorkommnisse schulungskonform, d. h. mit der Möglichkeit zur Selbstkorrektur durch das Kind, bearbeitet wurde. Hinsichtlich der Umsetzung des Kernelements Lob unterschieden sich beide Gruppen signifikant. Wie bereits bei der buchbezogenen Kommunikation waren es wiederum die Lesecoachs, die das Kind auch deutlich mehr lobten. Dies geschah womöglich aus ähnlichen Gründen, wie bereits erläutert. Die Lesecoachs mussten das Vertrauen des Kindes erst gewinnen und achteten daher eher darauf, das Kind durch lobende Worte oder anerkennende Gesten zu motivieren. Diese Befunde lassen einerseits vermuten, dass eine hochstrukturierte Methode wie das Paired-Reading die schulungskonforme Umsetzbarkeit erleichtert und gleichzeitig die Möglichkeit hoher Diversität bei der Umsetzung schmälert. Andererseits können die sorgfältig durchgeführten und qualitativ hochstehenden Schulungen der Teilnehmenden sowie die Fokussierung auf die zentralen Elemente der Fördermethode mit dafür verantwortlich sein, dass das Training programmkonform umgesetzt wurde. Unterstützend wirkten vermutlich auch die Schulungsvideos, welche die Leseintervention klar, verständlich und praxisbezogen darstellten und den Lesecoachs und Eltern auch nach der Schulung zur Verfügung standen. Wenn sich die Unterschiede zwischen den Eltern und Lesecoachs bei der Umsetzung der Methode lediglich auf die Anzahl der Trainingssitzungen, den Einsatz von Lob und die buchbezogene Kommunikation beschränkten, liegt die Begründung dafür vermutlich ebenfalls in der hohen Strukturiertheit und Klarheit der Methode, welche Unterschiede aufgrund des Settings oder der Beziehungsqualität nur bedingt zulassen. Studienlimitationen und Forschungsausblick Interventionsstudien bergen eine Reihe von Herausforderungen (Astleitner, 2010; Marx & Steinhoff, 2017). Eine wesentliche ist die kor- 108 Catherine Näpflin et al. rekte Implementation der Fördermethode gemäß den in den Schulungen vermittelten Inhalten (Implementationsqualität) zur Erzielung der größtmöglichen Effekte auf die Zielvariable(n) (bzw. Erreichung interner Validität). Die Erfahrungen aus der LiT-Studie zeigten, dass neben der Strukturiertheit der PR-Methode, der niederschwelligen und klaren Schulung der Trainer und dem Fokussieren auf zentrale Kernelemente der Intervention auch das individuelle Coaching der Teilnehmenden während der Intervention für die Implementationsqualität eines Trainings bedeutungsvoll sind. Letzteres Angebot war in der LiT-Studie aus Zeit- und Kostengründen sowie aufgrund von zu großen geografischen Distanzen nicht flächendeckend möglich. Mit zunehmender Digitalisierung ist auch denkbar, ein video- und internetbasiertes Beratungsangebot zu offerieren, in dem zur hochgeladenen Videosequenz des eigenen Trainings eine Rückmeldung durch das Forschungsteam erfolgt. Diese Vermutungen zur Bedeutung von Schulung und begleitendem Coaching bedürfen aber weiterer Forschung, um den Einfluss der Schulung auf Qualitätsaspekte der Trainingsdurchführung und damit auf die Wirksamkeit der Intervention zu klären. Eine weitere Einschränkung im Zusammenhang mit Interventionsstudien ist die Tatsache, dass Daten zur Implementationsqualität oftmals Momentaufnahmen darstellen. Auch mit Blick auf die vorliegende Studie ist einschränkend festzuhalten, dass die Daten der Videoanalysen auf lediglich einer von durchschnittlich 47 Trainingssitzungen basieren, d. h. es wird nur ein kleiner Ausschnitt der gesamten Umsetzung des Trainings wiedergegeben. Um allfällige Variationen der Umsetzung während der Intervention noch besser beschreiben zu können, wären weitere Videoaufnahmen empfehlenswert. Andererseits zeigen Untersuchungen zur Generalisierbarkeit von Beobachtungsdaten, dass vor allem inhaltsübergreifende Faktoren der Instruktionsqualität in Lehr-/ Lernprozessen eine hohe Stabilität aufweisen (Praetorius, Pauli, Reusser, Rakoczy & Klieme, 2014). Dieser Befund könnte also die Verwendung von Daten einer einzelnen Trainingssitzung rechtfertigen. Weitere Befragungsdaten der Beteiligten (z. B. zur Akzeptanz der Schulung oder der Form und der Dauer der Intervention resp. Gesamtaufwand oder Organisation) könnten zudem eine ergänzende Innensicht darstellen. Weiter sollten die Kriterien für eine angemessene Umsetzung von Interventionen bzw. für eine ausreichende Implementationsqualität noch vertiefter diskutiert werden (O’Donell, 2008). In diesem Zusammenhang stellt sich die Frage, wie mit den Daten von Teilnehmenden mit geringer, nicht ausreichender Implementationsqualität in Wirkungsanalysen weiter verfahren werden soll. In einem nächsten Schritt könnten die videobasiert erfassten Kriterien der Implementationsqualität als mediierende Faktoren in Wirkanalysen integriert werden. Dies wird in Publikationen mit Metaanalysen von Wirkungsstudien wiederholt gefordert (vgl. Durlak & DuPre, 2008), jedoch trotz der großen Relevanz, insbesondere auch im Bereich der familiären Leseförderung, immer noch zu wenig gemacht (z. B. van Steensel et al., 2011). Eigene weiterführende Analysen haben gezeigt, dass die einzelnen Faktoren der Implementationsqualität - hier die vier geschulten Kernelemente - geringe oder gar negative Korrelationen aufweisen. Dies deutet darauf hin, dass Implementationsqualität auch in zukünftigen Studien unbedingt als mehrfaktorielles Konstrukt betrachtet werden sollte und es noch weiterer Forschung bedarf, um zu klären, welche Einzelfaktoren wie miteinander zusammenhängen. Zusammenfassend konnte am Beispiel des LiT-Projekts aufgezeigt werden, wie Aspekte der Implementationsqualität umfassend und aus unterschiedlichen Perspektiven (Videografie zur objektiven Erfassung von Prozessvariablen durch externe Beobachter und Selbstberichte der Beteiligten mittels Tagebüchern) erfasst werden können und welche Bedingungen die Wahrscheinlichkeit einer hohen Implementationsqualität begünstigen: Stark strukturierte Implementationsqualität eines Lesetrainings 109 Förderprogramme wie die PR-Methode lassen eine gute Implementationsqualität erwarten, sofern die Methode auf verständliche und eingängige Weise vermittelt wird. Literatur Artelt, C., Stanat, P., Schneider, W. & Schiefele, U. (2001). Lesekompetenz: Testkonzeption und Ergebnisse. In J. Baumert, E. Klieme, M. Neubrand, M. Prenzel, U. Schiefele, W. Schneider, … M. Weiss (Hrsg.), PISA 2000 - Basiskompetenzen von Schülerinnen und Schülern im internationalen Vergleich (S. 69 - 137). Opladen: Leske + Budrich. Astleitner, H. (2010). Methodische Rahmenbedingungen zur Entdeckung der Wirksamkeit von pädagogischen Interventionen. In T. Hascher & B. Schmitz (Hrsg.), Pädagogische Interventionsforschung. Theoretische Grundlagen und empirisches Handlungswissen (S. 48 - 62). Weinheim: Juventa. Becker-Mrotzek, M. & Butterworth, J. (2018). Qualitätsbestimmende Faktoren bei der Implementierung von (Sprach-)Förderkonzepten. In C. Titz, S. Weber, A. Ropeter, S. Geyer & M. Hasselhorn (Hrsg.), Konzepte zur Sprach- und Schriftsprachförderung umsetzen und überprüfen (Bildung durch Sprache und Schrift, Bd. 2, S. 46 - 61). Stuttgart: Kohlhammer. Brophy, M. (1981). Teacher praise: A functional analysis. Review of Educational Research, 51, 5 - 32. https: / / dx. https: / / dx.doi.org/ 10.1186/ 1748-5908-2-40 Carroll, C., Patterson, M., Wood, S., Booth, A., Rick, J. & Balain, S. (2007). A conceptual framework for implementation fidelity, Implementation Science, 2: 40. https: / / dx.doi.org/ 10.1186/ 1748-5908-2-40 Chen, H. (1990). Theory-driven evaluations. Thousand Oaks, CA: Sage. https: / / dx.doi.org/ 10.1007/ 978-3-531-190 09-9_2 Corno, L. & Snow, R. E. (1986). Adapting teaching to individual differences among learners. In C. Wittrock (Ed.), Handbook of research on teaching (pp. 605 - 629). New York, NY: Macmillan Publishing Company. Deci, E. L. & Ryan, R. M. (1985). Intrinsic motivation and self-determination in human behavior. New York, NY: Plenum. De la Rie, S., van Steensel, R. C. M. & van Gelderen, A. J. S. (2017). Implementation quality of family literacy programs: A review of literature. Review of Education, 8, 91 - 118. https: / / dx.doi.org/ 10.1002/ rev3.3088 Durlak, J. A. & DuPre, E. P. (2008). Implementation matters: A review of research on the influence of implementation on program outcomes and the factors affecting implementation. American Journal of Community Psychology, 41, 327 - 350. https: / / dx.doi.org/ 10.1007/ s10464-008-9165-0 Elbaum, B., Vaughn, S., Hughes, M.T. & Moody, S. W. (2000). How effective are one-to-one tutoring programs in reading for elementary students at risk for reading failure? A meta-analysis of the intervention research. Journal of Educational Psychology, 92, 605 - 619. Gabriel, K. & Lipowsky, F. (2013). Hoch inferentes Rating: Unterrichtsklima in Deutsch, Kunst und Mathematik. In M. Lotz, F. Lipowsky & G. Faust (Hrsg.), Dokumentation der Erhebungsinstrumente des Projekts „Persönlichkeits- und Lernentwicklung von Grundschulkindern“. Technischer Bericht zu den PERLE-Videostudien. Materialien zur Bildungsforschung (23/ 3). Frankfurt a. M.: Gesellschaft zur Förderung Pädagogischer Forschung (GFPF). Galuschka, K. & Schulter-Körne, G. (2015). Evidenzbasierte Interventionsansätze und forschungsbasierte Programme zur Förderung der Leseleistung bei Kindern und Jugendlichen mit Lesestörung. Ein systematischer Review. Zeitschrift für Erziehungswissenschaft, 18, 473 - 487. https: / / dx.doi.org/ 10.1007/ s11618-0 15-0650-6 Gibbons, P. (2002). Scaffolding language, scaffolding learning. Teaching second language learners in the mainstream classroom. Portsmouth: Heinemann. Gräsel, C. & Parchmann, I. (2004). Implementationsforschung - oder: Der steinige Weg, Unterricht zu verändern. Unterrichtswissenschaft, 32, 196 - 214. Zugriff am 26. 6. 2018 unter https: / / www.pedocs.de/ volltexte/ 20 13/ 5813/ pdf/ UntWiss_2004_3_Graesel_Parchmann_ Implementationsforschung.pdf Hartmann, E. & Niedermann, A. (2007). Flüssig lesen mit Pattern Books. Begleitheft zu den Lesebüchern. Ein Instrument zur Feststellung und Förderung der Leseflüssigkeit. Hölstein: VerlagKg.CH. Hugener, I. (2006). Überblick über die Beobachtungsinstrumente. In E. Klieme, C. Pauli & K. Reusser (Hrsg.), Dokumentation der Erhebungs- und Auswertungsinstrumente zur schweizerisch-deutschen Videostudie „Unterrichtsqualität, Lernverhalten und mathematisches Verständnis“ (Teil 3: Hugener, I., Pauli, C. & Reusser, K., Videoanalysen [Materialien zur Bildungsforschung, Bd. 15, S. 45 - 54]). Frankfurt a. M.: Gesellschaft zur Förderung Pädagogischer Forschung (GFPF). Koerner, A. F. & Fitzpatrick, M. A. (2002). Toward a theory of family communication. Communication Theory, 12, 70 - 91. https: / / dx.doi.org/ 10.1111/ j.1468-2885.2002. tb00260.x Kuhn, M. R., Stahl, S. A. (2003). Fluency. A review of developmental and remedial practices. Journal of Educational Psychology, 95, 3 - 21. Lotz, M., Lipowsky, F. & Faust, G. (2013). Technischer Bericht zu den PERLE-Videostudien. In F. Lipowsky & G. Faust (Hrsg.), Dokumentation der Erhebungsinstrumente des Projekts „Persönlichkeits- und Lernentwicklung von Grundschulkindern“ (Materialien zur Bildungsforschung, Bd. 23). Frankfurt a. M.: Gesellschaft zur Förderung Pädagogischer Forschung (GFPF). Zugriff am 26. 6. 2018 unter http: / / www.pedocs.de/ volltexte/ 2013/ 7702/ pdf/ MatBild_Bd23_3.pdf Marx, N., Steinhoff, T. (2017). Unterrichtsbezogene Interventionen. In: M. Becker-Mrotzek, J. Grabowski & T. Steinhoff (Hrsg.), Forschungshandbuch empirische Schreibdidaktik (S. 253 - 267). Münster: Waxmann. McElvany, N. & van Steensel, R. (2009). Potentials and challenges of family literacy interventions: The question of implementation quality. European Educational Research Journal, 8, 418 - 433. https: / / dx.doi.org/ 10.2304/ eerj.2009.8.3.418 McKenna, J. W., Flower, A. & Ciullo, S. (2014). Measuring fidelity to improve intervention effectiveness. Intervention in School and Clinic, 50, 15 - 21. https: / / dx.doi. org/ 10.1177/ 1053451214532348 Metze, W. (2009). Stolperwörter-Lesetest: STOLLE. Ergebnisse der Stichprobenerhebung. Berlin. Zugriff am 28. 11. 2016 unter https: / / www.uni-potsdam.de/ de/ gspdeutsch/ forschung/ stolle.html 110 Catherine Näpflin et al. Mowbray, C.T., Holter, M. C., Teague, G. B. & Bybee, D. (2003). Fidelity criteria: Development, measurement, and validation. American Journal of Evaluation, 24, 315 - 340. https: / / dx.doi.org/ 10.1177/ 1098214003024003 03 National Reading Panel (2000). Teaching children to read. An evidence-based assessment of the scientific research literature on reading and its implications for reading instruction. Washington, DC: National Institut of Child Health and Development. O’Donnell, C. L. (2008). Defining, conceptualizing, and measuring fidelity of implementation and its relationship to outcomes in K-12 curriculum intervention research. Review of Educational Research, 78, 33 - 84. https: / / dx.doi.org/ 10.3102/ 0034654307313793 OECD & Statistics Canada (2000). Literacy in the information age. Final report of the international adult literacy survey. Paris: OECD and Minister of Industry, Canada. Zugriff am 26. 6. 2018 unter http: / / www.oecd.org/ education/ skills-beyond-school/ 41529765.pdf Overett, J. & Donald, D. (1998). Paired reading: Effects of a parent involvement programme in a disadvantaged community in South Africa. British Journal of Educational Psychology, 68, 347 - 356. https: / / dx.doi.org/ 10. 1111/ j.2044-8279.1998.tb01296.x Petermann, F. (2014). Implementationsforschung. Grundbegriffe und Konzepte. Psychologische Rundschau, 65, 122 - 128. Philipp, M. & Souvignier, E. (2016). Lesefördermassnahmen zwischen Gelingensbedingungen und Implementierungshindernissen: Lessons learned, lessons yet to learn. In: M. Philipp & E. Souvignier (Hrsg.), Implementation von Lesefördermaßnahmen: Perspektiven auf Gelingensbedingungen und Hindernisse (S. 123 - 149). Münster: Waxmann. Pikulski, J. J. & Chard, D. J. (2005). Fluency: Bridge between decoding and reading comprehension. The Reading Teacher, 58, 510 - 519. https: / / dx.doi.org/ 10.1598/ RT.58.6.2 Powell, D. R. & Carey, A. (2012) Approaches to program fidelity in family literacy research. In B. H. Wasik (Ed.), Handbook of family literacy (2nd ed., pp. 387 - 400). New York, NY: Routledge. Praetorius, A.-K., Pauli, C., Reusser, K., Rakoczy, K. & Klieme, E. (2014). One lesson in all you need? Stability of instructional quality across lessons. Learning and Instruction, 31, 2 - 12. Rakoczy, K. & Pauli, C. (2006). Hoch inferentes Rating: Beurteilung der Qualität unterrichtlicher Prozesse. In E. Klieme, C. Pauli & K. Reusser (Hrsg.), Dokumentation der Erhebungs- und Auswertungsinstrumente zur schweizerisch-deutschen Videostudie „Unterrichtsqualität, Lernverhalten und mathematisches Verständnis“ (Teil 3: Hugener, I., Pauli, C. & Reusser, K., Videoanalysen [Materialien zur Bildungsforschung, Bd. 15, S. 206 - 233]). Frankfurt a. M.: Gesellschaft zur Förderung Pädagogischer Forschung (GFPF). Rasinski, T. & Nageldinger, J. K. (2016). The fluency factor. Authentic instruction and assessment for reading success in the common core classroom. New York, NY: Teachers College Press. Ritter, G. W., Barnett, J. H., Denny, G. S. & Albin, G. R. (2009). The effectiveness of volunteer tutoring programs for elementary and middle school students: A meta-analysis. Review of Educational Research, 79, 3 - 38. https: / / dx.doi.org/ 10.1177/ 1476718X11407989 Schulte, A. C., Easton, J. E. & Parker, J. (2009). Advances in treatment integrity research: Multidisciplinary perspectives on the conceptualization, measurement, and enhancement of treatment integrity. School Psychology Review, 38, 460 - 475. Seidel, T., Prenzel, M. & Kobarg, M. (Hrsg.). (2005). How to run a video study. Technical report of the IPN-videostudy. Münster: Waxmann. Souvignier, E. & Philipp, M. (2016). Implementation - Begrifflichkeiten, Befunde und Herausforderungen. In M. Philipp & E. Souvignier (Hrsg.), Implementation von Lesefördermassnahmen: Perspektiven auf Gelingensbedingungen und Hindernisse (S. 9 - 23). Münster, Waxmann. Swanson, E., Wanzek, J., Haring, C., Ciullo, S. & McCulley, L. (2013). Intervention fidelity in special and general education research journals. The Journal of Special Education, 47, 3 - 13. https: / / dx.doi.org/ 10.1177/ 0022466 911419516 Topping, K. J. (1995). Paired reading, spelling and writing. London: Cassell. Topping, K. J. (2001). Thinking reading writing. A practical guide to paired learning with peers, parents and volunteers. London: Continuum. Topping, K. J., Thurston, A., McGavock, K. & Conlin, N. (2012). Outcomes and process in reading tutoring. Educational Research, 54, 239 - 258. https: / / dx.doi.org/ 10.1080/ 00131881.2012.710086 Van Steensel, R., McElvany, N., Kurvers, J. & Herppich, S. (2011). How effective are family literacy programs? Results of a meta-analysis. Review of Educational Research, 81, 69 - 96. https: / / dx.doi.org/ 10.3102/ 00346543103 88819 Walter, J. (2010). Lernfortschrittsdiagnostik Lesen (LDL). Manual. Göttingen: Hogrefe. Wolf, M. & Katzir-Cohen, T. (2001). Reading fluency and its intervention. Scientific Studies of Reading, 5, 211 - 239. https: / / dx.doi.org/ 10.1207/ S1532799XSSR050 3_2 Ysewijn, P. (1997). GT-Programm für Generalisierbarkeitsstudien. Zugriff am 5. 1. 2016 unter http: / / ysewijn.lesciga les.org/ german_gt.htm Catherine Näpflin Manuela Frommelt Prof. Dr. Annette Tettenborn Pädagogische Hochschule Luzern Forschung und Entwicklung Institut für Professions- und Unterrichtsforschung (IPU) Töpferstr. 10 CH-6004 Luzern E-Mail: catherine.naepflin@phlu.ch manuela.frommelt@gmail.com annette.tettenborn@phlu.ch Prof. Dr. Isabelle Hugener Pädagogische Hochschule Luzern Fachleitung Berufsstudien Grundjahr Museggstr. 37 CH-6004 Luzern Implementationsqualität eines Lesetrainings 111 Prof. Dr. Kathrin Krammer Pädagogische Hochschule Luzern Prorektorin Ausbildung Pfistergasse 20 CH-6000 Luzern E-Mail: kathrin.krammer@phlu.ch Prof. Dr. Caroline Villiger Pädagogische Hochschule Bern Institut für Forschung, Entwicklung und Evaluation Fabrikstr. 8 CH-3012 Bern E-Mail: caroline.villiger@phbern.ch Silke Hauri Pädagogische Hochschule Fribourg Rue de Morat 36 CH-1700 Fribourg E-Mail: hauris@edufr.ch Prof. Dr. Erich Hartmann Universität Fribourg Departement für Sonder- und Heilpädagogik Petrus-Kanisius-Gasse 21 CH-1700 Fribourg E-Mail: erich.hartmann@unifr.ch