eJournals Vierteljahresschrift für Heilpädagogik und ihre Nachbargebiete 76/1

Vierteljahresschrift für Heilpädagogik und ihre Nachbargebiete
5
0017-9655
Ernst Reinhardt Verlag, GmbH & Co. KG München
11
2007
761

Förderung des Leseverständnisses bei Schülerinnen und Schülern mit Lernschwierigkeiten - eine Metaanalyse

11
2007
Elmar Souvignier
Faye Antoniou
In diesem Forschungsüberblick über 81 Interventionsstudien zur Förderung des Leseverständnisses bei Schülern mit Lernschwierigkeiten werden zwei Fragestellungen bearbeitet: Welchen Einfluss haben a) Designmerkmale von Studien und b) die Inhalte von Fördermaßnahmen auf die Effektivität. Im Hinblick auf die Designmerkmale erweisen sich das eingesetzte Testverfahren, die Dauer der Intervention und das Fördersetting als relevante Moderatoren. Dabei lassen sich zwei Typen von Forschungsansätzen unterscheiden: „Kontrollierte“ Untersuchungen (kurze Förderungen in sonderpädagogischen Settings, evaluiert mit von den Untersuchern entwickelten Testverfahren) mit einer hohen mittleren Effektstärke von d=1.20 und ein „ökologisch valider“ Typ (lange Förderung in Regelklassen, evaluiert mit standardisierten Instrumenten), bei dem mittlere Effekte von d=0.59 vorliegen. Hinsichtlich der Inhalte erweisen sich Trainings zur Vermittlung von Frage-Strategien als sehr wirksam (d=1.33). Diese Trainings wurden allerdings vorwiegend unter den günstigeren Bedingungen „kontrollierter“ Studien evaluiert. Darüber hinaus erweisen sich Merkmale wie Strategievermittlung, Selbstüberwachung und explizite Instruktion als sehr effektiv.
5_076_2007_1_0005
46 Leseverständnis ist eine zentrale Voraussetzung für die Teilhabe am gesellschaftlichen Leben. Es stellt daher eine gravierende Einschränkung dar, dass Personen mit Lernschwierigkeiten in aller Regel erhebliche Defizite in gerade diesem Bereich aufweisen (Gelzheiser/ Wood 1998; Williams 2003). Oftmals liegen Schwierigkeiten auf der Ebene des Dekodierens und des Wortschatzes vor, es wird nicht flüssig gelesen, und es werden keine Strategien zur aktiven Unterstützung des Leseverstehens eingesetzt (Gersten/ Fuchs/ Williams/ Baker 2001; Mastropieri/ Scruggs 1997; Talbott/ Lloyd/ Tankersley 1994; Williams 2003). An genau diesen Problemfel- 46 Förderung des Leseverständnisses bei Schülerinnen und Schülern mit Lernschwierigkeiten - eine Metaanalyse Elmar Souvignier, Faye Antoniou Universität Frankfurt am Main ■ Zusammenfassung: In diesem Forschungsüberblick über 81 Interventionsstudien zur Förderung des Leseverständnisses bei Schülern mit Lernschwierigkeiten werden zwei Fragestellungen bearbeitet: Welchen Einfluss haben a) Designmerkmale von Studien und b) die Inhalte von Fördermaßnahmen auf die Effektivität. Im Hinblick auf die Designmerkmale erweisen sich das eingesetzte Testverfahren, die Dauer der Intervention und das Fördersetting als relevante Moderatoren. Dabei lassen sich zwei Typen von Forschungsansätzen unterscheiden: „Kontrollierte“ Untersuchungen (kurze Förderungen in sonderpädagogischen Settings, evaluiert mit von den Untersuchern entwickelten Testverfahren) mit einer hohen mittleren Effektstärke von d = 1.20 und ein „ökologisch valider“ Typ (lange Förderung in Regelklassen, evaluiert mit standardisierten Instrumenten), bei dem mittlere Effekte von d = 0.59 vorliegen. Hinsichtlich der Inhalte erweisen sich Trainings zur Vermittlung von Frage-Strategien als sehr wirksam (d = 1.33). Diese Trainings wurden allerdings vorwiegend unter den günstigeren Bedingungen „kontrollierter“ Studien evaluiert. Darüber hinaus erweisen sich Merkmale wie Strategievermittlung, Selbstüberwachung und explizite Instruktion als sehr effektiv. Schlüsselbegriffe: Leseverständnis, Lesestrategien, Leseinstruktion, Lernschwierigkeiten, Evaluation ■ Stimulating Reading Comprehension in Students with Learning Disabilities - a Meta-Analysis Summary: This synthesis of 81 intervention studies in the domain of stimulating reading comprehension of students with learning disabilities addresses two different fields: effect of design-characteristics and of contents of treatments. With respect to design-characteristics, the testing procedure, the duration of the intervention and the educational setting have a relevant impact on the results. Researchers tend to follow two distinct design-approaches: a “controlled type” of studies (short interventions, which are applied in remedial settings and evaluated by experimenter-developed tests) with a high mean effect-size of d = 1.20 and an “ecologically valid type” (long interventions in regular classrooms, assessed by standardised measures) with a mean effect-size of d = 0.59. With regard to the contents, trainings to impart Questioning Strategies prove to be very effective (d = 1.33). However, it was found that such trainings are mostly implemented under the above-mentioned beneficial controlled design-conditions. Moreover, results indicate, that programs which use strategy-instruction, self-monitoring and explicit instruction by the teacher are the most effective. Keywords: Reading comprehension, reading strategies, reading instruction, learning disabilities, evaluation VHN, 76. Jg., S. 46 -62 (2007) © Ernst Reinhardt Verlag München Basel Fachbeitrag dern setzen Programme zur Verbesserung des Leseverständnisses an. Während in den frühen 1970er Jahren insbesondere Fördermaßnahmen eingesetzt wurden, mit denen Basisfähigkeiten wie Wortschatz und Lesegeschwindigkeit trainiert wurden, setzen aktuellere Programme bei der Förderung kognitiver und metakognitiver Strategien an (Gersten u. a. 2001; Pressley 2000; Swanson 1999 b). Hinweise zur Effektivität unterschiedlicher Interventionsansätze bei Schülern mit Lernschwierigkeiten geben Metaanalysen zur Förderung des Leseverständnisses, wie sie von Gersten u. a. (2001), Mastropieri u. a. (1996), Swanson (1999 a) sowie Talbott, Lloyd und Tankersley (1994) vorgelegt wurden. So fand Swanson (1999 a) im Rahmen einer Analyse von 58 Studien, dass eine Kombination aus direkter Instruktion (strukturierte Präsentation von Information, klare Unterrichtsorganisation, kleinschrittiges Vorgehen, Nutzung von Beispielen) und Strategieinstruktion (Vermittlung von Strategien, Modellieren von Selbstinstruktion, Anleiten zu selbstreflexivem Lernverhalten) zu den besten Resultaten führt. Er beschreibt sechs Komponenten als ausschlaggebend für effektive Instruktion: „1) directed response/ questioning, 2) control difficulty of processing and demands of task, 3) elaboration, 4) modeling by the teacher of steps, 5) group instruction, and 6) strategy cues“ (Swanson 1999 b, 522). In der Übersichtsarbeit von Mastropieri u. a. (1996) zeigte sich, dass Interventionen zur Vermittlung von Fragestrategien deutlich höhere Effekte (d = 1.33) erzielten als Maßnahmen zur Anreicherung von Texten mit Bildern oder eine gezielte Strukturierung von Texten (d = 0.92) sowie Programme zur Förderung von Basisfertigkeiten (d = 0.62). Vor allem die Kombination aus einer Anleitung zur Nutzung von Fragestrategien und selbstreflexivem Herangehen an Texte (d = 1.48) erwies sich als sehr wirksam. Dieses Ergebnis wird durch die Befunde von Gersten u. a. (2001) unterstützt, die eine Vermittlung mehrerer Strategien als aussichtsreichsten Ansatz zur Förderung des Leseverständnisses nahe legen. Zusätzlich plädieren Gersten u. a. (2001) dafür, Unterrichtsmethoden wie kooperatives Lernen oder Peer-Tutoring einzusetzen, bei denen die Schüler sich gegenseitig bei der Anwendung von Lesestrategien und der Auseinandersetzung mit den Textinhalten unterstützen. Um die Frage nach der Wirksamkeit unterschiedlicher instruktionaler Ansätze differenziert anzugehen, bieten Metaanalysen zudem die Möglichkeit, methodologische Aspekte und Designmerkmale von Studien in die Auswertung einzubeziehen (z. B. Mastropieri u. a. 1996; Rosenshine 2001; Swanson 1999 a, b). So weisen vorliegende Metaanalysen darauf hin, dass beispielsweise die Dauer einer Intervention, das verwendete Kriteriumsmaß (standardisiert vs. Informelles Forschungsinventar), die Person des Trainers (Untersucher vs. Lehrender) oder das Untersuchungssetting (Feld vs. Experimentelle Studie) einen bedeutsamen Einfluss auf die Effektivität einer Intervention haben können (vgl. Mastropieri u. a. 1996; Rosenshine/ Meister 1994; Swanson 1999 b). Ziel dieses Beitrags ist es, einen Überblick über den Forschungsstand zur Förderung des Leseverständnisses bei Schülern mit Lernschwierigkeiten zu geben, bei dem diesen beiden Facetten - Inhalte von Programmen und methodologische Aspekte - gleichermaßen Rechnung getragen wird. Betrachtet man vorliegende Metaanalysen, fällt zunächst auf, dass das verwendete Kriteriumsmaß nur wenig spezifische Beachtung findet. In aller Regel werden zusammengesetzte (overall) Effektmaße verwendet, in die alle in einer Untersuchung verwendeten Kriteriumsmaße eingehen. Im Unterschied dazu wird in der eigenen Studie jeweils nur ein Maß pro Studie als Indikator für die Wirksamkeit einer Intervention herangezogen, und zwar dasjenige, welches das Konstrukt „Leseverständnis“ am besten repräsentiert. Zudem wird in keiner der bislang vorliegenden Metaanalysen spezifiziert, ob es möglich ist, Typen von Designmerkmalen zu identifizieren, die a) besonders häufig verwendet werden und b) mit besonders Förderung des Leseverständnisses bei Schülerinnen und Schülern mit Lernschwierigkeiten 47 VHN 1/ 2007 hohen (oder auffallend niedrigen) Effekten einhergehen. Vor diesem Hintergrund soll anschließend versucht werden, Programminhalte effektiver Fördermaßnahmen zu beschreiben. Meistens werden dazu Interventionsansätze einfachen Kategoriensystemen (z. B. strategieorientiert/ direkte Instruktion bei Swanson 1999b) zugeordnet. Darüber hinausgehend soll hier eine zusätzliche Analyse anhand der Charakterisierung von Fördermaßnahmen erfolgen, wobei auf die vom Autor der Untersuchung vorgenommene Spezifizierung einer zentralen Wirkkomponente zurückgegriffen wird. 1 Methode 1.1 Auswahl der Studien Es wurde eine Literaturrecherche durchgeführt, indem für den Zeitraum von 1967 bis März 2005 in den Datenbanken PsychINFO und MEDline die Suchbegriffe reading disabilities, learning disabilities, reading strategies, reading program, reading instruction, teaching methods in unterschiedlichen Kombinationen verwendet wurden. Zudem wurden die Inhaltsverzeichnisse einschlägiger Zeitschriften wie Learning Disability Quarterly, Journal of Learning Disabilities, Journal of Special Education durchsucht. Anschließend wurden auch die Literaturangaben der so gefundenen Beiträge im Hinblick auf Hinweise auf weitere Interventionsstudien zur Förderung des Leseverständnisses bei Schülern mit Lernschwierigkeiten durchgesehen. Es wurde entschieden, nur publizierte Manuskripte für die Metaanalyse auszuwerten und Abstracts, Buchkapitel sowie Dissertationen nicht zu berücksichtigen. Weitere Kriterien für eine Aufnahme von Studien in die Metaanalyse waren, dass eine Intervention mit dem Ziel durchgeführt wurde, das Leseverständnis bei Schülern mit Lernschwierigkeiten (learning disabled oder reading disabled) zu verbessern. Daten von Studien mit integrativer Beschulung von Schülern mit Lernschwierigkeiten wurden dann berücksichtigt, wenn getrennte Auswertungen für diese Schüler vorlagen. Die Darstellung der Daten musste es zudem erlauben, eine Berechnung der Effektstärken vorzunehmen (anhand von Rohwerten und Streuungen oder durch Transformation von t- oder F-Werten). Nicht berücksichtigt wurden Studien, in denen kein Vergleich mit (wenigstens) einer Kontrollbedingung vorgenommen worden war. Untersuchungen, in denen verschiedene Treatments nacheinander in einer Stichprobe durchgeführt wurden (withindesign), wurden dann ausgewertet, wenn die angegebenen Daten die Berechnung einer Effektstärke ermöglichten. Einzelfallstudien wurden nicht in die Metaanalyse aufgenommen. Diesen Kriterien entsprachen 81 Manuskripte. Da in einigen Manuskripten mehrere unabhängige Studien dargestellt und in einigen Studien mehrere Interventionen mit einer Kontrollbedingung verglichen wurden, konnten insgesamt die Effekte von 114 Fördermaßnahmen ausgewertet werden. Im Vergleich zu bereits vorliegenden Metaanalysen konnte die Datenbasis deutlich erweitert werden, wenngleich der Verzicht auf den Einbezug von Buchkapiteln, Dissertationen und Einzelfallstudien mitunter den Anteil gemeinsamer Studien einschränkt. So wurden beispielsweise von den 58 Studien, die Swanson (1999 a) auswertet, 35 in die vorliegende Analyse aufgenommen. Im Wesentlichen geht die Reduktion darauf zurück, dass ausschließlich Manuskripte aus Zeitschriften ausgewertet wurden, während andererseits 46 weitere Arbeiten herangezogen wurden, die aktueller waren oder bei denen nicht nur Schüler mit „learning disabilities“ untersucht wurden. Von den 27 Studien bei Gersten u. a. (2001) wurden nur drei nicht aufgenommen, die unseren Kriterien zur Berechnung der Effektstärke nicht entsprachen. Deutlicher ist die Abweichung zu der Metaanalyse von Mastropieri u. a. (1996): Dass nur 25 der dort ausgewerteten 82 Studien berücksichtigt wurden, liegt in der Entscheidung begründet, keine Einzelfallstudien und ausschließlich Zeitschriftenartikel heranzuziehen. Elmar Souvignier, Faye Antoniou 48 VHN 1/ 2007 Für den deutschsprachigen Raum haben wir nur eine Studie mit lernbehinderten Kindern gefunden, die unseren Auswahlkriterien entsprach (Souvignier/ Rühl 2005). Klicpera und Gasteiger-Klicpera (2004) weisen darauf hin, dass mit Programmen zur Förderung der phonologischen Bewusstheit zwar Präventionsmaßnahmen durchgeführt werden. Im Hinblick auf die Evaluation von Interventionsmaßnahmen, die unmittelbar eine Förderung des Leseverständnisses zum Ziel haben, besteht allerdings noch deutlicher Forschungsbedarf. 1.2 Kodierung der Studien Alle Studien wurden anhand eines standardisierten Schemas kodiert, in dem Informationen zu den folgenden vier Kriteriumsblöcken erfasst wurden: a) Merkmale des Untersuchungsdesigns (verwendetes Testverfahren, Umfang der Stichprobe, Art der Vergleichsgruppe, Messzeitpunkte), b) Beschreibung der Probanden (Alter, Art der Lernschwierigkeiten), c) Merkmale der Implementation (Dauer der Intervention, Ort der Intervention, Person des Lehrenden) und d) Art der Fördermaßnahme (Kategorie, zentrale Charakteristika). In dem Schema wurden zudem Angaben zur Berechnung der Effektstärke notiert. 1 1.2.1 Merkmale des Untersuchungsdesigns Die in den einzelnen Studien zur Erfassung des Leseverständnisses eingesetzten Testverfahren wurden in zweierlei Hinsicht unterschieden: Eine erste Differenzierung wurde dahingehend vorgenommen, ob es sich um standardisierte oder von den Untersuchern entwickelte Instrumente handelte. Im Hinblick auf das jeweils mit einem Testverfahren erhobene Kriteriumsmaß wurde zudem zwischen Verfahren, bei denen Texte oder Textpassagen gelesen und verstanden werden mussten, und Inventaren zur Messung von Komponenten des Leseverständnisses (Hauptidee eines Textes benennen; Wiedererkennen oder Wiedergeben von Textinhalten) unterschieden. Ein Test wurde dann als „textbasiert“ kategorisiert, wenn Fragen zu einer Textpassage beantwortet werden mussten. Hinsichtlich des Stichprobenumfangs wurden die Studien in drei gleich große Gruppen unterteilt. Als „klein“ gelten Untersuchungen mit weniger als 42 Probanden, an „mittelgroßen“ Studien nahmen zwischen 42 und 69 Schüler teil, und „groß“ sind entsprechend Stichproben ab 70 Personen. Die Untersuchungsdesigns zeichneten sich auch dadurch aus, dass unterschiedliche Vergleichsgruppen herangezogen wurden. Neben untrainierten oder unspezifisch beschäftigten Kontrollgruppen kamen auch mit alternativen Treatments geförderte Gruppen als Maßstab für die Wirksamkeit einer Intervention zum Einsatz. Ein Beispiel für die Kategorisierung einer Studie als Vergleich zweier Alternativprogramme (EG - EG) ist eine Untersuchung von Fleisher und Jenkins (1983). Ein kombiniertes Programm aus „Verständnisinstruktion und Klärung von Wortbedeutungen“ wurde hier als zentrale Fördermaßnahme kategorisiert, während alternative Programme zur „Verständnisinstruktion“ und zur „Klärung von Wortbedeutungen“ als Vergleichsgruppen herangezogen wurden. Eine dritte Kategorie von Vergleichsgruppen bildeten „within designs“, bei denen in einer Untersuchungsgruppe nach der Erhebung einer Baseline-Veränderungsrate anschließend die Effekte einer Fördermaßnahme gemessen wurden (z. B. Idol-Maestas 1985). Die Untersuchungsdesigns unterschieden sich zudem im Hinblick auf die Häufigkeit der Messzeitpunkte, zu denen die Schülerleistungen erhoben wurden: Neben Untersuchungen mit Prä-Post-Messungen gab es auch solche mit Prä-Post-FollowUp-Messungen sowie Studien mit dem schwächeren Design reiner Posttest- Erhebungen. 1.2.2 Beschreibung der Probanden Die Stichproben wurden im Hinblick auf das Alter der Probanden (jünger als zwölf Jahre bzw. zwölf bis 17 Jahre) und auf die jeweiligen Förderung des Leseverständnisses bei Schülerinnen und Schülern mit Lernschwierigkeiten 49 VHN 1/ 2007 Lernschwierigkeiten kategorisiert. Da die überwiegende Zahl der Primärstudien aus dem anglo-amerikanischen Sprachraum stammt, erschien es sinnvoll, in Anlehnung an die internationale Terminologie Schüler mit Lernschwierigkeiten (learning disabilities) von solchen mit spezifischen Defiziten beim Lesen (reading disabilities) zu unterscheiden. Bei den Schülern mit „learning disabilities“ wurde eine zusätzliche Differenzierung vorgenommen zwischen Studien mit leistungshomogenen Fördergruppen und solchen mit leistungsheterogenen Gruppen (learning disabilities and normally achieving peers). 1.2.3 Merkmale der Implementation Hier wurden Kodierungen der Studien hinsichtlich der Dauer, des instruktionalen Settings und der Person des Lehrenden vorgenommen. Zunächst wurde eine Unterscheidung zwischen kurzen (bis zu zwölf Stunden) und längeren Interventionen (mehr als zwölf Stunden) vorgenommen. Hinsichtlich des Orts der Förderung konnten die Studien entweder einem sonderpädagogischen Setting oder einer Förderung in der Regelklasse zugeordnet werden. Die Fördermaßnahmen selbst wurden entweder von den regulären Lehrkräften, einem Sonderpädagogen oder in einer Kombination aus Lehrer und Untersucher angeleitet. 1.2.4 Art der Fördermaßnahme In Anlehnung an vorliegende Metaanalysen zur Förderung des Leseverständnisses (Swanson 1999 a; Mastropieri/ Scruggs 1997) wurden die Interventionen jeweils einem von vier unterschiedlichen Ansätzen zugeordnet. Dabei wurde eine Unterscheidung zwischen a) Maßnahmen zur Anreicherung von Texten, b) einer Förderung von Basisfähigkeiten, c) Fragetrainings und d) Strategieprogrammen vorgenommen. Spezifischere Angaben zu den Inhalten von Programmen in diesen vier Gruppen sind in Tabelle 1 a angeführt. Eine alternative - eher pragmatische - Möglichkeit zur Kategorisierung der Inhalte von Fördermaßnahmen besteht darin, sich eng an der vom Untersucher selbst angegebenen zentralen Wirkkomponente eines Treatments (z. B. Identifikation der Hauptidee) zu orientieren oder sich nach den zentralen, zur Evaluation herangezogenen Konstrukten (z. B. Zusammenfassungen schreiben) zu richten. Auf diese Weise wurden 18 inhaltliche Schwerpunkte identifiziert, deren Häufigkeiten in Tabelle 1 b dargestellt sind. Zur Strukturierung dieser Charakterisierungen von Förderansätzen wurde eine Gruppierung nach drei Merkmalsbereichen vorgenommen: a) Ansätze, die auf der Grundidee basieren, dass Maßnahmen zur Förderung des Leseverständnisses bei Basisfähigkeiten ansetzen sollten, b) Ansätze, bei denen Arbeits- und Lerntechniken wie Strategiekonzepte (Zusammenfassen; Umstrukturieren von Texten) vermittelt werden oder bei denen die Schüler zur Nutzung selbstreflexiver und metakognitiver Aktivitäten (selbstreguliertes Lesen) angeleitet werden, sowie c) Ansätze, bei denen insbesondere eine bestimmte instruktionale Vorgehensweise im Mittelpunkt steht, beispielsweise die direkte Instruktion oder das Peer-Tutoring. Bei dieser Untergliederung spiegelt die Unterscheidung zwischen den beiden ersten Punkten einer Förderung von Basisfähigkeiten und der Anleitung zur Nutzung von Lerntechniken die Diskussion wider, ob Strategien überhaupt in sinnvoller Weise vermittelt werden können, wenn grundlegende Lesekompetenzen erst teilweise beherrscht werden (vgl. Williams 2003; Wilder/ Williams 2001). Im Hinblick auf die Zuordnung zu instruktionalen Konzepten ist es nicht unproblematisch, dass die Vermittlung von Strategien gleichzeitig unter einer bestimmten unterrichtsmethodischen Perspektive erfolgen kann. So erfolgt beim „Reciprocal Teaching“ der Strategieeinsatz in dem instruktionalen Rahmen einer intensiven Kleingruppenarbeit, bei der die Verantwortung für den adäquaten Strategieeinsatz sukzessive vom Lehrer auf die Schüler Elmar Souvignier, Faye Antoniou 50 VHN 1/ 2007 Förderung des Leseverständnisses bei Schülerinnen und Schülern mit Lernschwierigkeiten 51 VHN 1/ 2007 übergeht. Aus diesem Grund wurden „multiple“ Strategieprogramme (denen das Reciprocal Teaching als ein spezifischer Ansatz zuzuordnen ist), bei denen es nicht erkennbar einen bestimmten inhaltlichen Strategie-Schwerpunkt gab, der instruktionalen Perspektive zugeordnet. Natürlich ist auch denkbar, dass die Kombination einer „expliziten Vermittlung“ einer Lesestrategie vorkommt. Die Einordnung einer Studie anhand des Merkmals der „expliziten Vermittlung“ würde hier nahe legen, dass von den Autoren in erster Linie Aspekte wie a) das Unterrichten in kleinen Schritten, b) enge Anleitung bei den ersten praktischen Übungen und c) Ermöglichung eines hohen Maßes an erfolgreicher Übung für die Lernenden (vgl. Rosenshine/ Stevens 1986) oder eine Kombination aus inhaltsbezogenen und pädagogischen Schwerpunkten wie Modellieren, Hervorheben, Feedback geben, Bewerten, Üben und Anwenden (vgl. Duffy u. a. 1986) hervorgehoben wurden. Anreicherung des Basisfähigkeiten Fragestrategien Strategie- Texts programme • Bilder, bildhafte • Vokabeltraining • Aktivieren von Vor- Programm„pakete“ Ergänzungen • korrigierendes wissen wie • räumliche Orga- Feedback, Verstär- • Zusammenfassen • Story grammar nisation der Textkung • Überwachen des teaching inhalte • wiederholtes Lesen Lernprozesses • Reciprocal • Lesehilfen, • Instruktion curri- • elaboratives teaching Cassetten cularen Lernstoffs Hinterfragen • Problem solving • Unterstreichen • Strategien zur • Metacomprehen- und Inhalte in Identifikation des sion training Beziehung setzen Themas • „MULTIPASS“ • Strategien zur • „POSSE“ Textstruktur • „Textdetektive“ Tab. 1 a: Kategorien von Fördermaßnahmen Vermittlung von Vermittlung kognitiver und Instruktionale Perspektive Basiskompetenzen metakognitiver Strategien („higher order skills“) • Förderung phonologischer • Strategien zur Identifika- • Strategieprogramme zur Kompetenzen (n = 12) tion des Themas (n = 12) Vermittlung multipler • lautes Lesen (n = 7) • Mapping-Techniken (n = 10) Strategien (n = 8) • Vokabeltraining (n = 7) • Selbst-Überwachung (n = 8) • Reciprocal Teaching (n = 6) • Wahrnehmungstraining • Zusammenfassen (n = 7) • explizite Vermittlung von (n = 3) • Vermittlung von Text- Strategiewissen (n = 4) • Bildliches Vorstellen (n = 3) formatwissen (n = 4) • Peer-Tutoring (n = 3) • Metakognitives Training (n = 4) • Verstärkung (n = 7) • Umstrukturierung von • computerunterstützte Texten (n = 3) Förderung (n = 6) Tab. 1 b: Von den Autoren genannte, zentrale Merkmale der Fördermaßnahmen, die im Hinblick auf unterschiedliche instruktionale Perspektiven geordnet wurden 1.3 Berechnung der Effektstärken Zur Berechnung der Effektstärken musste zunächst entschieden werden, welches Kriteriumsmaß jeweils herangezogen werden sollte. Dabei wurde folgende Entscheidungshierarchie eingehalten: Wenn ein standardisiertes Verfahren eingesetzt worden war, bei dem Texte oder Textpassagen gelesen wurden, zu denen anschließend Fragen zu beantworten waren, so wurden Effekte anhand dieses Kriteriums berechnet. „Zweite Wahl“ waren von den Versuchsleitern entwickelte textbasierte Verfahren. In den verbleibenden Studien wurden die Effektstärken anhand von Inventaren bestimmt, mit denen beispielsweise Leistungen im Zusammenfassen oder Erinnerungsleistungen erfasst wurden, die möglicherweise in engerem Zusammenhang mit den Inhalten des Förderprogramms standen. Standardisierte Effektstärken wurden berechnet, indem die Differenz zwischen den Posttestwerten der Experimental- und der Kontrollgruppe durch deren gepoolte Standardabweichung dividiert wurde. Wenn Prätest- Werte berichtet wurden, wurden korrigierte Effektstärken ermittelt, indem die Post-Effektstärke um Unterschiede, die vor der Untersuchung bestanden, bereinigt wurde. Auf diese Weise konnten in 54 Studien, in denen Angaben zu Mittelwerten und Streuungen vorlagen, die Effektstärken berechnet werden. In den verbleibenden 27 Studien wurden die Effektstärken anhand von t- oder F-Werten ermittelt (Cohen 1988). Da standardisierte Effektstärken die wahren Effekte überschätzen, wenn mit kleinen Stichproben gearbeitet wird, wurde eine Korrektur unter Berücksichtigung der Stichprobenumfänge vorgenommen (Hedges/ Olkin 1985). Da in einigen Studien aufgrund des Vergleichs unterschiedlicher Treatments mehrere Effektstärken ermittelt wurden, wurde auch hier eine Korrektur vorgenommen. Um eine Überschätzung von Effekten zu vermeiden, wenn die Effekte zweier (oder dreier) Treatments im Kontrast zur gleichen Kontrollgruppe erhoben wurden, wurde hier jeweils nur der halbe Umfang der Kontrollgruppe (oder ein Drittel) in die Berechnung der nach Hedges und Olkin (1985) korrigierten Effektstärke einbezogen. Die so ermittelten Effektstärken weisen eine Bandbreite von d = -1.24 bis d = 2.74 auf. Alle Werte wurden für die weiteren Analysen berücksichtigt, da auch bei Untersuchungen mit sehr hohen Effekten keine kritischen Merkmale hinsichtlich der Anlage oder der Durchführung der Studien festzustellen waren. 2 Ergebnisse Die Ergebnisse werden in drei Abschnitten dargestellt. Zunächst werden Befunde zu den Effekten von Interventionen in Abhängigkeit von Merkmalen des Untersuchungsdesigns berichtet. Im zweiten Teil wird der Frage nachgegangen, ob spezifische Zusammenhangsmuster zwischen Designmerkmalen wie verwendetes Kriteriumsmaß oder Dauer der Förderung vorliegen, sodass sich Typen von Untersuchungsdesigns unterscheiden lassen. Im dritten Ergebnisteil wird schließlich geprüft, welche Fördermaßnahmen am wirksamsten sind. 2.1 Programmwirksamkeit in Abhängigkeit von Merkmalen des Designs, der Probanden und der Implementation Die mittlere Effektstärke über alle Programme und alle Kriteriumsmaße beträgt d = 0.75. Betrachtet man nur die Studien, in denen textbasierte Testverfahren eingesetzt wurden, reduziert sich die mittlere Effektstärke leicht auf d = 0.71. In Tabelle 2 sind die Kennwerte für die differenzierteren Analysen im Hinblick auf die jeweiligen Rahmenbedingungen der Studien dargestellt. Die Effekte werden hier zum einen für alle Kriteriumsmaße und zum anderen für die Teilstichprobe der Untersuchungen mit textbasierten Testverfahren aufgeführt. Elmar Souvignier, Faye Antoniou 52 VHN 1/ 2007 Förderung des Leseverständnisses bei Schülerinnen und Schülern mit Lernschwierigkeiten 53 VHN 1/ 2007 Bei den Merkmalen des Untersuchungsdesigns wird insbesondere deutlich, dass höhere Effekte dann zu erwarten sind, wenn keine standardisierten Testverfahren, sondern von den Untersuchungsleitern selbst konstruierte Inventare eingesetzt werden. In der Gesamtstichprobe ist dieser Unterschied statistisch abzusichern (p = .05; d = 0.85 vs. d = 0.56). Ein leichter Trend Effekt Effekt „alle Tests“ „nur textbasierte Tests“ Kriterien n d F p n d F p Leseverständnistest 3.79 .054 2.43 .123 von Untersuchern entwickelt 72 .85 36 .85 standardisiert 42 .56 33 .56 Stichprobenumfang 2.14 .123 2.40 .099 < 42 41 .90 19 1.01 42 - 69 35 .80 22 .73 > 69 37 .55 27 .50 Vergleichsgruppen 0.32 .725 1.54 .222 EG-KG 82 .78 53 .76 EG-EG 23 .72 14 .43 within subjects 9 .56 2 1.25 Messzeitpunkte 0.88 .419 0.51 .602 Prä-Post 59 .66 35 .64 nur Post 42 .86 26 .83 Prä-Post-FollowUp 13 .79 8 .62 Alter 0.83 .440 0.60 .554 < 11 54 .70 35 .70 12 - 17 48 .77 30 .69 Altersgruppen übergreifend 5 1.16 3 1.20 Art der Lernschwierigkeiten 0.25 .779 1.66 .197 Reading Disabilities 57 .79 32 .89 Learning Disabilities 42 .68 27 .54 LD + normally achieving 15 .78 10 .58 Dauer 9.61 .002 4.49 .038 max. 12 Stunden 52 .98 31 .92 > 12 Stunden 59 .53 38 .53 Setting 6.83 .010 23.31 .000 sonderpädagogisches Setting 45 1.02 25 1.29 Regelklasse 56 .61 35 .41 Lehrkraft 1.57 .213 1.39 .256 reguläre Lehrkraft 51 .89 37 .85 Sonderpädagoge 22 .62 12 .66 Untersucher & Lehrende 40 .64 19 .49 Tab. 2: Effektstärken in Abhängigkeit von den Untersuchungsmerkmalen Design, Probanden und Implementation zeigt sich zudem dahingehend, dass in kleineren Stichproben mit weniger als 42 Probanden (trotz Verwendung korrigierter Werte) höhere Effekte (d = 0.90 bzw. d = 1.01) erzielt werden als in Untersuchungen mit mehr als 70 Teilnehmern (d = 0.55 bzw. d = 0.50). Insbesondere bei den textbasierten Messungen fällt dieser Kontrast numerisch deutlich aus, wenngleich er sich aufgrund der vergleichsweise kleinen Zahl an Studien nicht zufallskritisch absichern lässt (p < .10). Im Hinblick auf Merkmale der Probanden werden die höchsten Effekte bei Schülern erzielt, bei denen spezifische Leseschwierigkeiten diagnostiziert worden waren. Die mittlere Effektstärke bei den textbasierten Tests liegt hier bei d = 0.89. Wenngleich dies als ein Hinweis auf die bereichsspezifische Wirksamkeit der Fördermaßnahmen angesehen werden kann, sind doch die Unterschiede zwischen den Probandengruppen - sowohl was die Altersgruppe als auch was die Art der Lernschwierigkeiten angeht - statistisch nicht abzusichern (jeweils p > .10). Als überraschendes Ergebnis zeigt sich, dass Programme mit maximal zwölf Trainingssitzungen höhere Effekte bewirken als länger dauernde Fördermaßnahmen. Sowohl in der Gesamtstichprobe (d = 0.98 vs. d = 0.53) als auch bei den textbasierten Tests (d = 0.92 vs. d = 0.53) fällt dieser Unterschied signifikant aus (p < .05). Eine - an dieser Stelle vorweggenommene - mögliche Erklärung für dieses Ergebnis könnte sein, dass kurze Interventionen in der Regel von den Untersuchern eng begleitet werden, während längere Förderungen eher im Rahmen regulärer schulischer Settings stattfinden. Tatsächlich werden kurze Interventionen häufiger gemeinsam von Forschern und Lehrern geleitet ( χ 2 = 7.19; df = 1; p < .01). Möglicherweise werden kurze Interventionen also unter besserer experimenteller Kontrolle durchgeführt und profitieren von einem direkteren Engagement der Untersucher. Die Effektivität von Interventionen steht zudem in deutlichem Zusammenhang mit dem Ort der Förderung. Bei Studien, die in einem sonderpädagogischen Setting stattfanden, wurden deutlich höhere Effekte erzielt als bei Fördermaßnahmen, die in Regelklassen durchgeführt wurden (p = .01; d = 1.02 vs. d = 0.61). Dies gilt auch für die Studien mit textbasierten Testverfahren. Die Person des Trainingsleiters erwies sich nicht als ausschlaggebend für die Wirksamkeit der Programme. Zusammenfassend zeigen diese Analysen, dass die Effektivität von Interventionen zur Förderung der Lesekompetenz bei Schülern mit Lernschwierigkeiten insbesondere von den drei Designmerkmalen des verwendeten Testverfahrens, des Umfangs einer Fördermaßnahme sowie des Ortes der Förderung maßgeblich abhängt. 2.2 Zusammenhänge zwischen Designmerkmalen und Typen von Untersuchungsdesigns Der nächste Auswertungsschritt galt der Frage, ob die Designmerkmale in dem Sinne unabhängig voneinander sind, dass sie in beliebiger Weise kombiniert werden, oder ob es bevorzugte Kombinationen gibt, die sich als „Designtypen“ beschreiben lassen. Diese Analyse wurde auf die drei für die Wirksamkeit besonders relevanten Merkmale Testverfahren, Dauer und Fördersetting beschränkt. Zunächst wurde kontingenzanalytisch geprüft, ob Zusammenhänge zwischen diesen drei Designmerkmalen bestehen. Tatsächlich zeigte sich, dass bei kurzen Interventionen häufiger von den Untersuchern entwickelte Testverfahren eingesetzt wurden ( Φ = .45; p < .001). Kurze Treatments fanden auch eher in einem sonderpädagogischen Setting statt ( Φ = .35; p < .001). Zudem wurden in sonderpädagogischen Settings häufiger von den Untersuchern entwickelte Tests eingesetzt ( Φ = .33; p < .001). Vor dem Hintergrund dieser engen Zusammenhänge und der im vorangehenden Abschnitt berichteten Ergebnisse, dass Testverfahren, Dauer und Fördersetting in enger Beziehung zu Elmar Souvignier, Faye Antoniou 54 VHN 1/ 2007 den Effekten von Interventionsmaßnahmen stehen, wurde nun geprüft, ob es „Typen“ von Studien gibt, bei denen diese Designmerkmale in überzufälliger Weise kombiniert werden. Um solche Typen zu identifizieren, wurde die Methode der Konfigurationsfrequenzanalyse (KFA) (Krauth/ Lienert 1993) verwendet. Da jedes der drei Designmerkmale in zweifacher Abstufung vorliegt, ergeben sich insgesamt acht mögliche Kombinationen. In Tabelle 3 werden die Häufigkeiten für diese acht Kombinationsmuster dargestellt. Zusätzlich wird angegeben, wie sich die Häufigkeiten dieser Muster auf die vier Kategorien von Interventionsmaßnahmen verteilen, es werden Kennwerte berichtet, inwieweit die beobachteten Häufigkeiten von den erwarteten Häufigkeiten abweichen, und es werden die entsprechenden Effektstärken für die Designmuster angegeben. Tatsächlich zeigt sich bei zwei Merkmalskombinationen, dass sie signifikant häufiger realisiert werden als erwartet und damit als Designtypen bezeichnet werden können: Studien mit einer kurzen Interventionsdauer in einem sonderpädagogischen Setting, bei denen von den Untersuchern entwickelte Testverfahren eingesetzt werden (z = 4.73; p < .001), und Studien, in denen genau die entgegengesetzte Kombination von Designmerkmalen umgesetzt wird (z = 6.30; p < .001). Zweifellos sind gerade diese beiden Designtypen besonders interessant, da sie zwei ganz unterschiedliche „Evaluationsphilosophien“ widerspiegeln: Während einerseits viele Studien (n = 28) Merkmale eines hohen Maßes an experimenteller Kontrolle aufweisen, liegt ein zweiter Schwerpunkt bei Studien (n = 22) mit Designmerkmalen, die primär für ein hohes Maß an ökologischer Validität stehen. Hier werden Programme unter „realistischen“ Unterrichtsbedingungen längerfristig in den regulären Schulalltag implementiert, und der Lernerfolg wird anhand standardisierter Testverfahren beurteilt. Es ist naheliegend, dass die beiden Designtypen mit unterschiedlich hohen Effekten einhergehen: In Studien mit einem hohen Maß an experimenteller Kontrolle werden Förderung des Leseverständnisses bei Schülerinnen und Schülern mit Lernschwierigkeiten 55 VHN 1/ 2007 Dauer Setting Test Intervention 1: max 12 h 1: sonderpäd 1: Unters. Textan- Basisfä- Frage- Strategie- 2: > 12 h 2: Regelkl. 2: stan reicherung higkeiten Trainings programme Σ beobachtet Σ erwartet Z-Wert p d 1 1 1 3 7 14 4 28 15 4.73 .00* 1.20 1 1 2 0 0 3 0 3 6 -1.96 .92 1.29 1 2 1 6 3 6 3 18 21 -1.12 .80 .71 1 2 2 0 0 1 1 2 9 -3.24 .99 .36 2 1 1 5 0 2 2 9 14 -2.25 .99 .53 2 1 2 1 1 0 0 2 6 -2.26 .97 .51 2 2 1 1 4 4 5 14 19 -2.03 .97 .55 2 2 2 3 10 2 7 22 8 6.30 .00* .59 19 25 32 22 98 .79 Tab. 3: Typen von Untersuchungsdesigns - Häufigkeiten und Effekte Elmar Souvignier, Faye Antoniou 56 VHN 1/ 2007 im Mittel sehr hohe Effekte berichtet (d = 1.20), während bei den ökologisch validen Studien mittlere Effekte vorliegen (d = 0.59). Es fällt auf, dass die Designtypen nicht gleichmäßig auf die vier Interventionstypen verteilt sind (s. Tabelle 3). Trainings zur Vermittlung von Fragestrategien werden häufiger in einem „kontrollierten“ Design durchgeführt, während Strategieprogramme und die Vermittlung von Basisfähigkeiten eher unter ökologisch validen Bedingungen implementiert werden. Diese Feststellung leitet über zu dem dritten Fragenkomplex, in dem es um die Identifikation von Merkmalen besonders effektiver Förderungen des Leseverständnisses bei Schülern mit Lernschwierigkeiten geht. 2.3 Kategorien von Fördermaßnahmen und Merkmale von Interventionen, die sich als effektiv erweisen 2.3.1 Kategorien von Fördermaßnahmen Die Wirksamkeit der vier weiter oben (s. Tabelle 1 a) beschriebenen Kategorien von Interventionsmaßnahmen erweist sich als sehr unterschiedlich. Sowohl in der Gesamtstichprobe als auch bei den Studien mit textbasierten Tests weichen die Effekte signifikant voneinander ab (Tabelle 4), wobei sich die Trainings, in denen Fragestrategien vermittelt werden, mit Abstand als die wirksamsten erweisen (d = 1.33 bzw. d = 1.43). Strategieprogramme und die Förderung von Basisfähigkeiten gehen mit mittleren Effekten einher, während Ansätze zur Anreicherung von Texten die geringste Wirksamkeit aufweisen. Vor dem Hintergrund der beschriebenen Moderatoreffekte von Designmerkmalen wurde überprüft, ob systematische Zusammenhänge in der Weise vorliegen, dass Trainings zur Vermittlung von Fragestrategien besonders häufig unter „günstigen“ Bedingungen evaluiert werden. Dabei zeigte sich, dass die Fragetrainings in Bezug auf die drei Designmerkmale Testverfahren ( χ 2 = 7.67, df = 1, p = .006), Dauer der Intervention ( χ 2 = 14.31, df = 1, p < .001) und Fördersetting ( χ 2 = 6.15, df = 1, p = .013) signifikant häufiger unter Bedingungen realisiert wurden, die mit besonders hohen Effektstärken einhergehen. Dies weist darauf hin, dass die Effekte von Fragetrainings überschätzt werden, wobei es unrealistisch erscheint, „wahre“ Effekte abschätzen zu können, die um den Einfluss von Designmerkmalen bereinigt sind. Zudem liegt hier die Gefahr eines Zirkelschlusses vor: Fallen die Effekte von Fragetrainings so hoch aus, weil sie häufig unter bestimmten Designmerkmalen realisiert werden, oder scheinen die Designmerkmale nur so günstig zu sein, weil (hoch wirksame) Fragetrainings oft unter diesen Bedingungen evaluiert werden? Überzeugender - und in Übereinstimmung mit vorliegender Literatur - erscheint die Argumentation, dass Designmerkmale wie von den Untersuchern entwickelte Tests oder ein sonderpädagogisches Fördersetting höhere Effekte bedingen (vgl. Mastropieri/ Scruggs/ Bakken/ Effekt Effekt „alle Tests“ „nur textbasierte Tests“ Kriterien n d F p n d F p Förderansatz 13.43 .000 8.81 .000 Textanreicherungen 21 .24 16 .35 Basisfähigkeiten 34 .61 20 .55 Frage-Trainings 34 1.33 17 1.43 Strategieprogramme 25 .56 16 .50 Tab. 4: Effektivität unterschiedlicher Kategorien von Förderansätzen Förderung des Leseverständnisses bei Schülerinnen und Schülern mit Lernschwierigkeiten 57 VHN 1/ 2007 Whedon 1996; Swanson 1999 b). Dass kürzere Interventionen mit höheren Effekten einhergehen, könnte - wie oben dargestellt - eine Folge engerer experimenteller Kontrolle durch die Untersuchungsleiter sein. 2.3.2 Merkmale von Interventionen Eine zweite Auswertung zur Frage nach den Inhalten wirksamer Interventionen zur Förderung des Leseverständnisses wurde vorgenommen, indem die Studien im Hinblick auf das Konstrukt kategorisiert wurden, das von den Autoren als zentraler Wirkfaktor benannt wurde (s. Tabelle 1 b). Die Effektstärken für die resultierenden 18 inhaltlichen Merkmale sind in Tabelle 5 abgebildet. In Anlehnung an die von Cohen (1988) vorgeschlagenen Kriterien werden Effektstärken zwischen 0.2 < d < 0.5 als klein, von 0.5 < d < 0.8 als mittel und d > 0.8 als groß eingestuft. Fünf Merkmale gingen mit hohen Effektstärken einher: Während „Zusammenfassen“, „Restrukturierung von Texten“ und „Strategien zur Identifikation von Hauptideen“ sich inhaltlich dem Feld von Strategieansätzen zuordnen lassen, bezieht sich das Anleiten zu „selbstreflexivem Lernverhalten“ auf metakognitive Strategien der Selbstregulation, und „explizite Vermittlung“ beschreibt eine instruktionale Herangehensweise. Das bedeutet Merkmale N d Merkmale N d d > 0.8 Zusammenfassen 7 1.62 0.5 < d < 0.8 Programme zur Vermittlung mul- Selbst-Über- 8 1.55 tipler Strategien 8 0.76 wachung Peer-Tutoring 3 0.76 Explizite Vermittlung von Strate- Metakognitives giewissen 4 1.23 Training 4 0.70 Strategien zur Vermittlung von Identifikation des Textformatwissen 4 0.69 Themas 12 1.23 lautes Lesen 7 0.67 Umstrukturierung von Texten 3 0.87 Verstärkung 7 0.63 Reciprocal Teaching 6 0.59 0.2 < d < 0.5 Förderung d < 0.2 Mapping- 10 0.22 phonologischer Techniken Kompetenzen 12 0.43 computerunter- Vokabeltraining 7 0.39 stützte Förderung 6 0.17 Wahrnehmungs- Bildliches training 3 0.38 Vorstellen 3 0.08 Tab. 5: Effektivität von Maßnahmen zur Förderung des Leseverständnisses im Hinblick auf „zentrale“ Merkmale der Interventionen gleichzeitig, dass die vier Merkmale von Fördermaßnahmen mit den höchsten Effektstärken (Zusammenfassen, d = 1.62; selbstreflexives Lernen, d = 1.55; explizite Vermittlung, d = 1.23; Hauptideen identifizieren, d = 1.23) drei unterschiedlichen Perspektiven der Interventionsforschung zugeordnet werden können. Kombiniert man diese drei Felder, ließe sich aus diesem Ergebnismuster ableiten, dass Lehrende spezifische Lesestrategien explizit (lehrergeleitet) vermitteln und darüber hinaus ihre Schüler unterstützen sollten, die Anwendung von Strategien reflektierend zu überwachen. 3 Diskussion In der vorliegenden Metaanalyse werden die Daten aus 81 Manuskripten zur Förderung des Leseverständnisses bei Schülern mit Lernschwierigkeiten zusammengefasst. Die Zielsetzung dieses Überblicks über den Forschungsstand liegt zum einen darin, Hinweise auf Merkmale effektiver Fördermaßnahmen zu ermitteln. Zum anderen wird anhand von Designmerkmalen kontrolliert, in welchem Zusammenhang die Rahmenbedingungen der Untersuchungen mit den berichteten Effekten stehen. Bei der Auswahl der Studien zeigte sich zunächst, dass sehr unterschiedliche Testverfahren zur Messung des Leseverständnisses zum Einsatz kamen. Um ein möglichst hohes Maß an Vergleichbarkeit zu erreichen, wurde entschieden, nur ein Kriteriumsmaß pro Studie zur Ermittlung von Effektstärken heranzuziehen. Nach Möglichkeit wurden Testverfahren gewählt, bei denen die Anforderung darin bestand, einen Text zu lesen und darauf bezogene Fragen zu beantworten. Es konnten immerhin 69 Effektstärken mit Bezug auf solche textbasierten Tests ermittelt werden. Weitere 45 Effektstärken resultieren aus Maßen für Kriterien wie dem Anfertigen von Zusammenfassungen, dem Identifizieren von Hauptgedanken eines Textes oder aus Wiedererkennensleistungen. Die mittlere Effektstärke für die textbasierten Verfahren fiel etwas geringer (d = 0.71) aus als für die anderen Tests (d = 0.81). Um diesen Unterschieden Rechnung zu tragen und gleichzeitig einen möglichst großen Stichprobenumfang zu erhalten, wurden die Analysen sowohl in der Teilstichprobe der Untersuchungen mit textbasierten Tests als auch in der Gesamtstichprobe gerechnet. 3.1 Bedeutung von Designmerkmalen Insgesamt neun Designmerkmale, bei denen ein Zusammenhang mit der Effektivität plausibel erschien, wurden als potenzielle Moderatoren untersucht (s. Tabelle 2). Während einige Variablen nur einen geringen Einfluss auf die Wirksamkeit der Fördermaßnahmen hatten, erwiesen sich zumindest drei Merkmale als kritische Designaspekte: Testverfahren, Dauer der Intervention und Fördersetting. Dass von Untersuchern entwickelte Testverfahren mit höheren Effekten einhergehen, repliziert ein bekanntes Befundmuster (vgl. Mastropieri u. a. 1996; Rosenshine/ Meister 1994; Swanson 1999 a, b). Dabei sollte allerdings nicht vorschnell davon ausgegangen werden, dass standardisierte Tests die validere Möglichkeit zur Erfassung des Textverständnisses darstellen. Es scheint aber zweifellos so zu sein, dass standardisierte Verfahren eine geringere inhaltliche Nähe zu den Inhalten von Fördermaßnahmen aufweisen als die von Untersuchern entwickelten Tests. Eine Erklärung für die höheren Effekte bei kurzen Programmen mit einem Umfang von bis zu zwölf Stunden mag sein, dass diese mit größerer Intensität und einer besseren Betreuung sowie einer engeren Kontrolle hinsichtlich der Realisierung von Programminhalten durchgeführt wurden. Darüber hinaus wurden höhere Effekte erzielt, wenn Fördermaßnahmen in spezifischen sonderpädagogischen Settings durchgeführt wurden. Dieser Faktor mag im Kontext des deutschen (Sonder-)Schulsystems überraschen. Da der überwiegende Anteil der hier analysierten Studien aus dem anglo-amerikanischen Sprachraum stammt, ist dieser Befund vor allem dahingehend zu interpretieren, dass es Leh- Elmar Souvignier, Faye Antoniou 58 VHN 1/ 2007 renden in den häufig leistungsheterogen zusammengesetzten Regelklassen schwerer fällt, leistungsschwache Schülerinnen und Schüler gezielt zu fördern als in spezifisch eingerichteten Fördergruppen. Einen weiteren Hinweis darauf, dass höhere Effekte bei gezielt eingesetzten Interventionen zu erwarten sind, gibt auch der Befund, dass bei Schülern mit Leseschwierigkeiten (reading disabilities) etwas höhere Effektstärken erzielt wurden. Da sich die drei Designmerkmale, die in deutlichem Zusammenhang mit der Effektivität von Fördermaßnahmen standen, nicht als unabhängig erwiesen, wurden weitergehende Analysen zur Identifizierung von „Designtypen“ durchgeführt. Ein unerwartetes Ergebnis war hier, dass - von den acht möglichen - die beiden am stärksten kontrastierenden Kombinationen von Designmerkmalen am häufigsten von Untersuchern eingesetzt wurden: Auf der einen Seite Interventionen mit einer kurzen Dauer, die in einem sonderpädagogischen Setting durchgeführt und mit von den Untersuchern entwickelten Testverfahren evaluiert wurden, und auf der anderen Seite den genau entgegengesetzten Designtyp: längerfristige Fördermaßnahmen, die in Regelklassen durchgeführt und mit standardisierten Testverfahren evaluiert wurden. Der erste Designtyp lässt sich als „kontrolliert“ bezeichnen, wobei eine hohe Trainingsintensität angestrebt wird und eine möglichst eng auf die Förderungsinhalte bezogene Wirksamkeitsprüfung erfolgt. Den zweiten Typ zeichnet ein hohes Maß an „ökologischer Validität“ aus, da ein Förderprogramm sich im regulären Schulalltag und mit Bezug auf ein standardisiertes Kriteriumsmaß als wirksam erweisen muss. Es ist daher nicht überraschend, dass die mittleren Effektstärken unter diesen beiden divergenten Forschungsperspektiven sehr unterschiedlich ausfallen. Während unter der „kontrollierten“ Bedingung eine mittlere Effektstärke von d = 1.20 ermittelt wurde, fällt die Wirksamkeit unter der „ökologisch validen“ Bedingung mit d = 0.59 nur etwa halb so hoch aus. Eine Konsequenz aus diesem Ergebnis sollte sein, dass verschiedene Maßstäbe für Untersuchungen, die unter unterschiedlichen Zielsetzungen durchgeführt wurden, angelegt werden. So sollte eine Effektstärke um d = 0.5 bei einem Programm, das in den regulären Schulalltag implementiert wird, als substanziell interpretiert werden. Insgesamt weisen die vorliegenden Befunde auf die Notwendigkeit hin, der Beachtung methodologischer Aspekte bei der Integration von Forschungsbefunden ein starkes Gewicht einzuräumen, um adäquate Interpretationen zu ermöglichen. 3.2 Merkmale wirksamer Interventionen Im Hinblick auf die Identifikation wirksamer Interventionen zur Förderung des Leseverständnisses konnte der Befund von Mastropieri und Scruggs (1997) repliziert werden, dass die Vermittlung von Fragestrategien als effektivster Förderansatz gelten kann (d = 1.33). Vor dem Hintergrund der oben dargestellten Diskussion über potenziell moderierende Effekte von Designmerkmalen wurde untersucht, ob Trainings von Fragestrategien eher unter günstigeren Bedingungen durchgeführt wurden. Tatsächlich wurden bei Fragetrainings eher von Untersuchern entwickelte Tests eingesetzt, sie waren von kürzerer Dauer und wurden häufiger in einem sonderpädagogischen Rahmen durchgeführt. Wenngleich davon ausgegangen werden muss, dass die hohen Effekte von Fragetrainings überschätzt werden, besteht dennoch kein Zweifel daran, dass es ein besonders wirksamer Ansatz zur Förderung von Leseverständnis ist, wenn Schüler dazu angeleitet werden, Fragen zu Texten zu generieren (vgl. Rosenshine/ Meister/ Chapman 1996). Interessant ist sicherlich der Befund, dass Trainings zur Vermittlung von Fragestrategien häufig im Rahmen kurzer Interventionen durchgeführt werden. Unter einer pragmatischen Perspektive erscheint es sinnvoll, in maximal zwölf Stunden nur eine kleine Zahl an Strategien zu vermitteln, während umfangrei- Förderung des Leseverständnisses bei Schülerinnen und Schülern mit Lernschwierigkeiten 59 VHN 1/ 2007 chere Strategieprogramme schlicht mehr Zeit benötigen. Ein Blick auf Forschungstrends über den Zeitraum der 30 Jahre, in denen die hier zusammengefassten Studien durchgeführt wurden, zeigt, dass in jüngerer Zeit tatsächlich mehr Strategieprogramme und weniger (isolierte) Fragetrainings evaluiert wurden. Dieser Trend hin zu komplexeren Programmen spiegelt sich auch in der Analyse von einzelnen - aus der Sicht der Autoren - zentralen Merkmalen der Fördermaßnahmen wider. Hier zeigte sich, dass diese Merkmale konkrete Lesestrategien, deren Überwachung sowie die effektive Nutzung instruktionaler Methoden umfassten. Zusammenfassen, Hauptideen identifizieren, Selbst-Überwachung und die instruktionale Vorgehensweise der expliziten Vermittlung erwiesen sich als die Merkmale von Interventionen, die mit den höchsten Effekten einhergingen. In diesem Sinne erscheint es besonders aussichtsreich, das Leseverständnis bei Schülerinnen und Schülern mit Lernschwierigkeiten zu verbessern, wenn der instruktionale Ansatz expliziten Lehrens eingesetzt wird, um Lese- und Überwachungsstrategien zu vermitteln. Strategieprogramme wie der Ansatz des „Reciprocal Teaching“ (vgl. Demmrich/ Brunstein 2004), bei denen die Verantwortung für die Auswahl und Überwachung von Strategien sukzessive auf die Lernenden übertragen wird, sollten daher in den Kontext regulären Unterrichts implementiert werden. Als Beispiel für eine solche integrierte Fördermaßnahme sollen kurz Prinzipien des Unterrichtsprogramms „Wir werden Lesedetektive“ (Rühl/ Souvignier 2006; Souvignier/ Rühl 2005) dargestellt werden: Eingebettet in die Rahmenhandlung einer Ausbildung zu Lesedetektiven wird lernbehinderten Schülerinnen und Schülern der 5. bis 8. Klasse ein planvolles und systematisches Herangehen an Texte vermittelt. Mit Hilfe der Lesestrategie „Überschrift beachten“ werden die Schüler angeleitet, ihr Vorwissen zu aktivieren. Die Strategie „Umgang mit Textschwierigkeiten“ soll dazu sensibilisieren, unklare Textstellen überhaupt als solche wahrzunehmen und zu reflektieren. Hier werden Lösungsmöglichkeiten zur Klärung unbekannter Begriffe vermittelt. Mit Hilfe eines einfachen Schemas zur Identifikation von Strukturmerkmalen eines narrativen Texts wird das „Zusammenfassen von Geschichten“ als dritte Strategie geübt, bevor anhand des Generierens inhaltsbezogener Fragen das „Zusammenfassen von Sachtexten“ als vierte Strategie vermittelt wird. Eine „Checkliste“, die in Form einer Arbeitsroutine die Anwendung aller Strategien vorgibt, soll den Schülern zunächst als Gerüst dienen, wie sie in systematischer Weise an Texte herangehen können. Dieses Unterrichtsbegleitende Programm hat einen Umfang von 25 bis 30 Schulstunden, in denen die Strategien den Schülern zunächst (explizit) von den Lehrenden vermittelt werden, wobei diese den Einsatz der Strategien modellhaft illustrieren, um anschließend Möglichkeiten zum selbstständigen Anwenden und Einüben der Strategien zu geben. Dem Grundgedanken selbst-überwachenden Arbeitens wird Rechnung getragen, indem jeweils reflektiert wird, welchen Nutzen die Strategien haben, indem der Umgang mit Textschwierigkeiten thematisiert wird und indem bei der Checkliste eine Anleitung zur Selbstkontrolle gegeben wird. Zusammenfassend lässt sich sagen, dass eine Herausforderung bei der Entwicklung und Evaluation von Förderansätzen zweifellos in der Frage liegt, wie die Integration von Aspekten der Strategievermittlung und die Anleitung zu selbstreflexivem Lernverhalten unter Anwendung instruktionaler Prinzipien expliziten Lehrens in einer wirksamen Weise realisiert werden kann, wenn gleichzeitig den Lernenden ausgiebig Gelegenheit zum selbstständigen Üben und Anwenden gegeben werden soll. Anmerkungen 1 Zusätzlich wurde das Publikationsjahr beachtet, um Forschungstrends auswerten zu können. Da über die Jahre keine nennenswerten Veränderungen hinsichtlich der Effektstärken der Treatments vorliegen, kann hier auf eine ausführliche Elmar Souvignier, Faye Antoniou 60 VHN 1/ 2007 Darstellung solcher Trends verzichtet werden. Es zeichnet sich allerdings ab, dass in neueren Arbeiten insgesamt mit größeren Stichproben gearbeitet wird und dass in zunehmendem Maße standardisierte Testverfahren eingesetzt werden. Die Anlage der Untersuchungen wird mithin über die Zeit anspruchsvoller. Inhaltlich hat sich im Laufe der letzten 30 Jahre ein Wechsel von Programmen zur Förderung von Basiskompetenzen (Wortschatz, wiederholtes Lesen) hin zu Strategieprogrammen vollzogen. Literatur Aus Platzgründen sind die 81 in die Metaanalyse einbezogenen Arbeiten in diesem Literaturverzeichnis nicht aufgeführt. Die vollständige Liste kann bei den Autoren angefordert werden. Cohen, J. (1988): Statistical power analysis for the behavioral sciences. 2nd edition. Hillsdale, NJ: Erlbaum Demmrich, A.; Brunstein, J. C. (2004): Förderung sinnverstehenden Lesens durch „Reziprokes Lehren“. In: Lauth, G. W.; Grünke, M.; Brunstein, J. C. (Hrsg.): Interventionen bei Lernstörungen. Göttingen: Hogrefe, 279 - 290 Duffy, G., Roehler, L.; Meloth, M.; Vavrus, L.; Book, C.; Putnam, J.; Wesselman, R. (1986): The relationship between explicit verbal explanations during reading skill instruction and students’ awareness and achievement: A study of reading teacher effects. In: Reading Research Quarterly 21, 237 - 250 Fleisher, L. S.; Jenkins, J. R. (1983): The effect of wordand comprehension-emphasis instruction on reading performance. In: Learning Disability Quarterly 6, 146 - 154 Gelzheiser, L. M.; Wood, D. M. (1998): Early reading and instruction. In: Wong, B. Y. L. (Ed.): Learning about learning disabilities. 2nd edition. San Diego, CA: Academic Press, 311 - 341 Gersten, R.; Fuchs, S. L.; Williams, P. J.; Baker, S. (2001): Teaching reading comprehension strategies to students with learning disabilities: A review of research. In: Review of Educational Research 71, 279 - 320 Hedges, L. V.; Olkin, I. (1985): Statistical methods for meta-analysis. New York, NY: Academic Press Idol-Maestas, L. (1985): Getting ready to read: guided probing for poor comprehenders. In: Learning Disability Quarterly 8, 243 - 254 Klicpera, C.; Gasteiger-Klicpera, B. (2004): Aufbau von Lesefertigkeiten. In: Lauth, G.W.; Grünke, M.; Brunstein, J. C. (Hrsg.): Interventionen bei Lernstörungen. Göttingen: Hogrefe, 268 - 278 Krauth, J.; Lienert, G. A. (1993): Einführung in die Konfigurationsfrequenzanalyse (KFA). Weinheim: Beltz Mastropieri, M.; Scruggs, T. E. (1997): Best practices in promoting reading comprehension in students with Learning Disabilities: 1976 - 1996. In: Remedial & Special Education 18, 197 - 213 Mastropieri, M.; Scruggs, T. E.; Bakken, J. P.; Whedon, C. (1996): Reading Comprehension. A synthesis of research in learning disabilities. In: Advances in Learning and Behavioural Disabilities 10 b, 201 - 227 Pressley, M. (2000): What should comprehension instruction should be the instruction of? In: Kamil, M. L.; Mosenthal, P. B.; Pearson, P. D.; Barr, R. (Eds.): Handbook of reading research. Volume 3. Mahwah, NJ: Erlbaum, 545 - 562 Rosenshine, B. (2001): Commentary: Issues in conducting meta-analyses of intervention studies. In: Elementary School Journal 101, 371 - 377 Rosenshine, B.; Meister, C. (1994): Reciprocal teaching: A review of research. In: Review of Educational Research 64, 479 - 530 Rosenshine, B.; Meister, C.; Chapman, S. (1996): Teaching students to generate questions: A review of the intervention studies. In: Review of Educational Research 66, 181 - 221 Rosenshine, B.; Stevens, R. (1986): Teaching functions. In: Wittrock, M. (Ed.): Handbook of research on teaching. New York: McMillan, 376 - 391 Rühl, K.; Souvignier, E. (2006): Wir werden Lesedetektive - Arbeitsheft und Schülermanual. Göttingen: Vandehoeck & Ruprecht Souvignier, E.; Rühl, K. (2005): Förderung des Leseverständnisses, Lesestrategiewissens und Leseinteresses von Schülern mit Lernbehinderungen durch strategieorientierten Unterricht. In: Heilpädagogische Forschung 31, 2 - 11 Swanson, H. L. (1999 a): Interventions for Students with Learning Disabilities: A Meta-Analysis of Treatment Outcomes. New York, NY: The Guilford Press Förderung des Leseverständnisses bei Schülerinnen und Schülern mit Lernschwierigkeiten 61 VHN 1/ 2007 Elmar Souvignier, Faye Antoniou 62 VHN 1/ 2007 Swanson, H. L. (1999 b): Reading research for students with LD: A meta-analysis of intervention outcomes. In: Journal of Learning Disabilities 32, 504 - 532 Talbott, E.; Lloyd, J. W.; Tankersley, M. (1994): Effects of reading comprehension interventions for students with learning disabilities. In: Learning Disability Quarterly 17, 223 - 232 Wilder, A. A.; Williams, J. (2001): Students with severe learning disabilities can learn higher order comprehension skills. In: Journal of Educational Psychology 93, 268 - 278 Williams, J. P. (2003): Teaching text structure to improve reading comprehension. In: Swanson, H. L.; Harris, K. R. (Eds.): Handbook of learning disabilities. New York: Guilford Press, 293 - 305 PD Dr. Elmar Souvignier Dr. Faye Antoniou Universität Frankfurt am Main Institut für Pädagogische Psychologie Senckenberganlage 15 D-60325 Frankfurt am Main Tel.: ++49 (0) 69/ 79 82 80 79 Fax: ++49 (0) 69/ 79 82 36 52 E-Mail: souvignier@paed.psych.uni-frankfurt.de