eJournals Vierteljahresschrift für Heilpädagogik und ihre Nachbargebiete 83/4

Vierteljahresschrift für Heilpädagogik und ihre Nachbargebiete
5
0017-9655
Ernst Reinhardt Verlag, GmbH & Co. KG München
101
2014
834

P Scales: Leistungsstandards für die Sonderpädagogik?

101
2014
Patricia Schär
Elisabeth Moser Opitz
Zusammenfassung: Die P Scales werden in England flächendeckend eingesetzt, um die Kompetenzen von Kindern und Jugendlichen mit hohem Förderbedarf zu überprüfen, und können als Leistungsstandards für die Sonderpädagogik betrachtet werden. Der folgende Beitrag analysiert erstens die P Scales hinsichtlich verschiedener Aspekte (Zielsetzungen, theoretische und empirische Fundierung, Standardisierung, Gütekriterien). Zweitens wird der Frage nachgegangen, ob sich P Scales als Leistungsstandards für die Sonderpädagogik eignen. Die Ergebnisse zeigen, dass P Scales bezüglich theoretischer und empirischer Fundierung, Standardisierung, Operationalisierung und Gütekriterien gravierende Mängel aufweisen.
5_083_2014_004_0318
318 VHN, 83. Jg., S. 318 -330 (2014) DOI 10.2378/ vhn2014.art29d © Ernst Reinhardt Verlag P Scales: Leistungsstandards für die Sonderpädagogik? Patricia Schär Pädagogische Hochschule Zürich Elisabeth Moser Opitz Universität Zürich Zusammenfassung: Die P Scales werden in England flächendeckend eingesetzt, um die Kompetenzen von Kindern und Jugendlichen mit hohem Förderbedarf zu überprüfen, und können als Leistungsstandards für die Sonderpädagogik betrachtet werden. Der folgende Beitrag analysiert erstens die P Scales hinsichtlich verschiedener Aspekte (Zielsetzungen, theoretische und empirische Fundierung, Standardisierung, Gütekriterien). Zweitens wird der Frage nachgegangen, ob sich P Scales als Leistungsstandards für die Sonderpädagogik eignen. Die Ergebnisse zeigen, dass P Scales bezüglich theoretischer und empirischer Fundierung, Standardisierung, Operationalisierung und Gütekriterien gravierende Mängel aufweisen. Schlüsselbegriffe: P Scales, Bildungsstandards, Leistungsstandards The P Scales: Assessing Performance of Children with Special Educational Needs? Summary: P Scales are used nationwide in England to measure the attainment level and progress of children and adolescents classified as having special education needs. The following article analyses P Scales with respect to different aspects (aims, theoretical and empirical foundation, standardization, accountability). In addition, the question whether P Scales are suitable as performance standards in special needs education is discussed. The analysis shows that the P Scales do have deficits with respect to several aspects of the theoretical and empirical foundation. Keywords: P Scales, educational standards, performance standards FACH B E ITR AG 1 Bildungsstandards - zur aktuellen Situation Die Diskussion um Bildungsstandards ist abgeflaut: Die Pro- und Contra-Argumente liegen auf dem Tisch, in Deutschland gibt es bundesweit geltende Standards für den Regelbereich (Kultusministerkonferenz 2010), und in der Schweiz wurden nationale Bildungsstandards freigegeben, die „Grundkompetenzen“ festlegen (Schweizerische Konferenz der kantonalen Erziehungsdirektoren 2011). Mit der Einführung von Bildungsstandards werden verschiedene Ziele verfolgt. Gemäß der Kultusministerkonferenz in Deutschland (2010) werden damit erwartete Leistungen festgelegt und überprüft. Dadurch soll - neben anderen Maßnahmen wie z. B. der Schulevaluation - ein Beitrag zur Erreichung und Aufrechterhaltung einer bestimmten Qualität im Bildungsbereich geleistet werden. Die Standards, die in der Schweiz entwickelt wurden, haben eine etwas andere Ausrichtung. Es handelt sich um „Grundkompetenzen“, mit denen Zielvorgaben für sprachregionale Lehrpläne gemacht werden und die sich folglich in erster Linie an Personen VHN 4 | 2014 319 PATRICIA SCHÄR, ELISABETH MOSER OPITZ P Scales: Leistungsstandards für die Sonderpädagogik? FACH B E ITR AG richten, die Lehrpläne, Lehrmittel und Evaluationsinstrumente entwickeln (Schweizerische Konferenz der kantonalen Erziehungsdirektoren 2011). Die Entwicklung dieser Standards wurde in der Sonderpädagogik mit großer Skepsis verfolgt. Kritisiert wurden (und werden) insbesondere die Output-Orientierung, die Orientierung an einem „Durchschnittskind“, die damit verbundene Gefahr der Ökonomisierung von Bildung und der verstärkten Selektion, die Orientierung am literacy-Konzept als Grundbildung sowie zunehmende Phänomene globaler Normierung (z. B. Biewer 2012; Köstermenke 2008; Musenberg u. a. 2008; Moser Opitz 2006; Moser Opitz 2007; Wember 2008). Es wird befürchtet, dass Schülerinnen und Schüler, die nicht über literacy-Kompetenzen verfügen, in Zukunft benachteiligt werden könnten. Wember (2008) gibt etwa zu bedenken, dass durch die Betonung von allgemeingültigen Lernzielen und Qualifikationen die Gefahr besteht, dass spezifische Bildungs- und Erziehungsbedürfnisse wie z. B. ein Mobilitätstraining bei Blindheit nur noch als nachgeordnet betrachtet werden. Neben Stimmen, die Bildungsstandards grundsätzlich infrage stellen (z. B. Blanc 2011), gibt es auch Vorschläge für spezielle sonderpädagogische Standards. Konkret liegen zwei Entwürfe vor, die Standards der Sonderpädagogischen Förderung (Wember/ Prändl 2009) und die P Scales aus England (Qualifications and Curriculum Authority 2009). Der Verband Sonderpädagogik e.V. hat auf der Grundlage der genannten Kritik eigene Standards für die verschiedenen Förderschwerpunkte in Deutschland entwickelt. Formuliert werden einerseits Minimalstandards bezogen auf behinderte und von Behinderung bedrohte Menschen, andererseits bezogen auf die Sonderpädagoginnen und Sonderpädagogen (Wember/ Prändl 2009). Die sonderpädagogischen Standards, die allerdings auch hinsichtlich mehrerer Aspekte kritisiert werden (Berner/ Halbheer 2011; Moser Opitz 2009; Musenberg u. a. 2008), sind explizit nicht output-orientiert, sondern prozess- und produktorientiert. Bei den P Scales, die in England flächendeckend eingesetzt werden, handelt es sich hingegen um Standards, mit denen die Leistungen von Kindern und Jugendlichen mit hohem Förderbedarf überprüft werden. Die P Scales sind aus zwei Gründen interessant: Erstens wird in Fachartikeln die Frage gestellt, ob sich die P Scales auch zum Einsatz im deutschsprachigen Bereich eignen (Luder u. a. 2008; Liesen/ Hessels 2011). Zweitens handelt es sich um output-orientierte Standards für Schülerinnen und Schüler mit schweren und mehrfachen Behinderungen. Sie eignen sich deshalb gut, um zu untersuchen, ob es möglich und sinnvoll ist, solche Standards für die Sonderpädagogik zu entwickeln. Im Folgenden interessiert, ob sich die P Scales als Standards für die Sonderpädagogik eignen und wie sie hinsichtlich von Aspekten wie Ökonomisierung, Selektion, Normierung und literacy-Orientierung zu bewerten sind. 2 P Scales: Entstehung und Zielsetzung Die staatliche Aufsichtsbehörde für Lehrpläne und Prüfungen in England (Qualifications and Curriculum Authority, QCA) erteilte 1998 den Auftrag zur Erstellung eines Bewertungsinstruments, mit dem die Leistungen von denjenigen Schülerinnen und Schülern erfasst werden können, für die der nationale Lehrplan nicht geeignet ist. Das Instrument sollte die Berichterstattung über deren Leistungen ermöglichen und ein leicht verständliches Beurteilungssystem zur Verfügung stellen, das den Schulen eine Qualitätssteigerung ermöglicht (Brown 2009). Die aus diesem Auftrag hervorgegangenen P Scales enthalten acht Stufen und wurden ursprünglich von einer Gruppe von Schulleiterinnen und Schulleitern von Sonderschulen ausgearbeitet (Ndaji/ Tymms 2009). VHN 4 | 2014 320 PATRICIA SCHÄR, ELISABETH MOSER OPITZ P Scales: Leistungsstandards für die Sonderpädagogik? FACH B E ITR AG Während die Stufen P 1 - P 3 allgemein formuliert sind und auf basale Lernprozesse fokussieren, beziehen sich die Stufen P 4 - P 8 auf fachspezifische Lernleistungen (Deutsch, Mathematik, Mensch und Umwelt, Kunst usw.) und schließen an die für die erste Lernstufe definierten Ziele im nationalen Lehrplan an. Tabelle 1 zeigt die Kompetenzbeschreibungen für die Erstsprache im Bereich Hören in der englischen Originalversion 1 . Es wird empfohlen, die Beurteilung der Lernenden mit den P Scales jeweils am Ende der verschiedenen Schulstufen in England, den Key Stages 2 , vorzunehmen. Dabei wird jedoch explizit darauf hingewiesen, dass die Beurteilungen im Verlauf einer Schulstufe auch mehrmals durchgeführt werden können (Brown 2009). Die Lehrpersonen schätzen einerseits die Kompetenzen jeder Schülerin und jedes Schülers hinsichtlich jedes Deskriptors ein und geben zusätzlich ein Gesamturteil, ein sogenanntes „best fit Urteil“ ab. Damit wird eingeschätzt, welche Stufe die Kompetenzen des Kindes am besten beschreibt, auch wenn nicht alle Deskriptoren zutreffen (Department for Education and Employment 2001). Aktuell gibt es zahlreiche Bestrebungen zur Verbreitung der P Scales in Europa 3 . In der P1 (i) Pupils encounter activities and experiences. They may be passive or resistant. They may show simple reflex responses, for example, startling at sudden noises or movements. Any participation is fully prompted. P1 (ii) Pupils show emerging awareness of activities and experiences. They may have periods when they appear alert and ready to focus their attention on certain people, events, objects or parts of objects, for example, attending briefly to interactions with a familiar person. They may give intermittent reactions, for example, sometimes becoming exited in the midst of social activity. P2 (i) Pupils begin to respond consistently to familiar people, events and objects. They react to new activities and experiences, for example, withholding their attention. They begin to show interest in people, events and objects, for example, smiling at familiar people. They accept and engage in co-active exploration, for example, focussing their attention on sensory aspects of stories or rhymes when prompted. P2 (ii) Pupils begin to be proactive in their interactions. They communicate consistent preferences and affective responses, for example reaching out to a favourite person. They recognise familiar people, events and objects, for example, vocalising or gesturing in a particular way in response to a favourite visitor. They perform actions, often by trial and improvement, and they remember learnt responses over short periods of time, for example, showing pleasure each time a particular puppet character appears in a poem dramatised with sensory cues. They cooperate with shared exploration and supported participation, for example, taking turns in interactions with a familiar person; imitating actions and facial expressions. P3 (i) Pupils begin to communicate intentionally. They seek attention through eye contact, gesture or action. They request events or activities, for example, pointing to key objects or people. They participate in shared activities with less support. They sustain concentration for short periods. They explore materials in increasingly complex ways, for example, reaching out and feeling for objects as tacticle cues to events. They observe the results of their own actions with interest, for example, listening to their own vocalisations. They remember learnt responses over more extended periods, for example, following the sequence of a familiar daily routine and responding appropriately. Tab. 1 P Scales: Beispiel Hören (Qualifications and Curriculum Authority 2009) u VHN 4 | 2014 321 PATRICIA SCHÄR, ELISABETH MOSER OPITZ P Scales: Leistungsstandards für die Sonderpädagogik? FACH B E ITR AG Schweiz wurden die Deskriptoren der P Scales ins elektronisch zugängliche Beobachtungsinventar für das Schulische Standortgespräch BISS4 implementiert und werden somit schon eingesetzt. Im Auftrag der Stiftung Schweizer Zentrum für Heil- und Sonderpädagogik (SZH) wird geprüft, ob ausgehend von den P Scales Skalen zur entwicklungs- und curriculumsorientierten Lernstandserfassung (SECEL) entwickelt werden könnten. Damit soll die „Schnittstelle zwischen entwicklungsbezogener und lehrplanbezogener Diagnostik und Förderung“ ausgewertet werden und es sollen „Standards für jene Schülerinnen und Schüler erarbeitet werden, welche die im Rahmen des HarmoS-Konkordats zu formulierenden Minimalstandards nicht erreichen“ (Stiftung Schweizer Zentrum für Heil- und Sonderpädagogik 2009). Um beurteilen zu können, ob sich die P Scales für diesen Zweck eignen, werden sie bezüglich der Aspekte Zielsetzungen, theoretische und empirische Fundierung, Standardisierung und Gütekriterien sowie Operationalisierung überprüft. Zudem werden die Ergebnisse einer explorativen Studie dargestellt, mit der die praktische Umsetzung erprobt worden ist. 3 Analyse und Bewertung der P Scales 3.1 Zielsetzungen Im Grundlagenpapier zu den P Scales (QCA 2009, 4) werden zum einen summative Zielsetzungen („share professional judgements about pupils’ attainments below level 1 of the natio- P3 (ii) Pupils use emerging conventional communication. They greet known people and may initiate interactions and activities, for example, prompting another person to join in with an interactive sequence. They can remember learnt responses over increasing periods of time and may anticipate known events, for example, preempting sounds or actions in familiar poems. They may respond to options and choices with actions or gestures, for example, by nodding or shaking their heads. They actively explore objects and events for more extended periods, for example, turning the pages in a book shared with another person. They apply potential solutions systematically to problems, for example, bringing an object to an adult in order to request a new activity. P4 Pupils demonstrate an understanding of at least 50 words, including names of familiar objects. Pupils respond appropriately to simple requests which contain one key word, sign or symbol in familiar situations, for example, ‘Get your coat’, ‘Stand up’ or ‘Clap your hands’. P5 Pupils respond appropriately to questions about familiar or immidiate events or experiances, for example, ‘Where is the ball? ’, ‘What are you doing? ’, ‘Is it yellow? ’. They follow requests and instructions containing at least two key words, signs or symbols, for example, ‘Put the spoon in the dish’, ‘Give the book to Johnny’. P6 Pupils respond to others in group situations, for example, taking turns appropriately in game such as ‘Pass the parcel’. They follow requests and instructions with three key words, signs or symbols, for example, ‘Give me the little red book’. P7 Pupils listen, attend to and follow stories for short stretches of time. They follow requests and instructions with four key words, signs or symbols, for example, ‘Get the big book about dinosaurs from the library’. They attend to, and respond to, questions from adults and their peers about experiences, events and stories, for example, ‘Where has the boy gone? ’. P8 Pupils take part in role play with confidence. Pupils listen attentively. They respond appropriately to questions about why or how, for example, ‘Why does a bird make a nest? ’, ‘How do we copy this picture? ’ u VHN 4 | 2014 322 PATRICIA SCHÄR, ELISABETH MOSER OPITZ P Scales: Leistungsstandards für die Sonderpädagogik? FACH B E ITR AG nal curriculum“) und damit verbunden eine output-orientierte Qualitätssicherung verfolgt („report judgements that are sound and consistent“), bei der auch Schulen miteinander verglichen werden. Zum anderen geht es bei den P Scales auch um Förderung und Diagnose und somit um formative Qualitätssicherung („identify and record individual pupils’ lateral progress“, „look for patterns in the attainment of pupils“; ebd., siehe auch Brown 2009). Diese Vermischung von unterschiedlichen Zielsetzungen mit demselben Instrument ist problematisch, da für summative und formative Beurteilungen je unterschiedliche Kriterien und Vorgehensweisen notwendig sind. Summative Bewertungen verlangen nach standardisierten Instrumenten und eindeutigen Beurteilungskriterien, während für formative Einschätzungen auch andere Verfahren eingesetzt werden können. Auch bezüglich weiterer Aspekte sind die P Scales nicht stringent. Einerseits wird explizit darauf hingewiesen, dass die Niveaus keine Entwicklungsstadien abbilden, sondern als „bloße summarische Stufen in den vom nationalen Lehrplan vorgegebenen Fächern gedacht“ sind (Brown 2009, 29). Andererseits impliziert die Einforderung von „best fit Urteilen“ und die summative Zielsetzung ein hierarchisches Stufenmodell (Liesen/ Hessels 2011). In einem weiteren Schritt wird deshalb untersucht, ob und inwiefern die beschriebenen Stufen mit gängigen theoretisch oder empirisch fundierten Entwicklungsmodellen übereinstimmen. 3.2 Theoretische und empirische Fundierung 3.2.1 Nicht-bereichsspezifische Stufen P1 - P3 Die Analyse für die nicht-bereichsspezifischen Stufen P1 - P3 erfolgt anhand der Griffiths Entwicklungsskalen von Brandt und Sticker (2001) sowie dem ET 6 - 6 von Petermann u. a. (2008). Griffiths Entwicklungsskalen werden zur Beurteilung des Entwicklungsstands bei Kindern im Alter von einem bis 24 Monaten sowie bei Kindern mit Entwicklungsverzögerungen oder Behinderungen angewendet. Der ET 6 - 6 ist ein Instrument zur Testung des Entwicklungsstands bei Kindern von sechs Monaten bis sechs Jahren. Um die Passung zu den Entwicklungstests zu überprüfen, wurden die Deskriptoren der Stufen 1 - 3 verschiedenen Items aus den Entwicklungstests zugeordnet (Tabelle 2). Deskriptoren P Scales Stufe Alter in Monaten Griffiths Entwicklungsskalen ET 6 -6 They begin to show interest in people, events and objects, for example, briefly focusing on the sound of a making activity. P2 (i) 2 Kind horcht auf Musik (C4) They recognise familiar people, events and objects. P2 (ii) 7 Kind unterscheidet Fremde von Bekannten (B14) Kind lächelt und hält Blickkontakt auf das Erscheinen einer anderen Person hin (T110). They greet known people and may initiate interactions and activities. P3 (ii) 6 -12 Kind lenkt Aufmerksamkeit einer Person auf Gegenstand, Person oder Ereignis (T101) Tab. 2 Passung der P Levels mit Entwicklungstests VHN 4 | 2014 323 PATRICIA SCHÄR, ELISABETH MOSER OPITZ P Scales: Leistungsstandards für die Sonderpädagogik? FACH B E ITR AG Die Beispiele zeigen, dass die P Levels grundsätzlich mit den Entwicklungsmodellen der standardisierten Tests übereinstimmen. Allerdings sind die P Levels nicht immer trennscharf. So werden beispielsweise die Kompetenzen „They recognise familiar people, events and objects“ (P2 ii) und „They greet known people and may initiate interactions and activities“ (P3 ii) zwei unterschiedlichen P Levels zugeordnet, während diese Kompetenzen laut den beiden Entwicklungstests in derselben Entwicklungsphase auftreten. Trotz diesen Übereinstimmungen muss festgestellt werden, dass den P Scales keine Entwicklungstheorien zugrunde gelegt wurden. Das zeigt sich besonders deutlich bei den bereichsspezifischen Stufen, die im Folgenden beschrieben werden. 3.2.2 Bereichsspezifische Stufen P4 - P8 Die theoretische und empirische Fundierung der fachspezifischen Standards wird an den Beispielen Erstsprache und Mathematik näher untersucht. Die Erstsprache ist unterteilt in die Bereiche Hören, Sprechen, Schreiben und Lesen. Dabei beziehen sich Deskriptoren einerseits auf die Sprachentwicklung, andererseits auf den Schriftspracherwerb. Bezüglich der Sprachentwicklung ist allerdings keine stringente Orientierung an den Sprachebenen Lexikon, Morphosyntax, Satzsemantik und Pragmatik erkennbar, obwohl diese alle als Deskriptoren vorkommen, wie die folgenden Beispiele zeigen. n Pupils initiate and maintain short conversations using their preferred medium of communication. They ask simple questions to obtain information, for example, ‘Where’s cat? ’. They can use prepositions, such as ‘in’ or ‘on’, and pronouns, such as ‘my’ or ‘it’, correctly. (CQA 2009, P6, Sprechen) n They link up to four key words, signs or symbols in communicating about their own experiences or in telling familiar stories, both in groups and one-to-one, for example, ‘The hairy giant shouted at Finn’. They use an extensive vocabulary to convey meaning to the listener. They can use possessives, for example, ‘Johnny’s coat’. They take part in role play with confidence. They use conjunctions that suggest cause for example, ‘cos,’ to link ideas. (CQA 2009, P8, Sprechen) Bezüglich des Schriftspracherwerbs werden ausschließlich Deskriptoren aufgeführt, die sich am Ansatz des „Ganzwortlesens“ orientieren. Zu empirisch bestätigten, auch in der Sonderpädagogik oft verwendeten Stufenmodellen zum Schriftspracherwerb (z. B. Niedermann/ Sassenroth 2004) gibt es keine Deskriptoren. Ähnliches lässt sich für das Fach Mathematik aufzeigen. Für P7 werden folgende Deskriptoren formuliert: n Pupils join in rote counting to 10, for example, saying or signing number names to 10 in counting activities. …They recognise numerals from one to five and understand that each represents a constant number or amount, for example, putting the correct number of objects (one to five) into containers marked with the numeral; collecting the correct number of items up to five. (CQA 2009, P7, Number) Einem aktuellen Modell zur Zahlbegriffsentwicklung zufolge (Krajewski/ Ennemoser 2013) sind das Aufsagen der Zahlwortreihe und die Zuordnung von Anzahlen zu Zahlen zwei unterschiedlichen Entwicklungsstufen zuzuordnen. Diese Beispiele, die sich beliebig erweitern ließen, zeigen, dass die theoretische und empirische Fundierung der P Scales unbefriedigend ist. 3.3 Standardisierung und Gütekriterien Um entscheiden zu können, ob die P Scales ihre Zielsetzungen erfüllen, sind Informationen zu den klassischen Gütekriterien wichtig. Die Standardisierung der ursprünglichen P Scales VHN 4 | 2014 324 PATRICIA SCHÄR, ELISABETH MOSER OPITZ P Scales: Leistungsstandards für die Sonderpädagogik? FACH B E ITR AG erfolgte anhand einer repräsentativen Stichprobe englischer Schülerinnen und Schüler in zwei Kohorten. Damit die Objektivität gewährleistet wäre, müsste die Einstufung zu einem P Level unabhängig von der Lehrperson, die die Beurteilung vornimmt, erfolgen. Eine differentielle Itemanalyse (Ndaji/ Tymms 2010) zeigte, dass Kinder mit leichteren Behinderungen bei den einfachen Items eher unterschätzt wurden. Bei den schwierigeren Items zeigte sich dagegen eher eine Unterschätzung der Kinder mit schweren Behinderungen. Die Autoren schließen daraus, dass die Lehrpersonen die Items für Kinder je nach Behinderungsgrad unterschiedlich interpretieren und dass die Einschätzungen somit nicht objektiv vorgenommen werden. Nach Martin (2006) zeigen sich große Unterschiede zwischen den Urteilen der Lehrpersonen. Außerdem kam es vor, dass einige Kinder im folgenden Jahr sogar auf einer tieferen Stufe beurteilt wurden. Weiter wurden verschiedene Analysen zur Validität des Instruments durchgeführt (Ndaji/ Tymms 2009). In einer Faktorenanalyse mit den Daten von 2001 - 2004 zeigte sich, dass die bereichsspezifischen Stufen (P4 - P8), welche die Kompetenzen in den drei Fachbereichen Englische Sprache, Mathematik und Naturwissenschaften überprüfen sollten, nur auf einen Faktor laden. Dies bedeutet, dass die P Scales nicht die Leistungen in den drei unterschiedlichen Fächern messen bzw. zwischen diesen differenzieren, sondern dass nur ein Konstrukt bzw. eine „Kompetenz“ gemessen wird. In den Daten von 2005 - 2006 wurden immerhin zwei Faktoren (Englisch und Mathematik sowie Naturwissenschaften) gefunden (Ndaji/ Tymms 2009). Anhand von Analysen mit dem eindimensionalen Rasch-Modell wurde die Konstruktvalidität untersucht. Es wurde überprüft, ob a) der Behinderungsgrad mit dem Erreichen von bestimmten Stufen übereinstimmt, ob b) die verschiedenen Stufen der P Scales empirisch voneinander unterscheidbar sind und ob c) bei einzelnen Personen Veränderungen über die Zeit festzustellen sind. Alle drei Fragen werden von Ndaji und Tymms (2010) positiv beantwortet. Allerdings fehlen Angaben zur Codierung und zu den üblichen Kennwerten im Rasch-Modell (Passung des Modells bzw. Infit der Items, Itemdiskrimination). Auch zur Reliabilität liegen keine Angaben vor. 3.4 Operationalisierung der P Scales Bezüglich Operationalisierung kann festgestellt werden, dass viele Deskriptoren klar und eindeutig formuliert sind (z. B. „They may show simple reflex responses, for example, startling at sudden noises or movements“ oder „They recognise familiar people, events and objects, for example, smiling at an item from their own family home.“). Bezüglich anderer Aspekte ergeben sich jedoch Unklarheiten. In den P Scales fehlt die Unterscheidung zwischen Kompetenzformulierung und Indikatoren. Die gesamten Beschreibungen, die zu einer Stufe gehören, werden als Deskriptoren bezeichnet, zu denen manchmal Beispiele aufgeführt sind. Da dies nicht immer der Fall ist, wird eine zuverlässige Einschätzung erschwert. Zudem passen die Beispiele nicht immer zu den Zielformulierungen, insbesondere bei P4 - P8, wie im Folgenden exemplarisch gezeigt wird: n Pupils initiate and maintain short conversations using their preferred medium of communication. They ask simple questions to obtain information, for example, ‘Where’s cat? ’. They can use prepositions, such as ‘in’ or ‘on’, and pronouns, such as ‘my’ or ‘it’, correctly. (CQA 2009, P6, Sprechen) Während das erste Beispiel (Fragen stellen) geeignet ist, um die Kompetenz der Aufrechterhaltung von Konversationen zu überprüfen, VHN 4 | 2014 325 PATRICIA SCHÄR, ELISABETH MOSER OPITZ P Scales: Leistungsstandards für die Sonderpädagogik? FACH B E ITR AG sind die anderen Indikatoren (Präpositionen und Pronomen verwenden) nicht zwingend notwendig, um kurze Gespräche führen zu können. An verschiedenen Stellen fehlt weiter eine klare Unterscheidung zwischen unterschiedlichen Entwicklungsbereichen (z. B. Motorik, Sozialverhalten, Hören und Sprechen, Auge-Hand- Koordination, Kognition), und es kommt vor, dass Kompetenzen in einem Bereich durch die Beobachtung von Fähigkeiten in einem anderen Bereich erfasst werden. So erfolgt im nachstehenden Beispiel die Beobachtung der kognitiven Fähigkeit der Imitation über motorische Aktivitäten. n They imitate actions involving main body parts, for example, clapping or stamping. (CQA 2009, P4, Naturwissenschaften) Bei Kindern mit motorischen Beeinträchtigungen steht die einschätzende Person somit vor dem Dilemma, den Deskriptor entweder anders zu interpretieren oder aber eine ungenaue Einschätzung vornehmen zu müssen. Uneinheitlich ist auch der Umgang mit Quantifizierungen. Manchmal erfolgt die Operationalisierung der P Scales mit Quantoren („Pupils demonstrate an understanding of at least 50 words, including the names of familiar objects.“, P4, Hören), jedoch ohne Begründung, warum es gerade 50 Wörter sein müssen. Außerdem gibt es keine Angaben dazu, ob ein Verhalten einmal oder mehrmals beobachtet werden muss, damit der Deskriptor erfüllt ist. Um die Kompetenzen der Schülerinnen und Schüler genauer einschätzen zu können, wäre diese Unterscheidung notwendig. Dies wurde bei einigen Implementierungen teilweise umgesetzt, indem auf einer vierstufigen Skala von 0 für „never“ bis 3 „consistently“ angegeben werden kann, wie häufig eine bestimmte Aktivität bei einem Kind beobachtet worden ist (Ndaji/ Tymms 2009). Insgesamt zeigt sich, dass die P Scales auch bezüglich der Operationalisierung gravierende Mängel aufweisen. 3.5 Explorative Studie Mit einer explorativen Studie wurde erstens untersucht, wie Lehrpersonen den Nutzen der P Scales einschätzen. Laut Ndaji und Tymms (2009) halten die Lehrpersonen in England den Einsatz der Skalen für sinnvoll, da sie dadurch Informationen zur Leistungsstreuung innerhalb der Klasse erhalten und die Fortschritte der Lernenden aufgezeigt werden können. Ebenfalls werde geschätzt, dass ein Vergleich zwischen den Schulen möglich sei. Schließlich seien die Skalen hilfreich, um den Eltern und Behörden Bericht zu erstatten. Zweitens interessierte, ob und inwieweit die Ergebnisse der Einschätzung mit den P Scales mit einer standardisierten Erhebung übereinstimmen. Zu diesem Zweck wurden die P Scales von einigen Lehrpersonen erprobt. Die Stichprobe bestand aus acht Schülerinnen und Schülern (je zwei aus Kindergarten, Unter-, Mittel- und Oberstufe), die in sechs Klassen an zwei Sonderschulen unterrichtet wurden, und ihren Lehrpersonen. Vier Kinder bzw. Jugendliche arbeiteten an Lernzielen im Bereich der Kulturtechniken (entsprechend P4 - P8), bei den anderen vier handelte es sich um Schülerinnen und Schüler mit (schweren) Mehrfachbehinderungen, mit denen Lernziele in basalen Entwicklungsbereichen erarbeitet wurden (entsprechend P1 - P3). Die auf Deutsch übersetzten P Scales 5 wurden in ein Tabellenformat gebracht, damit die Lehrpersonen die Erfüllung einzelner Deskriptoren ankreuzen sowie Kommentare anfügen konnten. Danach wurden die Lehrpersonen in einem ersten Schritt gebeten, auf der Basis ihrer Beobachtungen für die Fächer Deutsch, Naturwissenschaften und Mathematik für sämtliche VHN 4 | 2014 326 PATRICIA SCHÄR, ELISABETH MOSER OPITZ P Scales: Leistungsstandards für die Sonderpädagogik? FACH B E ITR AG Deskriptoren eine Einschätzung vorzunehmen. Abschließend musste für jedes Fach der P Level ausgewählt werden, der die Kompetenzen der einzelnen Schülerin bzw. des Schülers gesamthaft am besten beschreibt. Aufgrund der erfolgten Stufen-Zuteilungen wurde mit den Kindern in einem nächsten Schritt von einer Fachperson ein standardisierter Test bzw. Teile daraus durchgeführt. Bei Kindern, die unterhalb von P4 eingestuft wurden und sich somit in einer nicht-bereichsspezifischen Stufe befinden, wurden die Einschätzungen mit Items aus den Griffiths Entwicklungsskalen (Brandt/ Sticker 2001) sowie aus dem ET 6 - 6 (Petermann u. a. 2008) überprüft. Für Kinder mit einer Einstufung oberhalb von P4 wurde von der Lehrperson ein Fach (Mathematik, Deutsch oder Naturwissenschaften) zur näheren Überprüfung ausgewählt. Da alle Lehrpersonen eine Abklärung im Fach Mathematik wünschten, wurden mit sämtlichen Kindern Teile aus dem TEDI- Math-Test (Kaufmann u. a. 2009) durchgeführt. Dabei handelt es sich um einen standardisierten Test zur Erfassung numerischer und rechnerischer Fertigkeiten von Kindern im Alter von vier Jahren bis zur dritten Klasse. In einem Kurzinterview wurden die Lehrpersonen zu ihren Erfahrungen mit den P Scales befragt. Der Aufwand zur Einschätzung der Kompetenzen wurde als gering betrachtet. Die jüngeren bzw. unerfahreneren Lehrpersonen waren gegenüber dem Instrument positiver eingestellt als die erfahrenen Lehrpersonen. Letztere fanden das Ergebnis der Einschätzung nicht sehr informativ. In den Gesprächen zeigte sich, dass die Beobachtungen dieser erfahrenen Lehrpersonen viel detaillierter waren als die Beschreibungen der P Scales. Sie nutzten somit andere Beobachtungsinstrumente - z. B. den Beobachtungsbogen von Fröhlich und Haupt (2004) oder das Entwicklungsgitter von Kiphard (2006) -, um die Einschätzung anhand der P Scales vorzunehmen. Auch zeigte sich, dass jeweils fast alle Deskriptoren einer Stufe angekreuzt wurden und die Beurteilung wenig differenziert war. Dies hängt wahrscheinlich damit zusammen, dass bei den P Scales nicht angegeben werden kann, ob etwas nur einmal beobachtet wurde oder häufig vorkommt. Die Einstufungen der Kinder und Jugendlichen, die sich in den Stufen P1 - P3 befanden, stimmten insgesamt gut mit den Entwicklungsmodellen der standardisierten Tests überein: Je tiefer das Entwicklungsalter aufgrund von einem der beiden Entwicklungstests war, desto tiefer war auch die Einstufung auf den P Scales. Allerdings zeigte sich tendenziell auch eine Überschätzung der Schülerinnen und Schüler. Weiter stellte das bereits beschriebene Problem der mangelnden Unterscheidung zwischen verschiedenen Entwicklungsbereichen (z. B. Motorik, Sozialverhalten, Hören und Sprechen, Auge-Hand-Koordination, Leistungen) hohe Anforderungen an die beobachtenden Personen. Meistens haben die Lehrpersonen für ihre Einschätzung den Deskriptor spontan angepasst (z. B. Blickkontakt anstatt Greifen beobachtet, wenn das Kind motorisch eingeschränkt war). Die Kompetenzen der beobachteten Schülerinnen und Schüler, die an den Kulturtechniken (P4 - P8) arbeiteten, lagen aufgrund der Ergebnisse des Tests „TEDI-Math“ im Bereich „Zahlen“ weit über der Stufe P8 und entsprachen den Leistungen von Lernenden auf der Unterstufe. Dies bedeutet, dass die P Scales nicht geeignet waren, die numerischen Kompetenzen der Kinder und Jugendlichen zu erfassen. 4 Diskussion Eingangs wurde die Frage gestellt, wie die P Scales hinsichtlich von Aspekten wie Selektion, Normierung und literacy-Orientierung zu bewerten sind und ob sie sich als Grundlage für die Entwicklung von Skalen zur entwicklungs- und curriculumsorientierten Lernstandserfassung als Standardisierungsinstrument eignen. VHN 4 | 2014 327 PATRICIA SCHÄR, ELISABETH MOSER OPITZ P Scales: Leistungsstandards für die Sonderpädagogik? FACH B E ITR AG Mit den P Scales werden summative Zielsetzungen verfolgt, Leistungen eingeschätzt und Schulen miteinander verglichen. Es handelt sich somit um Leistungsstandards. Dabei besteht nach Brown (2009) die Gefahr, dass die Zuteilung von Fördermitteln an die Schulen von den erreichten Leistungen abhängig gemacht wird. Globale Normierungsprozesse (Biewer 2012), wie sie sich im Regelbereich zeigen, machen somit auch vor der Sonderpädagogik nicht Halt. Im Gegensatz zu den Standards für den Regelbereich sind die P Scales jedoch nicht einseitig auf literacy ausgerichtet, sondern überprüfen auch andere Kompetenzen. Zudem ist das Erreichen eines bestimmten Lernziels zu einem bestimmten Zeitpunkt nicht vorgegeben. Damit entfallen der Kritikpunkt der Überbetonung von literacy und die Befürchtung, dass solche Standards zu mehr Selektion führen könnten. Dennoch sind die P Scales kritisch zu betrachten. Die Lern- und Entwicklungsfortschritte von Kindern und Jugendlichen mit hohem Förderbedarf sind erstens oft auch bei bester Förderung nur klein, und die Qualität von Schulen darf deshalb nicht am Lernerfolg dieser Schülerinnen und Schüler gemessen werden. Zweitens müssen die P Scales als Instrument für eine summative Beurteilung des Entwicklungs- und Lernstandes als ungenügend beurteilt werden. Sie weisen bezüglich theoretischer und empirischer Fundierung, Standardisierung, Operationalisierung und Gütekriterien gravierende Mängel auf, sodass davon ausgegangen werden muss, dass damit keine zuverlässigen Einschätzungen erfolgen können. Damit stellt sich grundsätzlich die Frage nach dem Nutzen der P Scales. Auch für die Diagnostik und Förderung sind sie aus den zuletzt genannten Gründen nicht geeignet. Ohne eine theoretische und empirische Fundierung des Beobachtungsgegenstandes ist auch eine formative Einschätzung der Kompetenzen der Lernenden willkürlich bzw. ohne genaue Angabe der wünschenswerten Eigenschaften eines Gegenstandes kann nicht über dessen Qualität entschieden werden (Wember 2007). Diagnosen müssen immer theoriegeleitet sein (Wember 1998). Theorien - hier im Sinn von Entwicklungsmodellen - bieten sowohl die Grundlage für die Auswahl des Beobachtungsgegenstands bzw. für die Auswahl der diagnostischen Kriterien als auch für die Ableitung von Fördermaßnahmen (vgl. auch Schlee 2008). Für die Stufen P1 - P3 trifft diese Kritik etwas weniger zu als für P4 - P8, da sich bei ersteren zumindest teilweise eine Passung zu Entwicklungsmodellen zeigt, auch wenn dies nicht explizit gemacht wird. Aufgrund der Ergebnisse der Befragung der Lehrpersonen, die für die Einschätzung ihrer Schülerinnen und Schüler mit den P Scales andere - differenzierte - Instrumente beizogen, muss allerdings bezweifelt werden, dass die P Scales im Vergleich zu einschlägig bekannten Instrumenten wie dem Beobachtungsbogen von Fröhlich und Haupt (2004), dem Entwicklungsgitter von Kiphard (2006) oder auch den in der explorativen Studie eingesetzten Skalen bzw. Tests einen Mehrwert bieten. Auch die eingangs gestellte Frage, ob sich die P Scales als Grundlage für die Entwicklung von Skalen zur entwicklungs- und curriculumsorientierten Lernstandserfassung (SECEL) im Sinne eines Standardisierungsinstruments für den sonderpädagogischen Bereich eignen (Stiftung Schweizer Zentrum für Heil- und Sonderpädagogik 2009), muss negativ beantwortet werden; erstens aufgrund der schon mehrfach erwähnten Mängel und zweitens, weil Leistungsstandards für Schülerinnen und Schüler mit besonderem Förderbedarf grundsätzlich abzulehnen sind. Der Situation dieser Kinder und Jugendlichen wird man nur gerecht, wenn individuelle Einschätzungen erfolgen. Dabei gilt es jedoch Folgendes zu bedenken: Die Entwicklung und Kompetenzen dieser Schülerinnen und Schüler können nur beobachtet und beschrieben werden und Förderung kann nur geplant werden, wenn auch VHN 4 | 2014 328 PATRICIA SCHÄR, ELISABETH MOSER OPITZ P Scales: Leistungsstandards für die Sonderpädagogik? FACH B E ITR AG beurteilt wird, und sei dies anhand der Individualnorm. Entgegen einem „sonderpädagogischen Mythos“ (z. B. bei Eggert 2007) kommt nämlich auch die sogenannte Förderdiagnostik nicht ohne Bewertung aus. Beim Diagnostizieren werden immer Vergleiche angestellt, und deshalb enthalten Diagnosen immer auch Bewertungen - egal, ob sie auf Förderung oder auf Selektion ausgerichtet sind (Moser Opitz/ Nührenbörger im Druck). Damit diese Bewertung fundiert vorgenommen werden kann und passende Fördermaßnahmen ergriffen werden können, braucht es valide und reliable Instrumente. Hier gilt es für verschiedene Bereiche und Entwicklungsniveaus zu überprüfen, ob die im Fachbereich vorhandenen Instrumente den Anforderungen genügen und ob allenfalls Weiterentwicklungen notwendig sind. Insbesondere im Bereich der Kulturtechniken wird oft das Fehlen von geeigneten Instrumenten beklagt, mit denen sich auch Entwicklungen beschreiben lassen. Hier müsste darüber nachgedacht werden, ob sich die vorliegenden Kompetenzmodelle aus dem Regelbereich auch für den Einsatz bei Schülerinnen und Schülern mit Förderbedarf eignen würden - nicht zur Ableitung von Standards und nicht für einen Vergleich mit einer Normstichprobe, sondern als Basis für das Vornehmen einer förderorientierten Einschätzung. Das Problem der Kompetenzmodelle und der daraus abgeleiteten Leistungsstandards sind nicht die Modelle an sich, sondern die Vorgaben, wann eine bestimmte Kompetenz erreicht werden muss (Moser Opitz 2007; 2009). Die Verwendung solcher Modelle muss allerdings immer im Wissen geschehen, dass es sich dabei um Heuristiken handelt, von denen es auch Abweichungen geben kann. Ob der Diskussion um die Thematik der Leistungsstandards in der Sonderpädagogik ist die Auseinandersetzung mit „opportunity-tolearn-Standards“ (Ravitch 1995) - mit Standards für Lehr- und Lernbedingungen und damit verbunden mit Standards, die sich mit der Unterrichtsqualität befassen - in den Hintergrund gerückt. Diese sind - insbesondere mit Blick auf die Passung von Unterrichtsangebot und individuellen Lernvoraussetzungen - für die Sonderpädagogik äußerst bedeutsam. Hier sollte der Schwerpunkt für zukünftige Forschung und Entwicklung liegen. Anmerkungen 1 Es liegen zwei deutsche Übersetzungen vor, einerseits von Kollegen aus der Schweiz (nicht publiziert) und andererseits die Übersetzung unter http: / / de.theingots.org/ community/ p scales (8. 1. 2014). Um Missverständnissen, die durch die Übersetzung entstehen könnten, vorzubeugen, verwenden wir in diesem Artikel die englische Originalversion. 2 Key Stage 1: 5 -7 Jahre; Key Stage 2: 7 -11 Jahre; Key Stage 3: 11 -14 Jahre; Key Stage 4: 14 -16 Jahre. 3 http: / / de.theingots.org/ community/ node/ 28 350 (8. 1. 2014) 4 http: / / www.lerntipps.ch/ instrumente/ ? page_ id=64 (8. 1. 2014) 5 Es wurde die nicht publizierte deutsche Übersetzung der Schweizer Kollegen verwendet, da wir diese als verständlicher und präziser einschätzten als die Übersetzung unter http: / / de. theingots.org/ community/ pscales. Literatur Berner, E.; Halbheer, U. (2011): Die „Standards der Sonderpädagogischen Förderung“: Zugeständnis an einen Trend oder Grundlage professionellen Lehrerhandelns? In: Vierteljahresschrift für Heilpädagogik und ihre Nachbargebiete 80, 192 -203. http: / / dx.doi.org/ 10.2378/ vhn20 11.art13d Biewer, G. (2012): Die neue Welt der Bildungsstandards und ihre erziehungswissenschaftliche Rezeption aus der Perspektive einer inklusiven Pädagogik. In: Vierteljahresschrift für Heilpädagogik und ihre Nachbargebiete 81, 9 -21. http: / / dx.doi.org/ 10.2378/ vhn2012.art01d Blanc, P. (2011): Das HarmoS-Konkordat: Eine marktorientierte und technologiegläubige Re- VHN 4 | 2014 329 PATRICIA SCHÄR, ELISABETH MOSER OPITZ P Scales: Leistungsstandards für die Sonderpädagogik? FACH B E ITR AG form. In: Vierteljahresschrift für Heilpädagogik und ihre Nachbargebiete 80, 353 -360 Brandt, I.; Sticker, E. J. (2001): GES, Griffith-Entwicklungsskalen. Zur Beurteilung der Entwicklung in den ersten beiden Lebensjahren. Göttingen: Beltz Test Brown, J. (2009): Die Entwicklung und Verwendung der „P-Scales“ in England. In: Zeitschrift für Heilpädagogik 60, 28 -32 Department for Education and Employment (2001): Supporting the Target Setting Process: Guidance for effective target setting for pupils with special educational needs. Revised Edition. London: DfEE Eggert, D. (2007): Von den Stärken ausgehen - Individuelle Entwicklungspläne (IEP) in der Lernförderdiagnostik. 5. Aufl. Dortmund: Borgmann Publishing Fröhlich, A.; Haupt, U. (2004): Leitfaden zur Förderdiagnostik mit schwerstbehinderten Kindern. Eine praktische Anleitung zur pädagogischtherapeutischen Einschätzung. 7. Aufl. Dortmund; modernes lernen Kaufmann, L.; Nuerk, H-C.; Graf, M.; Krinzinger, H.; Delazer, M.; Willmes, K. (2009): TEDI-MATH. Test zur Erfassung numerisch-rechnerischer Fertigkeiten vom Kindergarten bis zur 3. Klasse. Bern: Hans Huber, Hogrefe AG Kiphard, E. J. (2006): Wie weit ist mein Kind entwickelt? 12. Aufl. Dortmund: modernes lernen Köstermenke, S. (2008): Bildungsstandards und geistige Behinderung - Ein Blick in die USA. In: Zeitschrift für Heilpädagogik 59, 260 -267 Krajewski, K.; Ennemoser, M. (2013): Entwicklung und Diagnostik der Zahl-Größen-Verknüpfung zwischen 3 und 8 Jahren. In: Hasselhorn, M.; Heinze, A.; Schneider, W.; Trautwein, U. (Hrsg.): Diagnostik mathematischer Kompetenzen. Tests & Trends N. F. 11. Göttingen: Hogrefe, 41 -65 Kultusministerkonferenz, Institut zur Qualitätsentwicklung im Bildungswesen (2010): Konzeption der Kultusministerkonferenz zur Nutzung der Bildungsstandards für die Unterrichtsentwicklung. Online unter: http: / / www. kmk.org/ fileadmin/ veroeffentlichungen_ beschluesse/ 2010/ 2010_00_00-Konzeption- Bildungsstandards.pdf, 15. 8. 2013 Liesen, C.; Hessels, M. (2011): Zur Brauchbarkeit der P-Scales für standardbasierte Kompetenzmessung in der Schweiz. In: Schweizerische Zeitschrift für Heilpädagogik 17, 27 -32 Luder, R.; Prammer, W.; Prammer-Semmler, E. (2008): Standardbasierte Kompetenzmessung unterhalb von Mindestanforderungen: ein Beispiel aus England. Die „P-Scales“ und ihre Anwendung im deutschsprachigen Raum. In: Schweizerische Zeitschrift für Heilpädagogik 14 (1), 21 -31 Martin, A. (2006): Assessment using the P Scales: best fit - fit for the purpose? In: British Journal of Special Education 33, 68 -75. http: / / dx.doi. org/ 10.1111/ j.1467-8578.2006.00417.x Moser Opitz, E. (2006): PISA und Bildungsstandards: Stein des Anstoßes oder Anstoß für die Sonderpädagogik? In: Vierteljahresschrift für Heilpädagogik und ihre Nachbargebiete 75, 110 -120 Moser Opitz, E. (2007): Bildungsstandards und Sonderpädagogik. In: Schweizerische Zeitschrift für Heilpädagogik 12 (9), 10 -17 Moser Opitz, E. (2009): Förderschwerpunkt Lernen: Kritische Anmerkungen zu curriculum- und förderplanorientierten Standards und ein Plädoyer für Kompetenzmodelle. In: Wember, F. B.; Prändl, S. (Hrsg.): Standards der sonderpädagogischen Förderung. München: Reinhardt, 203 -217 Moser Opitz, E.; Nührenbörger, M. (im Druck): Diagnostik und Leistungsbeurteilung. In: Bruder, R.; Hefendehl-Hebecker, L.; Schmidt-Thieme, B.; Weigand, H-G. (Hrsg.): Handbuch Mathematikdidaktik. Berlin: Springer Musenberg, O.; Riegert, J.; Dworschak, W.; Ratz, C.; Terfloth, K.; Wagner, M. (2008): Zukunft Standard-Bildung? Fragen im Hinblick auf den Förderschwerpunkt „Geistige Entwicklung“. In: Sonderpädagogische Förderung 53, 306 -316 Ndaji, F.; Tymms, P. (2009): The P Scales. Assessing the Progress of Children with Special Educational Needs. Hoboken (New Jersey): Wiley- Blackwell. http: / / dx.doi.org/ 10.1002/ 97804706 82227 Ndaji, F.; Tymms, P. (2010): The P Scales: how well are they working? In: British Journal of Special Education 37, 198 -208. http: / / dx.doi.org/ 10.11 11/ j.1467-8578.2010.00481.x Niedermann, A.; Sassenroth, M. (2004): Lesestufen. Ein Instrument zur Feststellung und Förderung der Leseentwicklung. Horneburg: Persen Petermann, F.; Stein, I. A.; Macha, T. (2008): Entwicklungstest 6 Monate bis 6 Jahre (ET 6 -6), Frankfurt/ M.: Pearson Assessment VHN 4 | 2014 330 PATRICIA SCHÄR, ELISABETH MOSER OPITZ P Scales: Leistungsstandards für die Sonderpädagogik? FACH B E ITR AG Qualifications and Curriculum Authority (2009): P Scales. London: QCA. Online unter: https: / / orderline.education.gov.uk/ gempdf/ 14459508 39/ P_scales_level%20descriptors_2009.pdf, 3. 1. 2014 Ravitch, D. (1995): National Standards in American Education: A Citizen’s Guide. Washington D.C.: Brookings Institution Press Schlee, J. (2008): 30 Jahre „Förderdiagnostik“ - eine kritische Bilanz. In: Zeitschrift für Heilpädagogik 59, 122 -133 Schweizerische Konferenz der kantonalen Erziehungsdirektoren (2011): Nationale Bildungsziele. Online unter: http: / / www.edk.ch/ dyn/ 129 30.php, 3. 1. 2014 Stiftung Schweizer Zentrum für Heil- und Sonderpädagogik (2009): SECEL: Stufenmodell zur Entwicklungs- und Curriculumsorientierten Einschätzung des Lernstands (SECEL). Online unter: http: / / www.szh.ch/ de/ Themen-und-Pro jektauftraege/ Projektauftraege/ SECEL/ page 33783.aspx, 4. 1. 2014 Wember, F. B. (1998): Zweimal Dialektik: Diagnose und Intervention, Wissen und Institution. In: Sonderpädagogik 28, 106 -120 Wember, F. B. (2007): Qualitätsanalyse und Standards der sonderpädagogischen Förderung. In: Zeitschrift für Heilpädagogik 58, 417 -426 Wember, F. B. (2008): Standardisierung oder Entwicklung? Der Stellenwert von Standards in der sonderpädagogischen Förderung. In: Sonderpädagogische Förderung heute 53, 239 -256 Wember, F. B.; Prändl, S. (2009): Standards der sonderpädagogischen Förderung. München: Reinhardt Anschriften der Autorinnen Dr. Patricia Schär Pädagogische Hochschule Zürich Lagerstrasse 2 CH-8090 Zürich patricia.schaer@phzh.ch Prof. Dr. Elisabeth Moser Opitz Universität Zürich Institut für Erziehungswissenschaft Hirschengraben 48 CH-8001 Zürich emoser@ife.uzh.ch