eJournals unsere jugend 76/7+8

unsere jugend
4
0342-5258
Ernst Reinhardt Verlag, GmbH & Co. KG München
10.2378/uj2024.art41d
71
2024
767+8

KI als Instrument für die Ressourcen- und Maßnahmenplanung in sozialen Einrichtungen

71
2024
Christina S. Plafky
André Kuck
Norbert Kratz
Hans Frischhut
Der vorliegende Beitrag beschreibt die wichtigsten Erkenntnisse aus einem Pilotprojekt zu den Möglichkeiten der Anwendung eines spezifischen Verfahrens der künstlichen Intelligenz in sozialen Einrichtungen. Das Verfahren beruht auf emergenzbasierter Statistik. Es wurden umfangreiche Datenbestände von drei am Projekt beteiligten Einrichtungen analysiert. In zwei Fällen handelt es sich um Einrichtungen aus der Kinder- und Jugendhilfe, während die Daten der dritten Einrichtung dem Bereich der Sozialpsychiatrie zuzuordnen sind.
4_076_2024_7+8_0005
311 unsere jugend, 76. Jg., S. 311 - 327 (2024) DOI 10.2378/ uj2024.art41d © Ernst Reinhardt Verlag KI als Instrument für die Ressourcen- und Maßnahmenplanung in sozialen Einrichtungen Der vorliegende Beitrag beschreibt die wichtigsten Erkenntnisse aus einem Pilotprojekt zu den Möglichkeiten der Anwendung eines spezifischen Verfahrens der künstlichen Intelligenz in sozialen Einrichtungen. Das Verfahren beruht auf emergenzbasierter Statistik. Es wurden umfangreiche Datenbestände von drei am Projekt beteiligten Einrichtungen analysiert. In zwei Fällen handelt es sich um Einrichtungen aus der Kinder- und Jugendhilfe, während die Daten der dritten Einrichtung dem Bereich der Sozialpsychiatrie zuzuordnen sind. von Prof. Dr. Christina S. Plafky Lehre Departement Soziale Arbeit, Leitung Lehre/ Leitung MSc Soziale Arbeit an der OST - Ostschweizer Fachhochschule Einleitung In einem Beitrag in dieser Zeitschrift (Heft 3/ 22) wurde das Forschungsdesign zu einem Forschungsprojekt vorgestellt, in dem der Frage nachgegangen wurde, ob und inwieweit es algorithmenbasierte Entscheidungsprozesse in sozialen Einrichtungen ermöglichen, Effizienzkriterien zu erfüllen und gleichzeitig ethischen und fachlichen Grundsätzen in adäquater Form Rechnung zu tragen (Plafky et al. 2022) 1 . Das Projekt konnte mittlerweile zum Abschluss Prof. Dr. André Kuck Professor für quantitative Methoden in der Finanzwirtschaft, DHBW Villingen- Schwenningen, Zentrum für emergenzbasierte Statistik Prof. Dr. Norbert Kratz Professor für BWL, DHBW Villingen-Schwenningen, Zentrum für emergenzbasierte Statistik Hans Frischhut wissenschaftlicher Mitarbeiter im Projekt emergenzbasierte Statistik, DHBW Villingen- Schwenningen, Geschäftsführer der Emerging Insights GmbH 1 Die zentralen Forschungsfragen sowie der grundlegende methodische Ansatz, der auf den Prinzipien der emergenzbasierten Statistik basiert, wurden bereits in dem genannten Beitrag erläutert. Die verwendeten Daten der Einrichtungen lagen den Einrichtungen bereits vor, sie wurden dort im Rahmen der sozialarbeiterischen Tätigkeiten erhoben. 312 uj 7+8 | 2024 Maßnahmenplanung in sozialen Einrichtungen mit KI gebracht werden. Dieser Artikel beschreibt die wichtigsten Erkenntnisse der KI-Anwendung in den drei Einrichtungen, die auf den Ergebnissen der algorithmenbasierten Auswertungen von Daten der Einrichtungen sowie der drei Workshops mit VertreterInnen der jeweiligen Einrichtungen basieren. Hier soll es nun darum gehen, auszugsweise wesentliche Resultate vorzustellen. In zwei Fällen handelt es sich um Einrichtungen aus der Kinder- und Jugendhilfe (erste und zweite Einrichtung), während die Daten der dritten Einrichtung dem Bereich der Sozialpsychiatrie zuzuordnen sind. Die Fülle der erzielten Resultate macht es erforderlich, eine Selektion vorzunehmen. Dabei ist dem erheblichen Ausmaß an Unterschiedlichkeit bei der Datenerfassung Rechnung zu tragen. Es werden im Folgenden Beispiele vorgestellt, die die Einsatzmöglichkeiten des zur Anwendung kommenden Algorithmus in der praktischen Planung und Steuerung der Aktivitäten innerhalb der Einrichtungen illustrieren sollen. Emergente Gesetze und Künstliche Intelligenz „Es war bisher immer so, dass …“. Eine Aussage dieser Form ist das Charakteristikum eines durch den verwendeten Algorithmus identifizierten emergenten Gesetzes. Das Konzept der emergenzbasierten Statistik basiert auf einem induktivistischen Ansatz, gemäß dem wissenschaftliche Erkenntnisse auf der Grundlage von Beobachtungen erlangt werden. Das folgende Beispiel soll das grundlegende Induktionsprinzip erläutern: Werden unter einer Vielzahl von Bedingungen sehr viele Raben beobachtet und wird dabei immer festgestellt, dass der jeweils beobachtete Rabe schwarz war, so führt dies zu dem Induktionsschluss, dass grundsätzlich alle Raben schwarz sind. Dann ergibt sich daraus die Schlussfolgerung, dass auch der nächste Rabe, der beobachtet werden wird, schwarz sein wird. Dieser Induktionsschluss und die daraus resultierende Prognose sind in zweifacher Hinsicht problematisch: 1. In relevanten Untersuchungsbereichen dürfte es nur sehr selten vorkommen, dass sich aus empirischen Befunden Aussagen ableiten lassen, die bisher für jeden einzelnen Fall (jeder bisher beobachtete Rabe) richtig waren. 2. Die Richtigkeit des Induktionsschlusses ist nicht beweisbar: Es gibt keine logische begründete Garantie dafür, dass der nächste Rabe, der beobachtet werden wird, nicht grün ist. Für beide Probleme liefert der Ansatz der emergenzbasierten Statistik eine adäquate Problemlösung. Der KI-Algorithmus sucht in Daten nach Mindestsequenzlängen von Beobachtungen, die erforderlich sind, damit eine Aussage entsprechend dem Muster „Es war bisher immer so, dass …“ emergiert. Die Abbildung 1 zeigt exemplarisch ein derartiges emergentes Gesetz, welches aus den Daten einer der am Projekt beteiligten Einrichtungen stammt. Es ist erkennbar, dass die Anzahl erforderlicher Betreuungsmaßnahmen bei männlichen Klienten (dunkel) immer größer war als bei weiblichen Klientinnen (hell): Die dunkle Kurve verläuft immer oberhalb der hellen Kurve. Diese Aussage ist jedoch präzisierungsbedürftig: Sie gilt nicht für jedes einzelne männliche bzw. weibliche Individuum. Stattdessen werden Sequenzen von Einzelmessungen betrachtet. In diesem Fall sind Einzelmessungen entsprechend der Panelstruktur der Daten der entsprechenden Einrichtung KlientInnentage. Damit das beobachtete Muster sich als immer wiederkehrend erweisen konnte, es also „emergierte“, war es erforderlich, Sequenzen von KlientInnentagen zusammenzufassen und Betreuungsmaßnahmen bei männlichen sowie weiblichen KlientInnen in Form von rollierenden Mittelwerten zu messen. 313 uj 7+8 | 2024 Maßnahmenplanung in sozialen Einrichtungen mit KI Es zeigt sich in diesem Beispiel, dass in jeder Sequenz von 4096 KlientInnentagen die durchschnittliche Anzahl von Maßnahmen jeglicher Art bei männlichen Klienten höher als bei weiblichen Klientinnen war. Dieses Muster hat sich in dem gesamten Datenbestand in nicht überlappenden Sequenzen 98-mal ohne Unterbrechung wiederholt. Damit liegt ein empirisch relevantes Kriterium für die Verlässlichkeit einer Prognose dahingehend vor, dass dieses Muster auch in der Zukunft bestehen bleibt 2 . Die Reliability (Verlässlichkeit) ist ein Maß für die Güte von Prognoseergebnissen, gemessen in prozentualen Anteilen der Anzahl richtiger Prognosen an der Gesamtzahl erfolgter Prognosen, für unterschiedlich oft in nicht überlappenden Sequenzen bestätigte Gesetze. Empirische Untersuchungen in einer Vielzahl von Datenbanken zeigen, dass Muster, die bisher 98-mal beobachtet wurden, in mindestens 99 % der Fälle auch beim 99. Mal wieder auftreten. Dies bedeutet nicht, dass der Fortbestand dieses Musters für immer als gesichert angesehen werden darf. Der Fortbestand kann jedoch laufend überprüft werden und es ist damit eindeutig und objektiv feststellbar, wann gegebenenfalls ein bisher gültiges emergentes Gesetz nicht mehr gilt. Diese grundlegende Struktur emergenter Gesetze verkörpert die methodische Basis für das Forschungsprojekt. 2 Vgl. hierzu die Ausführungen zu sogenannten Metagesetzen unter https: / / www.udpl.info/ meta-laws. Abb. 1: Beispiel für ein emergentes Gesetz 0 50000 100000 150000 200000 250000 300000 350000 400000 45 40 35 30 25 20 Rolling-Means for Sequence of Emergence in Chronological Time Emergence reached: Yes Reliability: 99.0 % Max-Reliability: 100.0 % Set of Emergence: 4096 Degree of inductive Verification (DiV): 98.41 Rolling-Mean for TU_ct = 4096: df [,anzahl_Massnahmen_Indikator_kommende 7D‘] with df [,Geschlecht eines Klienten‘] = ,männlich‘ Benchmark-Rolling-Mean for TU_ct = 4096: df [,anzahl_Massnahmen_Indikator_kommende 7D‘] with df [,Geschlecht eines Klienten‘] = ,weiblich‘ Non-Overlapping Window for TU_ct = 4096 Rolling-4096-Mean(s) Time 314 uj 7+8 | 2024 Maßnahmenplanung in sozialen Einrichtungen mit KI Um einen vertrauenswürdigen Einsatz der KI- Software in der Steuerung der Einrichtungen zu gewährleisten, ist es erforderlich, dass der Algorithmus in der Lage ist, verlässliche Prognosen zu machen. Es werden im Folgenden für die drei Institutionen jeweils die Datenerfassung und -aufbereitung skizziert, um anschließend ausgewählte Prognosebeispiele, die für die Ressourcenplanung bzw. die Planung von Betreuungsmaßnahmen der Einrichtungen von Relevanz sind, darzustellen und zu erläutern. Erste Einrichtung: Datenerfassung und -aufbereitung Die von der Einrichtung der Kinder- und Jugendhilfe zur Verfügung gestellten Daten erstrecken sich auf einen Zeitraum von ca. fünf Jahren. Die Datenerhebung innerhalb der Einrichtung erfolgt in standardisierter Form nach einem bestimmten Muster: Bei der Aufnahme eines Jugendlichen wird ein Aufnahmebogen erstellt, in dem die zu diesem Zeitpunkt zur Verfügung stehenden Informationen erfasst werden. Während des Aufenthalts des Jugendlichen in der Einrichtung werden ca. alle sechs Monate sogenannte Verlaufsbögen erstellt, durch die die Entwicklung des Klienten bzw. der Klientin während des Aufenthalts dokumentiert wird. Je nach Aufenthaltsdauer liegen somit für jeden Klienten und jede Klientin entweder kein Verlaufsbogen, ein Verlaufsbogen oder aber mehrere Verlaufsbögen vor. In den Fällen, in denen die Unterstützungsleistung durch die Einrichtung beendet wird und die KlientInnen die Einrichtung verlassen, wird ein Abschlussbogen erstellt. Die Abbildung 2 zeigt die Struktur der Datenerfassung. Die Daten liefern eine Vielzahl von Informationen über Zustände der KlientInnen, wie z. B. bestimmte Symptome oder Diagnosen, sowie zu relevanten Erfolgskennzahlen, z. B. Kooperation seitens der KlientInnen, Selbstständigkeit der KlientInnen bzw. der Erreichung von Interventionszielen. Sie beinhalten auch Informationen über vorgenommene Maßnahmen seitens der Einrichtung. Für die Analyse wurden weitere Maßnahmen der Datenaufbereitung durchgeführt. Dies betraf beispielsweise die Umwandlung der Ausprägungen einiger Merkmale (z. B. Symptome oder Diagnosen) in eine Ordinalskala. Weiter- ➤ Je nach Aufenthaltsdauer keine oder mehrere Verlaufsbögen pro KlientIn ➤ 985 Bögen von 362 KlientInnen ➤ In den Rohdaten ca. 300 Merkmale pro KlientIn ➤ Merkmale wie z. B. Hilfeplanziele, Betreuungsaufwand, Interventionen, Symptome, Diagnosen, … ➤ Je nach aktuellem Status einer KlientIn Abschlussbogen vorhanden oder nicht ➤ 274 Abschlussbögen von KlientInnen ➤ In den Rohdaten ca. 350 Merkmale pro KlientIn ➤ Merkmale wie z. B. Anschlusshilfe, Symptome, Diagnosen, … ➤ 362 Aufnahmebögen von KlientInnen ➤ In den Rohdaten ca. 300 Merkmale pro KlientIn ➤ Merkmale wie z. B. Alter, Geschlecht, Aufnahmegrund, Symptome, Diagnosen, … Aufnahmebogen Verlaufsbogen Abschlussbogen Abb. 2: Struktur der Datenerfassung 315 uj 7+8 | 2024 Maßnahmenplanung in sozialen Einrichtungen mit KI hin wurden die Daten in eine Zeitstruktur überführt, die es ermöglicht, Veränderungen bezüglich bestimmter Merkmale im Vergleich zum Zeitpunkt der Aufnahme sowie während des laufenden Prozesses zu analysieren. Weiterhin wurden Variablen definiert, durch die Verbesserungen oder Verschlechterungen zentraler Merkmale der KlientInnen im Vergleich zur Aufnahme oder während der laufenden Betreuung gemessen werden. Schließlich erfolgte eine Aggregation über alle erfassten KlientInnen hinweg zu einer Gesamtdatenbank. Die Abbildung 3 stellt einen kleinen Ausschnitt aus der Datenbank dar und vermittelt so einen Eindruck von deren Struktur, wobei die Variable „code_aufnahme“ die KlientInnen nach Anonymisierung bezeichnet. Abb. 3: Ausschnitt aus dem aufbereiteten Datensatz index_diag_summe_verlauf_diff_zu_aufnahme_binary Index_drogen_max_verlauf Index_drogen_mean_verlauf Index_drogen_summe_verlauf diag_2_verlauf schulform_verlauf_onehot_verlauf_11_vorherig symp_22_verlauf diag_99_aufnahme symp_12_verlauf_diff_zu_aufnahme diag_5_verlauf_vorherig index_ress_min_verlauf symp_wichtig_verlauf_onehot_verlauf_9_vorherig ress_8_aufnahme index_ress_min_aufnahme index_ress_summe_aufnahme index_diag_max_aufnahme anlass_5_aufnahme symp_14_verlauf_vorherig diag_wichtig_aufnahme_onehot_aufnahme_15 alter_aufnahme symp_wichtig_aufnahme_onehot_restaufnahme symp_wichtig_aufnahme_onehot_aufnahme_15 schulform_aufnahme_onehot_aufnahme_19 index_drogen_mean_aufnahme jugendhilfen_5_aufnahme Abb. 4: Ausschnitt aus den Ergebnissen, der die vom KI-Algorithmus identifizierten Zusammenhänge zeigt 316 uj 7+8 | 2024 Maßnahmenplanung in sozialen Einrichtungen mit KI Der verwendete KI-Algorithmus ist in der Lage, trotz der hohen Anzahl an Variablen in dem beschriebenen Datensatz die für die jeweilige Zielsetzung relevanten Größen auszuwählen. Dies ermöglicht eine effiziente und automatische Datenanalyse, ohne dass manuell eine Auswahl oder Vorverarbeitung der Variablen erforderlich wäre. Die Abbildung 4 zeigt einen kleinen Ausschnitt aus den komplexen Zusammenhängen, die vom KI-Algorithmus automatisch identifiziert wurden, und zeigt das Potenzial des Algorithmus, komplexe Datenmengen zu verarbeiten und wertvolle Erkenntnisse zu gewinnen. Dabei ist erkennbar, dass eine Vielzahl von Größen hilfreich für eine Prognose ist. Im Folgenden wird anhand eines kleinen ausgewählten Beispiels, welches aus den Ergebnissen der für die erste Einrichtung durchgeführten Analyse stammt, gezeigt, welche konkreten Möglichkeiten aus der Verwendung des in der Analyse verwendeten KI-Algorithmus resultieren können. Erste Einrichtung: Entscheidungsunterstützung bei Aufnahme der KlientInnen - Prognosebeispiel Drogenkonsum Wie bereits angesprochen, werden bereits bei der Aufnahme der KlientInnen ca. 300 Merkmale als Rohdaten erhoben. Damit wird es möglich, auf der Grundlage dieser Daten nach entsprechender Aufbereitung durch den Einsatz des Algorithmus Prognosemodelle für eine Vielzahl von als relevant erachteten Merkmalen während und am Ende des Aufenthalts der KlientInnen in der Einrichtung sowie deren Entwicklung im Zeitablauf zu erstellen. Die Abbildung 5 illustriert dies schematisch. Exemplarisch soll hier gezeigt werden, inwieweit es durch den Einsatz des Algorithmus möglich ist, auf der Grundlage von Daten, die bei der Aufnahme bekannt sind, das Ausmaß des Konsums von Cannabis während des Verlaufs des Aufenthalts (Merkmal „drog_3_verlauf“) zu prognostizieren. Für die Messung dieser Variable wird die folgende Ordinalskala verwendet: ➤ ,0‘: kein Konsum ➤ ,1‘: selten, wenig ➤ ,2‘: öfter, kontrolliert ➤ ,3‘: unkontrolliert ➤ ,4‘: abhängig Aus den in der Datenbank enthaltenen Informationen hat der Algorithmus drei bei Aufnahme bekannte Variable identifiziert, die sich hinsichtlich des zu prognostizierenden Konsums von Cannabis während des Aufenthalts in der Einrichtung als relevant erwiesen haben: ➤ „drog_weich_aufnahme“ (Konsumintensität weicher Drogen bei Aufnahme) ➤ „symp_1_aufnahme“ (Auffälligkeiten im Essverhalten bei Aufnahme) ➤ „schwer_aufnahme“ (Schweregrad der Gesamtauffälligkeit bei Aufnahme) Die Abbildung 6 zeigt die vom Algorithmus als relevant identifizierten prognostischen Zusammenhänge. Aufnahme Verlaufsbogen Verlaufsbogen Verlaufsbogen … Abschluss Prognose Abb. 5: Prognosestruktur bei Aufnahme drog_weich_aufnahme schwer_aufnahme symp_1_aufnahme drog_3_verlauf Abb. 6: Für die Prognose des Drogenkonsums relevante Einflussgrößen 317 uj 7+8 | 2024 Maßnahmenplanung in sozialen Einrichtungen mit KI Der hier beispielhaft verwendete und isoliert betrachtete prognostische Zusammenhang zwischen der Variable „Konsum weicher Drogen bei Aufnahme“ und der zu prognostizierenden Variable „Konsum von Cannabis im Verlauf“ lässt sich auch grafisch darstellen (s. Abb. 7). Hierbei wird auf der X-Achse die Konsumintensität weicher Drogen bei Aufnahme, gemessen auf einer Ordinalskala mit den Ausprägungen 0 bis 5, dargestellt. Um den reinen Prognoseeffekt bezüglich des Cannabiskonsums während des Verlaufs, der sich aus der Information bezüglich der Konsumintensität weicher Drogen bei Aufnahme ergibt, zeigen zu können, werden auf der Y-Achse lediglich die durchschnittlichen Abweichungen einer Prognose mit Berücksichtigung Konsumintensität weicher Drogen bei Aufnahme von einer Prognose ohne Berücksichtigung der Konsumintensität weicher Drogen bei Aufnahme dargestellt (dunkle Punkte in obiger Abbildung). Beide Prognosemodelle werden autonom durch den KI-Algorithmus erstellt. Es ergibt sich ein näherungsweiser linearer Zusammenhang: Je stärker der Konsum weicher Drogen bei Aufnahme ist, desto höher ist die prognostizierte Konsumintensität von Cannabis im späteren Verlauf. Negative Werte (dunkle Punkte unterhalb der Null-Linie) bedeuten, dass von der Berücksichtigung der Variable „Konsum weicher Drogen bei Aufnahme“ eine verringernde Wirkung auf die Prognose der Variable „Konsum von Cannabis im Verlauf“ ausgeht. Umgekehrt zeigen positive Werte oberhalb der Null-Linie, dass die Berücksichtigung der Variable „Konsum weicher Drogen bei Aufnahme“ eine verringernde Wirkung auf die Prognose der Variable „Konsum von Cannabis im Verlauf“ aufweist. Prognostizierte und tatsächliche Auswirkung auf Konsumintensität von Cannabis (drog_3_verlauf ) 0.5 0.4 0.3 0.2 0.1 0.0 -0.1 -0.2 Zusammenhang zwischen beobachteter Konsumintensität weicher Drogen bei Aufnahme und der prognostizierten Konsumintensität von Cannabis im späteren Verlauf 0 1 2 3 4 5 ⦁ Out of sample - Prognose ⦁ Out of sample - Tatsächlicher Wert ⦁⦁ ⦁ ⦁ ⦁⦁ ⦁⦁ ⦁⦁ ⦁ ⦁ Konsumintensität weicher Drogen bei Aufnahme (drog_weich_aufnahme) Abb. 7: Zusammenhang zwischen beobachteter Konsumintensität weicher Drogen bei Aufnahme eines Jugendlichen und der prognostizierten/ tatsächlichen Konsumintensität von Cannabis im späteren Verlauf des Jugendlichen 318 uj 7+8 | 2024 Maßnahmenplanung in sozialen Einrichtungen mit KI Die Abbildung 7 zeigt überdies in gewisser Weise die Prognoseperformance, indem die tatsächlich beobachteten Werte den prognostizierten Werten gegenübergestellt werden: Die hellen Punkte zeigen die tatsächlich beobachtete Abweichung des Konsums von Cannabis im Verlauf von dem jeweils ohne Berücksichtigung der Konsumintensität weicher Drogen bei Aufnahme prognostizierten Wert in Abhängigkeit von der bei Aufnahme des Klienten bzw. der Klientin gemessenen Konsumintensität weicher Drogen. Das emergente Gesetz, das dem dargestellten Prognosezusammenhang zugrunde liegt, weist die folgenden Eigenschaften auf: Das wiederkehrende Muster bezieht sich auf nicht überlappende Sequenzen von jeweils 150 KlientInnen. Es hat sich in dem gesamten Datenbestand in nicht überlappenden Sequenzen 5-mal ohne Unterbrechung wiederholt und weist einen Reliability-Wert von 80 % auf. Entsprechend dem Konzept der Metagesetze bedeutet dies, dass aufgrund von Analysen über viele Datenbanken hinweg gesagt werden kann, dass Muster, die bisher 5-mal ununterbrochen beobachtet wurden, in mindestens 80 % der Fälle auch beim 6. Mal wieder auftreten. Die obigen Ausführungen bezogen sich auf den isolierten Effekt, der von dem Konsum weicher Drogen bei Aufnahme ausgeht. Die Berücksichtigung sämtlicher drei Variablen, die sich auf den Zeitpunkt der Aufnahme beziehen und für Prognosezwecke relevant sind, führt zu einem Gesamtprognosemodell für den Konsum von Cannabis im Verlauf. Die Abbildung 8 zeigt für ausgewählte KlientInnen das Prognoseergebnis für die Variable „drog_3_verlauf“. Für Person „50170110644“ wurde auf der Grundlage der drei prognoserelevanten Merkmale bei Aufnahme, die am 24. 4. 2015 erhoben wurden, für den späteren Verlauf eine Konsumintensität von Cannabis in Höhe von 0,7 prognostiziert (Spalte „KI-Prognose“). Tatsächlich zeigte sich dann im weiteren Verlauf der Betreuung anhand der nachfolgenden Verlaufsbögen vom 23. 10. 2015 und 12. 1. 2016 tatsächlich eine Konsumintensität von Cannabis auf dem Level 2 (Spalte „drog_3_verlauf“). Der tatsächliche im Verlauf beobachtete Cannabiskonsum wurde demnach der Kategorie „öfter, kontrolliert“ zugeordnet, obwohl bei der Aufnahme bei diesem Klienten bzw. der Klientin hinsichtlich des Merkmals „Konsum von Cannabis“ ein Wert von 0 (kein Konsum) erhoben worden war (Spalte„drog_3_aufnahme“). Dies belegt die Prognoserelevanz der vom Algorithmus autonom identifizierten Merkmale. Obwohl sich die auf die einzelne Person bezogene Prognose in diesem Fall im Nachhinein als richtig erweist, darf daraus nicht die Schlussfolgerung abgeleitet werden, dass die verwendete KI in der Lage ist, grundsätzlich richtige Einzelfallprognosen zu machen. Dies widerspräche dem Grundgedanken der Konzeption emergenter Gesetze (Plafky et al. 2022, 117). Ein gesetzesartiger Prognosezusammenhang („Es war bisher immer so“), wie er oben für den Zusammenhang zwischen den drei bei Aufnahme erfassten Größen und dem Cannabiskonsum im Verlauf dargestellt wurde, zeigt sich erst bei einer Betrachtung von mindestens jeweils 150 KlientInnen. Erst ab einer Mindestbeobachtungsmenge von 150 KlientInnen emergiert das beschriebene Phänomen. Abb. 8: Validität des Prognosemodells 319 uj 7+8 | 2024 Maßnahmenplanung in sozialen Einrichtungen mit KI Daher muss bei der Anwendung des KI-Modells in der Einrichtung darauf geachtet werden, dass eine solche Beobachtungsmenge durch geeignete Konzeption der Anwendung erreicht wird. Wird die vorliegende KI-Prognose also etwa verwendet, um bei Aufnahme eines Klienten bzw. einer Klientin über die Durchführung einer präventiven Maßnahme zum Thema Cannabiskonsum zu entscheiden, wird durch diese wiederholte Entscheidungssituation eine ausreichend große Beobachtungsmenge für eine valide Anwendung des KI-Modells gewährleistet. Dadurch wird ein Einsatz des KI-Systems auch für einzelne KlientInnen möglich, da diese so Teil einer umfassenderen Entscheidungsstrategie bzw. Entscheidungsregel sind. In dem hier vorgestellten Prognosebeispiel ging es um den Zeitpunkt der Aufnahme als Vorhersagezeitpunkt. Die Daten erlauben darüber hinaus auch Prognosen, die während des Verlaufs der Betreuung innerhalb der Einrichtung erstellt werden. Bei Erhebung jedes Verlaufsbogens werden durch die KI Prognosen über die künftigen Ausprägungen wichtiger Merkmale sowie deren Veränderung im Zeitablauf entsprechend der Abbildung 9 erstellt. Der verwendete Algorithmus liefert auch hier eine Vielzahl von prognostischen Zusammenhängen und kann so entscheidungsunterstützend wirken. Da zusätzlich zu den Merkmalen bei Aufnahme auch Informationen aus der vorherigen Hilfeperiode verwendet werden, lassen sich viele bedeutsame Merkmale deutlich besser prognostizieren als bei ausschließlicher Verwendung der Informationen im Aufnahmezeitpunkt. Außerdem ermöglicht die häufigere, periodische Prognose bei jedem Verlaufsbogen auch eine regelmäßige Aussage über die zukünftige Veränderung von Merkmalen im laufenden Hilfeprozess und erschließt somit neue weitergehende Anwendungsmöglichkeiten. Im Folgenden sollen nun in knapper Form analoge Prognosebeispiele sowie die Datengenerierungsprozesse der anderen beiden Einrichtungen dargestellt werden. Zweite Einrichtung: Datenerfassung und -aufbereitung Die Datenerhebung innerhalb der zweiten Einrichtung, die ebenso wie die erste Einrichtung dem Bereich der Kinder und Jugendhilfe zuzuordnen ist, unterscheidet sich wesentlich von der Art der Datenerhebung innerhalb der ersten Einrichtung. Schwerpunkt der in der Einrichtung verwendeten Software zur Datenerhebung ist die Dokumentation und Aufzeichnung aller operativ relevanten Daten, die für die tägliche Arbeit der SozialarbeiterInnen und der Organisation notwendig sind, etwa Planung oder Abrechnung von Leistungen. Während, wie bereits beschrieben, für die erste Einrichtung der Rhythmus von sechs Monaten sowie ein weitgehend standardisiertes Erhebungsformat charakteristisch sind, erfolgt innerhalb der zweiten Einrichtung über die einmalige Erfassung von Stammdaten hinaus eine Dokumentation von als relevant eingestuften Vorgängen dann, wenn sie eintreten. Dies kann dazu führen, dass Messungen von Variablen in sehr kurzen Zeitabständen vorgenommen wer- Aufnahme Verlaufsbogen Verlaufsbogen Verlaufsbogen … Abschluss Prognose Prognose Prognose Abb. 9: Prognosestruktur während des Verlaufs 320 uj 7+8 | 2024 Maßnahmenplanung in sozialen Einrichtungen mit KI den, dann jedoch nur sehr wenig Variablen pro Messzeitpunkt erfasst werden. Hierbei geht es beispielsweise um das Eintreten kritischer Situationen, Gesprächstermine, Medikationen usw. Die Messung vieler Merkmale erfolgt nicht standardisiert und besteht häufig aus Freitext, was eine systematische Analyse erschwert. Zum Teil fehlen präzise Zeitangaben für vorgenommene Messungen. Dadurch werden Prognosen erheblich erschwert, da nur solche Daten für Prognosezwecke verwendet werden können, die zum Prognosezeitpunkt mit Sicherheit vorliegen. Die spezifischen Eigenschaften der Datenbasis machen umfangreiche Maßnahmen zur Auf- Abb. 10: Ausschnitt aus dem Paneldatensatz nach Aufbereitung bereitung der Daten erforderlich, um sinnvolle Analyseergebnisse zu ermöglichen. Es entsteht ein Paneldatensatz mit einer Erfassung von Merkmalen mit täglicher Frequenz. Dieser umfasst insgesamt über 70.000 Einträge, bestehend aus täglichen Daten von 230 KlientInnen über die Jahre 2019 - 2021 hinweg. Die Abbildung 10 illustriert dies. Die Erstellung von rollierenden Zeitfenstern für die Daten ermöglicht Prognosen mit unterschiedlichen Zeithorizonten (1, 7, 30 oder 90 Tage) (s. Abb. 11). Hierfür soll im Folgenden ein Beispiel vorgestellt werden. Daten in täglicher Frequenz Aktueller Tag 1 Tag „1D“ 1 Tag „1D“ 7 Tage „7D“ 30 Tage „30D“ 90 Tage „90D“ 7 Tage „7D“ 30 Tage „30D“ 90 Tage „90D“ Abb. 11: Für die Prognosen verwendete Zeithorizonte 321 uj 7+8 | 2024 Maßnahmenplanung in sozialen Einrichtungen mit KI Prognose der Anzahl kritischer Ereignisse innerhalb der jeweils kommenden 30 Tage Im folgenden Beispiel geht es darum zu zeigen, wie an einem beliebigen Tag jeweils für einen bestimmten Prognosezeitraum eine Vorhersage gemacht werden kann, die sich aus einem von dem KI-Algorithmus identifizierten, emergenten Gesetz ergibt. Konkret soll vorhergesagt werden, wie viele als kritisch einzustufende Ereignisse innerhalb der Einrichtung in den auf den vorhergesagten Tag folgenden 30 Tagen eintreten werden („anzahl_Ereignis_Kritische Situation_kommende 30D“). Wie die Abbildung 12 zeigt, filtert der Algorithmus aus der Vielzahl von erfassten Variablen genau zwei Größen heraus, die sich für die Prognose als empirisch relevant erweisen. Die beiden für die Prognose verwendeten Größen verkörpern einerseits die in den vergangenen 90 Tagen beobachtete Anzahl kritischer Situationen innerhalb der Einrichtung über alle KlientInnen der Einrichtung hinweg („anzahl_ Ereignis_Kritische Situation_vergangene 90D“) sowie andererseits das Eintreten eines Freizeitereignisses innerhalb der vergangenen 7 Tage („eingetreten_Ereignis_Freizeit_vergangene 7D“), gemessen als binäre Variable mit den Ausprägungen 0 (kein Ereignis) und 1 (Ereignis hat stattgefunden). Bei einem Freizeitereignis handelt es sich um eine von der Einrichtung protokollierte Kategorie von Ereignissen in der Freizeit der KlientInnen, die u. a. Besuche von Elternteilen, Sportaktivitäten oder sonstige Freizeitaktivitäten umfasst. Wird exemplarisch der Zusammenhang zwischen den als kritisch einzustufenden Ereignissen in den auf den Vorhersagetag folgenden 30 Tagen und der in den vergangenen 90 Tagen beobachteten Anzahl kritischer Situationen betrachtet, so zeigt sich ein Bild, wie in Abbildung 13 dargestellt. In Analogie zu dem bei der Betrachtung der ersten Einrichtung verwendeten Beispiel zeigt die obige Abbildung den reinen Prognoseeffekt. Auf der X-Achse wird die Häufigkeit des Auftretens kritischer Situationen in den vergangenen 90 Tagen dargestellt. Auf der Y-Achse hingegen werden die Effekte gezeigt, die sich im Hinblick auf die Häufigkeit des Auftretens kritischer Situationen in den kommenden 30 Tagen ergeben: Die dunklen Punkte verkörpern die Abweichungen der durch den Algorithmus prognostizierten Werte für den Fall, dass die Information bezüglich der Häufigkeit des Auftretens kritischer Situationen in den vergangenen 90 Tagen berücksichtigt wird, von den durch den Algorithmus prognostizierten Werten für den Fall, dass die Information bezüglich der Häufigkeit des Auftretens kritischer Situationen in den vergangenen 90 Tagen unberücksichtigt bleibt. Durch diese Art der Darstellung kann der isolierte Prognoseeffekt gezeigt werden, der aus der Information bezüglich der Häufigkeit des Auftretens kritischer Situationen in den vergangenen 90 Tagen resultiert. Die hellen Punkte verkörpern die tatsächlich beobachteten Werte, sodass eine Ex-post-Überprüfung der Prognoseanzahl_Ereignis_Kritische Situation_vergangene 90D anzahl_Ereignis_Kritische Situation_kommende 30D eingetreten_Ereignis_Freizeit_vergangene 7D Abb. 12: Für die Prognose des Eintretens kritischer Situationen relevante Einflussgrößen 322 uj 7+8 | 2024 Maßnahmenplanung in sozialen Einrichtungen mit KI qualität ermöglicht wird. Die Ex-post-Überprüfung findet ebenfalls mit den für den KI-Algorithmus unbekannten Out-of-sample-Daten statt und erlaubt so eine Abschätzung der möglichen Prognosequalität in einer tatsächlichen Anwendung. Der Zusammenhang zwischen den Merkmalen ist näherungsweise linear: Je mehr kritische Situationen in den jeweils letzten 90 Tagen auftraten, desto mehr kritische Situationen werden für die jeweils nächsten 30 Tagen prognostiziert und auch tatsächlich beobachtet. Dieser Zusammenhang bezieht sich auf eine Mindestbeobachtungsmenge bzw. Sequenzlänge von 10.358 KlientInnentagen. Das entsprechende Muster hat sich in dem gesamten Datenbestand in nicht überlappenden Sequenzen 5-mal ohne Unterbrechung wiederholt und weist einen Reliability-Wert von 90 % auf. Entsprechend dem Konzept der Metagesetze kann somit gesagt werden, dass Muster, die bisher 5-mal beobachtet wurden, in mindestens 90 % der Fälle auch beim 6. Mal wieder auftreten. Dritte Einrichtung: Datenerfassung und -aufbereitung Innerhalb der dritten Einrichtung, die dem Bereich der Sozialpsychiatrie zuzuordnen ist, erfolgt 0 1 2 3 4 5 Anzahl kritischer Situationen eines Klienten in den letzten 90 Tagen (anzahl_Ereignis_Kritische Situation_vergangene 90D) ⦁ Out of sample - Prognose ⦁ Out of sample - Tatsächlicher Wert Zusammenhang zwischen beobachteter Anzahl kritischer Situationen der letzten 90 Tage eines Klienten und der prognostizierten Anzahl kritischer Situationen in den kommenden 30 Tagen Prognostizierte und tatsächliche Auswirkung auf Anzahl kritischer Situationen in den kommenden 30 Tagen (anzahl_Ereignis_Kritische Situation_kommende 30D) 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 ⦁⦁ ⦁⦁ ⦁ ⦁ ⦁⦁ ⦁⦁ ⦁ ⦁ Abb. 13: Zusammenhang zwischen beobachteter Anzahl kritischer Situationen im Leben der KlientInnen in den letzten 90 Tagen und der prognostizierten/ tatsächlichen Anzahl kritischer Situationen in den kommenden 30 Tagen 323 uj 7+8 | 2024 Maßnahmenplanung in sozialen Einrichtungen mit KI der Prozess der Datenerhebung hinsichtlich der zeitlichen Struktur der Messvorgänge analog zur Vorgehensweise bei der zweiten Einrichtung. Allerdings werden inhaltlich andere Merkmale erhoben. So werden beispielsweise unter anderem auch Informationen über betreuende MitarbeiterInnen und deren spezifische Eigenschaften erfasst, wie z. B. Bereichszuordnung oder Qualifikation. Wie bei der zweiten Einrichtung weisen auch hier die Daten insofern Probleme auf: Etwa fehlen teilweise präzise Zeitangaben für die Erfassung und die Datenerfassung erfolgt in vielen Fällen nicht in standardisierter quantitativer Form. Darüber hinaus führen häufige Freitexteingaben, in denen sensible Informationen enthalten sind, zu einem erheblichen Anonymisierungsaufwand. Der nach erfolgter Datenaufbereitung entstehende Paneldatensatz umfasst insgesamt über 400.000 Einträge, bestehend aus täglichen Daten von 500 KlientInnen der Jahre 2019 - 2022. Die Abbildung 14 illustriert die Struktur des Datensatzes. Im Folgenden wird nun auch für die dritte Einrichtung ein Prognosebeispiel vorgestellt, bei dem es um die Vorhersage einer für die Ressourcenplanung wesentlichen Größe geht. Auch hier wird wieder das aus den Überlegungen zur zweiten Einrichtung bekannte Zeitraster verwendet (s. Abb. 15). Abb. 14: Ausschnitt des aus der Datenaufbereitung resultierenden Datensatzes Daten in täglicher Frequenz Aktueller Tag 1 Tag „1D“ 1 Tag „1D“ 7 Tage „7D“ 30 Tage „30D“ 90 Tage „90D“ 7 Tage „7D“ 30 Tage „30D“ 90 Tage „90D“ Abb. 15: Für die Prognosen verwendete Zeithorizonte 324 uj 7+8 | 2024 Maßnahmenplanung in sozialen Einrichtungen mit KI Prognose der Veränderung der Anzahl von Maßnahmen in den kommenden 7 Tagen gegenüber der entsprechenden Anzahl in den vergangenen 7 Tagen Das im Folgenden vorgestellte Beispiel zeigt den prognostischen Effekt, der aus der Veränderung der Anzahl von durchgeführten Maßnahmen in den vergangenen 30 Tagen gegenüber dem jeweils vorausgehenden 30-Tage- Zeitraum („differenz_Maßnahmen_Kürzel_Rest vergangene 30D“) im Hinblick auf die Veränderung der Anzahl des Auftretens kritischer Situationen in dem zukünftigen 7-Tage-Zeitraum hinweg („differenz_Maßnahmen_Indikator_ kommende 7D“) resultiert. Es geht somit um die Prognose der Veränderung der Anzahl von Maßnahmen, die in den jeweils kommenden 7 Tagen eintreten werden, von der Anzahl kritischer Situationen, die in den jeweils vorausgegangenen 7 Tagen eingetreten waren. Beispielsweise kann in den kommenden 7 Tagen eine Zunahme oder eine Verringerung in der Anzahl von Maßnahmen bei KlientInnen auftreten. Wie die Abbildung 16 zeigt, hat der Algorithmus aus der Vielzahl gemessener Größen drei Merkmale als prognoserelevant herausgefiltert, von denen eine die oben angesprochene Veränderung der Anzahl von durchgeführten Maßnahmen in den vergangenen 30 Tagen ist. In Analogie zu den vorherigen Beispielen zeigt die Abbildung 17 den reinen prognostischen Effekt, der aus der Kenntnis bezüglich der Veränderung der Anzahl von durchgeführten Maßnahmen in den vergangenen 30 Tagen gegenüber dem jeweils vorausgehenden 30-Tage- Zeitraum resultiert. Das Ergebnis erscheint hier im Unterschied zu den vorherigen Beispielen eher kontraintuitiv, die Empirie sagt etwas anderes, als man erwarten würde: Wenn für einen beliebigen Prognosestichtag gilt, dass in den jeweils vorausgegangenen 30 Tagen eine Reduktion der Anzahl durchgeführter Maßnahmen auftrat (negativer Wert auf der X-Achse), dann wird bei Kenntnis dieser Veränderung für die jeweils nachfolgenden 7 Tage eine Zunahme von erforderlichen Maßnahmen prognostiziert. Dies gilt im Vergleich zum Prognosewert ohne die Kenntnis dieser Veränderung. Die Kenntnis der Veränderung der Anzahl der in den jeweils vorausgegangenen 30 Tagen durchgeführten Maßnahmen bewirkt nicht nur, dass der Algorithmus zu einer veränderten Prognose gelangt. Auch die tatsächlich beobachtete Veränderung der Anzahl von Maßnahmen innerhalb der jeweils nachfolgenden 7 Tage fällt dann höher aus, als sie ohne Kenntnis der Veränderung der Anzahl der in den jeweils vorausgegangenen 30 Tagen durchgeführten Maßnahmen vorhergesagt worden wäre. Dieser Zusammenhang bezieht sich auf eine Mindestbeobachtungsmenge von 33.517 KlientInnentagen. Das entsprechende Muster hat sich in dem gesamten Datenbestand in nicht überlappenden Sequenzen 9-mal ohne Unterbrechung wiederholt und weist einen Reliability- Wert von 99 % auf. Entsprechend dem Konzept der Metagesetze kann somit gesagt werden, dass Muster, die bisher 9-mal beobachtet wurden, in mindestens 99 % der Fälle auch beim 10. Mal wieder auftreten. Damit liegt ein für eine Ressourcenplanung wertvoller Indikator vor. differenz_Massnahmen_Indikator_kommende 7D differenz_Massnahmen_Indikator_vergangene 30D differenz_Massnahmen_Kuerzel_Rest_vergangene 7D durchschnitt_Massnahmen_Anteil_Status_verschoben_vergangene 7D Abb. 16: Für die Prognose der Veränderung der Anzahl erforderlicher Maßnahmen relevante Einflussgrößen 325 uj 7+8 | 2024 Maßnahmenplanung in sozialen Einrichtungen mit KI Schlussfolgerungen, Diskussion der Ergebnisse Zweck der Durchführung des Forschungsprojekts im Sinne eines Pilotprojekts war es, der Frage nachzugehen, „ob und inwieweit es algorithmenbasierte Entscheidungsprozesse in sozialen Einrichtungen ermöglichen, Effizienzkriterien zu erfüllen und gleichzeitig ethischen und fachlichen Grundsätzen in adäquater Form Rechnung zu tragen“ (Plafky et al. 2022, 115). Es konnte gezeigt werden, dass der Einsatz der im Rahmen des Projekts verwendeten Maschinenlerntechnologie in der praktischen Planung und Steuerung in sozialen Einrichtungen zu einem stärker zielgerichteten und nachhaltigen Ressourceneinsatz führen kann, wie dies auch schon in anderen Forschungsprojekten angedacht wurde (Gillingham 2016). Ausschlaggebend hierfür sind zunächst die äußerst vielfältigen Prognosemuster, die durch den Algorithmus in den zur Verfügung gestellten Datenbeständen identifiziert werden konnten. Prognostizierte und tatsächliche Auswirkung auf die Veränderung der Anzahl von Maßnahmen bei einem Klienten der kommenden 7 Tage (differenz_Maßnahmen_Indikator_kommende 7D) 3 2 1 0 -1 -2 Zusammenhang zwischen der Veränderung in der Anzahl durchgeführter Maßnahmen bei einem Klienten der letzten 30 Tage und prognostizierter Veränderung in der Anzahl durchgeführter Maßnahmen der kommenden 7 Tage ⦁ Out of sample - Prognose ⦁ Out of sample - Tatsächlicher Wert -50 -25 0 25 50 75 100 125 Veränderung der Anzahl von Maßnahmen bei einem Klienten in den letzten 30 Tagen (differenz_Maßnahmen_Kürzel_Rest vergangene 30D) Abb. 17: Zusammenhang zwischen beobachteter Veränderung in der Anzahl durchgeführter Maßnahmen bei einem/ einer Klienten/ Klientin in den letzten 30 Tagen und der prognostizierten/ tatsächlichen Veränderung in der Anzahl durchgeführter Maßnahmen in den kommenden 7 Tagen 326 uj 7+8 | 2024 Maßnahmenplanung in sozialen Einrichtungen mit KI Hierfür wurden in den obigen Ausführungen drei einfache Beispiele aus den verwendeten Datensätzen präsentiert. Zur weiteren Verifizierung benötigt es weitergehende Forschungsprojekte in zusätzlichen Einrichtungen. Die Ergebnisse der Fokusgruppen, bei denen es um die Fragen bezüglich des Einsatzes von dieser KI aus Professionsperspektive und die Unterstützung und Weiterentwicklung der evidenz-informierten Entscheidungsfindung in sozialen Einrichtungen geht, werden in einem anderen Artikel zu einem späteren Zeitpunkt veröffentlicht. Die Möglichkeit, verlässliche Prognosen zu erstellen, ist von zentraler Bedeutung für eine zielgerichtete und evidenzinformierte Erfüllung vielfältiger Steuerungsaufgaben in sozialen Einrichtungen. Beispielhaft können die folgenden Anwendungen genannt werden, die sich auch aus den jeweils mit MitarbeiterInnen der am Projekt beteiligten Einrichtungen durchgeführten Workshops herauskristallisiert haben: ➤ Planung des Ressourceneinsatzes, auch eines gezielten MitarbeiterInneneinsatzes, sofern MitarbeiterInnendaten vorhanden sind, wie dies bei der dritten Einrichtung der Fall war ➤ Einsatz bei der Ressourcenplanung für die Betreuung von KlientInnen ➤ Abschätzung von Risiken ➤ Zusammensetzung von stationären Wohngruppen auf der Grundlage bekannter empirischer Gesetzmäßigkeiten ➤ Entwicklung und Durchführung von zielgerichteten Präventionsmaßnahmen für KlientInnen mit bestimmten Risikoeinschätzungen (z. B. Prognose eines hohen zukünftigen Drogenkonsums) ➤ Schaffung der Möglichkeit, Entgeltverhandlungen mit Kostenträgern auf der Basis objektiver Erkenntnisse führen zu können ➤ Planung von geeigneten Maßnahmen bei der Betreuung von KlientInnen Bezüglich der Interpretation der Projektergebnisse im Hinblick auf eine mögliche Implementierung sowie den Einsatz der KI-Software in der Praxis sind mehrere wesentliche Aspekte zu berücksichtigen. Dies betrifft zunächst den Aspekt der Datenqualität. Die gewonnenen Erkenntnisse basieren auf der Auswertung von Daten, die nicht für den hier relevanten Zweck generiert wurden. So waren die verfügbaren Daten sowohl in quantitativer als auch in qualitativer Hinsicht verbesserungswürdig. Wünschenswert im Hinblick auf systematische Auswertungen wäre die Erhebung möglichst vieler Merkmale unter Verwendung objektiver Messregeln und in einem standardisierten Format in möglichst kleinen Zeitabständen. Die Erfüllung dieser Anforderungen kann zu besseren und umfangreicheren Prognosen und Wirkungsanalysen führen. Weiterhin bewirkt die Verwendung des Ansatzes der emergenzbasierten Statistik, dass die gewonnenen Erkenntnisse frei sind in Bezug auf Annahmen, z. B. hinsichtlich bestimmter Wahrscheinlichkeitsverteilungen von Variablen. Somit ist die widerspruchsfreie Kombination von aus einzelnen Einrichtungen generiertem Wissen möglich. Ein einrichtungsübergreifendes Maschinenlernen ohne einen aus Datenschutz kritisch zu sehenden Datenaustausch der Einrichtung ist dadurch möglich (federated learning). Darüber hinaus ist bei der Interpretation der Ergebnisse zu berücksichtigen, dass die Prognosen auf Basis von Datenbeständen erstellt wurden, die das bisherige „normale“ Verhalten der AkteurInnen in den Einrichtungen widerspiegeln. Wenn dieses Verhalten beispielsweise aufgrund sich ändernder anzuwendender Normen oder anderer Rahmenbedingungen verändert wird, kann dies gegebenenfalls die empirischen Zusammenhänge verändern. Bisher gültige emergente Gesetze verlieren möglicherweise auf einmal ihre Gültigkeit. Aus diesem Grund muss der Einsatz eines KI-Modells einer laufenden, nach Möglichkeit automatisierten Über- 327 uj 7+8 | 2024 Maßnahmenplanung in sozialen Einrichtungen mit KI wachung auf Stabilität der Zusammenhänge unterzogen werden, um mögliche Veränderungen frühzeitig zu identifizieren und entsprechende Anpassungen am KI-Modell vornehmen zu können. Die Möglichkeit, überhaupt eine solche Stabilitätskontrolle durchführen zu können, ist einer der wesentlichen Vorzüge des Ansatzes der emergenzbasierten Statistik. Ein weiterer Aspekt betrifft die Notwendigkeit, innerhalb einer Einrichtung Entscheidungen zu treffen, die sich auf einzelne KlientInnen beziehen. In dem vorangegangenen Beitrag (Plafky et al. 2022) und in den oben dargestellten Beispielen wurde als Charakteristikum des Ansatzes der emergenzbasierten Statistik herausgestellt, dass durch den Algorithmus identifizierte prognostische Zusammenhänge die Betrachtung von Mindestbeobachtungsmengen erfordern, z. B. KlientInnentagen. Dies ist dann unproblematisch, wenn einzelfallbezogene Entscheidungen im Kontext einer hinreichend großen Zahl aufeinanderfolgender Einzelfallentscheidungen gesehen werden. Auch wenn die Projektergebnisse aus der Analyse von Daten lediglich dreier Einrichtungen stammen und die Datenerfassung in den Einrichtungen nicht primär auf KI-Analysen ausgerichtet ist, so zeigt sich dennoch, dass der Einsatz von KI in Einrichtungen der Sozialen Arbeit geeignet sein könnte, die Möglichkeiten einer verstärkt evidenzinformierten Steuerung zu erweitern. Dabei ist zu berücksichtigen, dass sich die Ausführungen in diesem Beitrag ausschließlich auf das mit der Verwendung des Algorithmus einhergehende Prognosepotenzial bezogen haben. Wünschenswert ist es aber auch, neben der Frage nach dem „Was wird passieren? “ auch die Frage„Warum wird es passieren? “ beantworten zu können. Erst das Erkennen von Kausalzusammenhängen ermöglicht den Einsatz präventiver Strategien im eigentlichen Sinne. Eine zentrale Eigenschaft des verwendeten Algorithmus ist die Möglichkeit zur Durchführung von über die hier gezeigten Zusammenhänge hinausreichenden Kausalanalysen. Für die weitere Entwicklung und Möglichkeiten der Implementierung von KI in der Praxis Sozialer Arbeit bedarf es zusätzlicher Forschungsanstrengungen, um Chancen und Risiken der Anwendung noch weitergehender zu untersuchen. Prof. Dr. Christina S. Plafky OST Ostschweizer Fachhochschule Rosenbergstr. 59 9001 St Gallen Schweiz Prof. Dr. Norbert Kratz Prof. Dr. André Kuck Hans Frischhut Duale Hochschule Baden-Württemberg Friedrich-Ebert-Str. 30 78054 Villingen-Schwenningen Literatur Plafky, C. S., Kratz, N., Kuck, A. & Frischhut, H. (2022): KI-basierte Entscheidungsunterstützung in der Praxis Sozialer Arbeit. Unsere Jugend, 74 (3), 115 - 121 Gillingham, P. (2016): Predictive Risk Modelling to Prevent Child Maltreatment and Other Adverse Outcomes for Service Users: Inside the ‘Black Box’ of Machine Learning. British journal of social work, 46 (4), 1044 - 1058 ZES (2023): Zentrum für emergenzbasierte Statistik, Meta Laws, verfügbar unter www.udpl.info/ meta-laws, abgerufen am 8. 6. 2023