Legasthenie-Frühdiagnose: Lesemuster automatisch erkennen
Tablets erfassen beim Lesen Tipprhythmus, Korrekturen und Verweildauer — KI-Analyse erkennt Anomaliemuster, die auf Legasthenie hinweisen, bevor die Lehrkraft sie bemerkt.
- Problem
- Lehrkräfte übersehen Augenbewegungsanomalien und Lesekadenzstörungen bei Erstklässlern, die auf Legasthenie hinweisen. Diagnose kommt oft erst in Klasse 3–4 — wertvolle Frühförderzeit geht verloren.
- KI-Lösung
- KI-Analyse von Tablet-Interaktionsdaten: Tippverzögerungen, Rücklöschrate, Silbenverweildauer und Fehlercluster werden zu einem Risikoscore verdichtet, der Lehrkräften gezielte Beobachtungshinweise gibt.
- Typischer Nutzen
- Frühdiagnose in Klasse 1 statt Klasse 3–4. Lehrkräfte erhalten konkrete Beobachtungshinweise für 2–3 Schülerinnen pro Klasse statt Blindsuche. Fördermaßnahmen greifen früher.
- Setup-Zeit
- Kein Plug-and-play: Datenbasis, EU AI Act, Psychologen-Einbindung nötig
- Kosteneinschätzung
- Förderkosten sinken durch frühere Intervention — schwer monetarisierbar
Es ist Donnerstag, zweite Stunde. Grundschullehrerin Monika Sternberg hält einen Stapel Leseübungszettel in der Hand und beobachtet ihre 2b. Lena, sieben Jahre, liest wieder laut vor — zögernd, silbenweise, die Lippen leicht hinter dem Finger verborgen. Die anderen Kinder werden unruhig.
Monika Sternberg macht sich eine mentale Notiz: „Lena nochmal einzeln hören.” Die Notiz verschwindet in den nächsten drei Unterrichtsblöcken, einem Elterngespräch am Mittag und dem Protokoll der Schulkonferenz.
In Klasse 3 meldet Lenas Mutter sich schließlich beim Schulpsychologischen Dienst an. Die Diagnose: Legasthenie, ausgeprägte phonologische Verarbeitungsschwäche. Hätte man das früher sehen können? Sehr wahrscheinlich ja. Aber die Signale — unregelmäßige Lesetakts, wiederholte Silbenrücksprünge, auffällig lange Suchpausen — sind für das menschliche Auge in einer Klasse mit 26 Kindern kaum zuverlässig zu erfassen.
Das ist kein Versagen von Monika Sternberg. Das ist ein Strukturproblem, das sich in jeder zweiten Grundschule wiederholt.
Das echte Ausmaß des Problems
In Deutschland sind nach Schätzung des Bundesverbands Legasthenie und Dyskalkulie (BVL) zwischen 3 und 10 Prozent aller Schülerinnen betroffen — je nach Diagnosekriterium. Die KIGGS-Studie des Robert Koch-Instituts beziffert die Rate auf 5 bis 10 Prozent. Das bedeutet: In jeder Grundschulklasse sitzen statistisch ein bis drei Kinder, die eine klinisch relevante Lese-Rechtschreib-Störung haben oder entwickeln werden.
Die eigentliche Tragweite des Problems liegt nicht in der Häufigkeit, sondern im Timing. Der typische Diagnosezeitpunkt in Deutschland liegt laut BVL bei Ende Klasse 2 bis Mitte Klasse 4 — oft später. Das Problem: Neurowissenschaftlich ist die Leseentwicklung in der frühen Grundschulzeit hochplastisch. Je früher eine Förderung greift, desto geringer der Rückstand, den ein Kind aufholen muss. Jedes verpasste Semester kostet Entwicklungspotenzial, das sich später nicht vollständig zurückgewinnen lässt.
Was hält Diagnosen zurück?
- Klassengröße: Mit 25–30 Schülerinnen kann keine Lehrkraft individuelle Lesemuster systematisch beobachten. Signale, die einen Schulpsychologen sofort aufhorchen lassen würden, gehen unter.
- Diagnostische Schwelle: Lehrkräfte sind keine Diagnostikerinnen. Sie erkennen, wenn ein Kind „langsam liest” — aber nicht, ob das auf mangelnde Übung, Konzentrationsschwäche, Hörprobleme oder eine phonologische Verarbeitungsschwäche zurückgeht.
- Kapazitäten im Schulpsychologischen Dienst: In vielen Bundesländern warten Familien nach Überweisung drei bis sechs Monate auf einen Termin. Wer früh überweisen will, braucht einen fundierten Verdacht — nicht nur ein diffuses Bauchgefühl.
- Unterschätzte Kompensationsstrategien: Intelligente Kinder mit Legasthenie lernen früh, sich zu verbergen. Sie entwickeln Merkstrategien, vermeiden lautes Vorlesen, kompensieren im Unterricht so gut, dass der Rückstand erst in der 3. oder 4. Klasse messbar wird — wenn die Textanforderungen komplexer werden.
Die Folgen verzögerter Diagnose sind gut dokumentiert: Kinder mit nicht erkannter Legasthenie entwickeln häufiger Schulangst, sekundäre Leistungstiefs und ein dauerhaft negatives Selbstbild als Lernende — unabhängig von ihrer allgemeinen Intelligenz.
Mit vs. ohne KI — ein ehrlicher Vergleich
| Aspekt | Ohne KI-Unterstützung | Mit KI-gestütztem Screening |
|---|---|---|
| Zeitpunkt erster Hinweis | Ende Kl. 2 – Mitte Kl. 4 | Früh Kl. 1 – Ende Kl. 1 möglich |
| Grundlage für Überweisung | Lehrkraft-Bauchgefühl, Zeugnisnoten | Strukturierter Risikoscore mit Interaktionsdaten |
| Schülerinnen mit konkretem Hinweis | 0–1 pro Klasse (zufällig) | 2–4 mit priorisierten Beobachtungshinweisen |
| Falsch-negativ-Quote | Hoch bei Kompensationsstrategien | Niedriger, aber nicht null |
| Aufwand Lehrkraft für Screening | 2–4 Stunden manuelle Beobachtung | 20–30 Min. Aufgabe abhalten, KI wertet aus |
| Diagnose | Immer durch Schulpsychologin | Immer durch Schulpsychologin |
Wichtig: Die letzte Zeile ist nicht optional. KI-Screening ersetzt keine psychologische Diagnose. Was es leistet, ist die Priorisierung — welche Kinder vordringlich vom Schulpsychologischen Dienst gesehen werden sollten.
Einschätzung auf einen Blick
Zeitersparnis — niedrig (2/5) Das System spart Diagnostikgespräche und reduziert den blinden Beobachtungsaufwand. Aber es spart keine Unterrichtsstunden: Lehrkräfte führen weiterhin Fördereinheiten durch, begleiten Screenings und koordinieren mit dem Schulpsychologischen Dienst. Verglichen mit Anwendungsfällen wie der Unterrichtsplanung oder der automatisierten Lernstandsanalyse, die direkte Stundenersparnis beim Materialbau liefern, ist der Zeitgewinn hier gering und indirekt.
Kosteneinsparung — niedrig (2/5) Die eigentliche ökonomische Logik ist eine gesellschaftliche, keine schulische: Frühe Förderung reduziert Nachhilfekosten, sonderpädagogischen Förderbedarf und langfristig Schulabbrüche. Für das Schulbudget selbst fällt das aber kaum direkt ins Gewicht. Lizenzkosten für Screening-Software und der Aufwand für die psychologische Abklärung entstehen sogar zusätzlich. In dieser Kategorie gehört dieser Anwendungsfall zu den schwächsten im Bildungsbereich.
Schnelle Umsetzung — sehr niedrig (1/5) Das ist der härteste Score im Profil — und er ist gerechtfertigt. Es gibt heute keinen deutschen Plug-and-play-Dienst, der KI-gestütztes Legasthenie-Screening nach Schulstandard liefert. eKidz.AI ist der am weitesten entwickelte deutsche Ansatz (BMBF-gefördert, Fraunhofer IDMT), aber keine fertige Diagnoselösung. Dazu kommt: Ab August 2026 gilt der EU AI Act vollumfänglich — Systeme zur Bewertung von Lernergebnissen sind Hochrisiko-KI nach Anhang III und erfordern Konformitätsbewertungen, Protokollpflichten und menschliche Aufsicht. Wer heute startet, plant für 2026.
ROI-Sicherheit — mittel (3/5) Die Bildungswirkung früher Förderung ist wissenschaftlich gut belegt — das macht diesen Score möglich. Aber die Kausalitätskette „KI-Hinweis → Frühüberweisung → bessere Bildungsoutcomes” ist schwer sauber zu messen. Schulen, die messen wollen, müssen Längsschnittdaten über mehrere Schuljahre aufbauen. Das ist machbar, aber langsam.
Skalierbarkeit — sehr hoch (5/5) Das ist der stärkste Aspekt dieses Anwendungsfalls. Ein validiertes Screeningmodell auf Tablet-Interaktionsdaten skaliert auf prinzipiell unbegrenzt viele Schulen und Klassen — ohne proportional steigenden Aufwand. Einmal implementiert, läuft das Screening im Hintergrund jeder Leseübung. Der höchste Score im Bildungs-Branch ist hier gerechtfertigt.
Richtwerte — stark abhängig von Bundesland, vorhandener Tablet-Infrastruktur und Einbindung des Schulpsychologischen Dienstes.
Was das KI-System konkret macht
Das Grundprinzip: Tablets, die Kinder beim Lesen und Schreiben nutzen, erzeugen implizit eine große Menge diagnostisch relevanter Verhaltensdaten. Diese Daten entstehen ohne zusätzlichen Aufwand für Lehrkraft oder Kind — sie sind ein Nebenprodukt des normalen Unterrichtsbetriebs.
Was die KI analysiert, wenn ein Kind auf einem Tablet eine Leseaufgabe bearbeitet:
- Silbenverweildauer: Wie lange hält das Kind inne, bevor es den nächsten Buchstaben oder die nächste Silbe eingibt? Kinder mit phonologischer Verarbeitungsschwäche zeigen charakteristische Pause-Muster.
- Rücklösch- und Korrekturrate: Wie oft löscht das Kind zurück — und an welchen Buchstabenfolgen häufen sich die Korrekturen? Bestimmte Buchstabenpaare (b/d, p/q) sind diagnostisch besonders aussagekräftig.
- Fehlercluster: Welche Buchstaben oder Silbenmuster werden systematisch verwechselt? Zufällige Fehler unterscheiden sich statistisch von systematischen Mustern.
- Lesegeschwindigkeitsvarianz: Gleichmäßig langsames Lesen ist anders zu interpretieren als abwechselnd flüssiges und stockendes Lesen in vorhersagbaren Mustern.
- Aufgabenabbruchmuster: Wann bricht das Kind eine Aufgabe ab oder wechselt die Strategie?
Ein Machine Learning-Modell (typischerweise Random Forest oder LSTM-Netz) wurde mit Daten von Kindern trainiert, bei denen der Diagnose-Goldstandard — ein vollständiges schulpsychologisches Gutachten — vorlag. Es lernt, welche Kombination dieser Signale mit späterer Legasthenie-Diagnose korreliert.
Das Ergebnis ist kein Diagnosebescheid, sondern ein Risikoscore: Welche drei Kinder in dieser Klasse weisen das ungewöhnlichste Muster auf? Die Lehrkraft erhält eine priorisierte Liste mit konkreten Beobachtungshinweisen — keine Diagnose, keine Etikettierung, nur eine Entscheidungshilfe.
Das Fraunhofer IDMT hat in seinem “LeseKind”-Projekt (BMBF-gefördert, 2021–2024, Partnerschaft mit Universität Regensburg) einen komplementären Ansatz entwickelt: automatische Spracherkennung beim lauten Vorlesen. Das Kind liest einen Text vor, die KI analysiert Lesegenauigkeit und Lesegeschwindigkeit auf Phonem-Ebene und stuft das Kind in eine von 13 Lesestufen ein. Das ist kein Legasthenie-Screening im klinischen Sinne, aber ein kontinuierliches Lernfortschritts-Monitoring, das Auffälligkeiten früh sichtbar macht.
Einordnung: Screening ≠ Diagnose
Das ist der wichtigste Abschnitt auf dieser Seite, weil hier die häufigsten Missverständnisse entstehen.
Ein KI-Screening ist kein diagnostisches Gutachten. Es ist ein Sieb, kein Mikroskop. Es kann mit guter Wahrscheinlichkeit sagen: „Dieses Kind zeigt Muster, die klinisch abgeklärt werden sollten.” Es kann nicht sagen: „Dieses Kind hat Legasthenie.”
Die Bedeutung dieser Unterscheidung ist rechtlich, pädagogisch und ethisch:
- Rechtlich: Der Nachteilsausgleich (verlängerte Prüfungszeit, Vorlesen von Aufgaben, Befreiung vom Diktat) setzt in fast allen Bundesländern eine formale Diagnose durch den Schulpsychologischen Dienst oder eine niedergelassene Psychologin voraus. Ein KI-Score genügt dafür nicht.
- Pädagogisch: Die Entscheidung, ein Kind in ein schulpsychologisches Verfahren zu verweisen, ist eine professionelle Einschätzung der Lehrkraft — der KI-Score ist Informationsgrundlage, nicht Auslöser.
- Ethisch: Falsch positive Ergebnisse können Kinder stigmatisieren. Falsch negative Ergebnisse geben Eltern und Lehrkräften trügerische Sicherheit. Beides hat Konsequenzen — deshalb ist die menschliche Einschätzung nicht optional.
Das bedeutet im Schulbetrieb: Das KI-System sollte als eines von mehreren Beobachtungsinstrumenten eingeführt werden — nicht als alleinige Entscheidungsgrundlage. Die Lehrkraft beobachtet weiterhin. Die Eltern werden informiert. Der Schulpsychologische Dienst bestätigt oder entkräftet.
Wie der Diagnoseprozess in Deutschland wirklich abläuft
Die KI kann den Blick schärfen — sie muss aber in einen funktionierenden Prozess eingebettet sein. Dieser Prozess sieht in Deutschland so aus:
Stufe 1 — Erstbeobachtung (Klasse 1, Kl. 2 Beginn): Lehrkraft bemerkt Lese-Schreib-Auffälligkeiten. Eingesetzte Instrumente: WLLP-R (Würzburger Leise-Leseprobe-Revision, Gruppenscreening, 5 Minuten Durchführungszeit, 154 € pro Klassensatz bei Hogrefe Testzentrale) oder SLS 2-9 (Salzburger Lesescreening). Diese Tests sind normiert und validiert, aber keine Diagnose.
Stufe 2 — Schulpsychologische Abklärung: Bei Verdacht: Überweisung an den Schulpsychologischen Dienst. Wartezeiten: je nach Bundesland 2–6 Monate. Das schulpsychologische Gutachten beinhaltet standardisierte Testbatterien (z. B. DERET, SLRT-II) und schließt andere Ursachen aus.
Stufe 3 — LRS-Erlass und Nachteilsausgleich: Jedes Bundesland hat eine eigene Regelung (LRS-Erlass). Die Bandbreite ist erheblich:
- Bayern: Schulpsychologisches Gutachten genügt für LRS-Feststellung und Nachteilsausgleich.
- Berlin: Grundschule — Klassenlehrkraft und LRS-Fachkraft; ab Klasse 7 Schulpsychologie.
- NRW: Förderkonzept der Schule muss nachgewiesen werden; kein automatischer Nachteilsausgleich bei LRS (nur bei anerkannter Behinderung nach § 2 SGB IX).
- Hessen, BW, Niedersachsen, Hamburg: Unterschiedliche Kombinationen aus schulpsychologischem Gutachten, Förderplänen und Lehrereinschätzung.
Die Heterogenität bedeutet: Was in Bayern ausreicht, gilt in NRW möglicherweise nicht. Schulen, die KI-Screening einführen wollen, müssen das im Kontext des jeweiligen Landeserlasses verankern.
Stufe 4 — Fördermaßnahmen: Nachteilsausgleich (schultypisch: zeitliche Verlängerung, alternative Aufgabenformen), LRS-Förderung durch Fachlehrkraft, ggf. außerschulische Förderung (LOS, Lerninstitute).
Die KI sitzt in diesem Prozess zwischen Stufe 1 und Stufe 2 — sie kann den Weg zur schulpsychologischen Abklärung früher und gezielter auslösen.
Konkrete Werkzeuge — was heute realistisch ist
Der Markt ist jung. Es gibt keine fertige „Legasthenie-Diagnose-KI” für den deutschen Schulbetrieb, die man heute kaufen, installieren und einsetzen könnte. Was es gibt:
eKidz.AI — das am weitesten entwickelte deutsche Instrument Entstanden aus dem BMBF-geförderten Projekt LeseKind (Fraunhofer IDMT + Universität Regensburg, 2021–2024). Analysiert lautes Vorlesen über automatische Spracherkennung, stuft Kinder in 13 Lesestufen ein, verfolgt Lernfortschritte. Es ist kein Legasthenie-Screening im klinischen Sinne, aber ein kontinuierliches Monitoring, das Lehrkräfte auf Auffälligkeiten aufmerksam macht. Schullizenzen auf Anfrage; kostenloser App-Einstieg möglich.
Einschränkung: eKidz identifiziert Leseflüssigkeitsprobleme, nicht zwingend Legasthenie als spezifische neurologische Störung. Ein 7-jähriges Kind, das wegen mangelnder Übung schlecht liest, wird ähnlich eingestuft wie eines mit Legasthenie. Die pädagogische Einordnung liegt bei der Lehrkraft.
Validierte Paper-/Digital-Screenings (WLLP-R, SLS 2-9) Diese Tests sind keine KI-Tools, aber der anerkannte Standard für das Erstscreening. WLLP-R: 154 € Klassensatz, ca. 15 Minuten Durchführung, normiert für Klassen 1–4 (Hogrefe Testzentrale). SLS 2-9: ähnlich, andere Normpopulation. Beide eignen sich als Baseline für einen späteren Vergleich mit KI-Ergebnissen.
Für technisch versierte Schulen oder Träger: Custom ML auf Tablet-Interaktionsdaten Wenn eine Schule oder ein Schulträger bereits eine Lernplattform mit umfangreichem Interaktionslogging betreibt (z. B. Moodle mit Aktivitäts-Tracking), lassen sich auf diesen Daten ML-Modelle trainieren. Das erfordert Datenqualität über mindestens 1–2 Schuljahre, ein Modellentwicklungs-Projekt (Kosten: 15.000–40.000 € für ein erstes validiertes Modell mit schulpsychologischem Goldstandard) und die EU-AI-Act-Konformitätsbewertung für Hochrisiko-KI.
Was nicht empfohlen wird: Allgemeine LLM-Chatbots für Diagnosehinweise ChatGPT oder Claude sind keine Diagnoseinstrumente. Sie können Lehrkräften bei der Vorbereitung von Beobachtungsbögen helfen oder Informationsmaterial für Elterngespräche aufbereiten — aber keine strukturierten Risikobewertungen auf Basis von Schülerinteraktionsdaten liefern.
Zusammenfassung: Wann welcher Ansatz
- Schule ohne Tablet-Infrastruktur → Erst WLLP-R einführen, digitale Schritte danach
- Schule mit Tablets, laufende Leseübungen → eKidz.AI als Monitoring-Tool
- Schulträger mit IT-Kapazität und mehrjährigem Zeithorizont → Custom ML auf Interaktionsdaten
- Jede Schule → Schulpsychologischen Dienst einbinden, kein KI-Score ohne Rückkopplung
Wenn KI irrt: Was Falschklassifikationen für Kinder bedeuten
Das ist der Abschnitt, den andere Use-Case-Beschreibungen weglassen. Hier steht er trotzdem.
Falsch positiv: Das Modell stuft ein Kind als hochrisikoverdächtig ein, das keine Legasthenie hat. Was passiert?
Im besten Fall: Die Lehrkraft beobachtet intensiver, überweist zum Schulpsychologischen Dienst, der das Kind testet und entlastet. Aufwand für Familie und Kind, aber keine bleibende Wirkung.
Im ungünstigsten Fall: Die Lehrkraft (oder die Eltern) interpretieren den KI-Score als Befund, nicht als Hinweis. Das Kind bekommt das Label „Legasthenie-Risikokind” — mit allen Folgen: Absenkung der Erwartungen durch Lehrkräfte, möglicherweise Stigmatisierung in der Klasse, Selbstbild als „schlechter Leser”. Eine PMC-Studie (2023) zur Stigmatisierung bei Lernschwächen zeigt: Kinder, die das Label einer Lernstörung erhalten, werden von Lehrkräften messbar niedrigschwelliger bewertet — auch wenn die Diagnose falsch war.
Falsch negativ: Das Modell stuft ein Kind als unauffällig ein, das tatsächlich Legasthenie hat.
Das ist möglicherweise gefährlicher als der falsch positive Fall — weil es eine trügerische Sicherheit erzeugt. „Das System hat nichts gefunden” kann Lehrkräfte und Eltern dazu bringen, ein ohnehin diffuses Bauchgefühl zu unterdrücken. Das verzögert die Diagnose weiter, statt sie zu beschleunigen.
Wie groß ist das Risiko? Ehrliche Zahlen: Eine validierte Web-basierte Screeninglösung in Deutsch erreichte in einer Studie (Frontiers in Computer Science, 2021) eine Genauigkeit von 0,74 — das bedeutet, bei 100 Kindern werden statistisch 26 falsch klassifiziert. Bei Ansätzen wie Eye-Tracking (89–97 %) oder Speech-Recognition (Fraunhofer IDMT) ist die Genauigkeit besser, aber immer noch nicht perfekt.
Das ist kein Argument gegen KI-Screening — es ist ein Argument für klare Prozesse, in denen KI-Scores konsequent als Hinweise (nicht als Diagnosen) behandelt werden.
Datenschutz, Datenhaltung und EU AI Act
Dieser Anwendungsfall hat drei überlagerte rechtliche Dimensionen.
1. DSGVO und Kinderdaten
Schülerinnen sind Minderjährige. Ihre Interaktionsdaten — Tippverzögerungen, Fehlercluster, Lesegeschwindigkeit — sind als personenbezogene Daten nach DSGVO Art. 4 zu behandeln. Bei Gesundheitsbezug (Hinweis auf mögliche Behinderung oder Erkrankung) handelt es sich um besondere Kategorien nach Art. 9 DSGVO, für die ein erhöhtes Schutzniveau gilt.
Praktische Konsequenzen:
- Auftragsverarbeitungsvertrag (AVV) nach Art. 28 DSGVO mit dem Softwareanbieter ist Pflicht
- Eltern müssen über das Screening informiert werden — Einwilligung ist je nach Bundesland und Ausgestaltung des Verfahrens (gesetzliche Aufgabe oder freiwillig) unterschiedlich geregelt
- Daten dürfen nicht ohne Rechtsgrundlage an Dritte weitergegeben werden — kein Export zu US-Servern ohne Standardvertragsklauseln
- Datensparsamkeit: Welche Daten werden wie lange gespeichert? Wer hat Zugriff — nur Lehrkraft, oder auch Schulverwaltung, Schulträger, Datenanbieter?
2. EU AI Act — Hochrisiko-Einstufung
Das ist die rechtlich kritischste Dimension. Der EU AI Act (Anhang III, Nr. 3) klassifiziert KI-Systeme, die „Lernergebnisse oder den Zugang zu Bildungseinrichtungen bestimmen oder wesentlich beeinflussen”, als Hochrisiko-KI. Ein System, das Lernfortschritte bewertet und Förderempfehlungen ableitet, fällt unter diese Kategorie.
Was das bedeutet (vollständig gültig ab August 2026):
- Konformitätsbewertung durch Anbieter oder Drittstelle
- Dokumentation des Trainingsdatensatzes und der Modellarchitektur
- Protokollierungspflichten (wann wurde das System eingesetzt, welche Outputs wurden erzeugt)
- Menschliche Aufsicht: Es muss eine nachweisbare menschliche Entscheidung über jeden Screeningbefund geben — automatische Weiterleitung an den Schulpsychologischen Dienst ist nicht zulässig
- Recht auf Erklärung: Betroffene (Eltern) haben das Recht zu erfahren, wie das System zu einem Score gekommen ist
Wer heute plant, muss diesen Rahmen mitdenken. Schulträger, die ein eigenes ML-System entwickeln wollen, brauchen ab 2026 eine vollständige Dokumentation für die Hochrisiko-KI-Konformitätsbewertung.
3. Schulrecht und Elterneinwilligung
Datenschutzrechtliche Einwilligung und schulrechtliche Befugnis sind zwei verschiedene Dinge. Viele Bundesländer haben spezifische Regelungen, welche Daten Schulen über Schülerinnen erheben und verarbeiten dürfen. Schulpsychologische Daten sind in der Regel besonders geschützt. Für den KI-Einsatz in der Diagnostik empfiehlt sich eine frühzeitige Abstimmung mit dem Landesbeauftragten für Datenschutz und der Schulbehörde — bevor das Produkt eingeführt wird.
Was es kostet — realistisch gerechnet
Die Kostenfrage ist bei diesem Anwendungsfall aus Schulperspektive komplex, weil Kosten auf verschiedenen Ebenen anfallen.
Variante A: Validierte Paper-Screening-Tests als Baseline (heute, sofort)
- WLLP-R-Klassensatz: 154 € (einmalig, Hogrefe Testzentrale)
- SLS 2-9: vergleichbar
- Kein IT-Aufwand, keine DSGVO-Komplexität, sofort einsetzbar
- Einschränkung: Keine KI, keine kontinuierliche Überwachung, Auswertung durch Lehrkraft (30–45 Min. pro Klasse)
Variante B: eKidz.AI oder ähnliche Plattform
- App-Einstieg kostenlos (eingeschränkter Funktionsumfang)
- Schullizenz: Preis nicht öffentlich, Kontakt mit Anbieter nötig
- Zusatzkosten: AVV-Prüfung durch Datenschutzbeauftragten (~1–3 h), IT-Einrichtung auf Schulgeräten
- Nicht einmalig: laufende Lizenzkosten + laufender Pflegeaufwand
Variante C: Custom ML auf eigenen Schuldaten
- Aufbauzeit Datenbasis: 1–2 Schuljahre
- Modellentwicklung (externe Agentur): 15.000–40.000 € für erstes validiertes Modell
- Schulpsychologischer Goldstandard für Training: Koordinationsaufwand mit mehreren Schulen
- EU AI Act Konformitätsbewertung: 5.000–15.000 € (je nach Einrichtungsgröße und Aufwand)
- Laufende Pflege und Retraining: 3.000–8.000 € p.a.
- Realistisch für: Schulträger mit mehreren hundert Schülerinnen und IT-Abteilung
Was du dagegenrechnen kannst: Ein Kind, das ein Jahr früher diagnostiziert und gefördert wird, vermeidet typischerweise 50–100 Stunden zusätzlichen Förderunterrichts, den es ohne Frühförderung bräuchte. Bei 2–3 Schülerinnen pro Klasse, die früher erkannt werden, ergeben sich (bei angenommenen Förderkosten von 40–80 €/Stunde) hypothetische Einsparungen von 4.000–24.000 € pro Klasse über die Schulkarriere. Diese Zahl ist theoretisch und hängt von vielen Annahmen ab — aber sie macht deutlich, dass die Investition auf gesellschaftlicher Ebene klar positiv ist.
Drei typische Einstiegsfehler
1. Das Screening läuft ohne Einbindung des Schulpsychologischen Dienstes. Der häufigste Fehler, und der folgenreichste. Wenn eine Schule KI-Screening einführt, ohne vorab zu klären, wie der Schulpsychologische Dienst mit den Ergebnissen umgeht, entsteht ein Informationsstau. Die Lehrkraft bekommt Scores, die sie nicht einordnen kann. Eltern werden beunruhigt, ohne dass eine Abklärung folgt. Der Schulpsychologische Dienst ist nicht informiert und kann Überweisungen nicht einordnen. Lösung: Vorab ein Prozessdesign mit dem Schulpsychologischen Dienst und der Schulleitung entwickeln — bevor das erste Kind gescreent wird.
2. Das Modell wird auf internationalen oder englischsprachigen Daten trainiert und für Deutsche eingesetzt. Phonologische Muster im Deutschen unterscheiden sich erheblich von denen im Englischen oder Spanischen. Ein Modell, das auf englischen Lernenden trainiert wurde, hat im Deutschen nachweislich schlechtere Ergebnisse (Frontiers in Computer Science, 2021: 74 % Genauigkeit für Deutsch vs. 69 % für Spanisch — beide signifikant schlechter als Englisch). Wer ein zuverlässiges System für deutsche Kinder will, braucht deutschsprachige Trainingsdaten mit schulpsychologischem Goldstandard.
3. KI-Score wird an Eltern kommuniziert, ohne Kontextualisierung. „Ihr Kind hat einen erhöhten Legasthenie-Risikoscore” — dieser Satz ohne Kontext verursacht Panik, Misstrauen gegenüber der Schule und manchmal den sofortigen Wunsch, eine teure private Diagnose zu beauftragen. Lösung: KI-Scores sind Arbeitsmittel für Lehrkräfte und Schulpsychologinnen — keine Kommunikationsinstrumente für Eltern. Elterngespräche führen Lehrkräfte auf Basis ihrer Gesamtbeobachtung, nicht auf Basis eines Algorithmus-Outputs.
Maintenance-Fehler: Modell veraltet, Normen verschieben sich. Lesekompetenz-Normen in der deutschen Grundschule verschieben sich über die Jahre. Ein Modell, das 2024 auf Erstklässlern des Jahrgangs 2017/18 trainiert wurde, könnte für Kinder des Jahrgangs 2027/28 systematisch falsch kalibriert sein — veränderte Vorschulerfahrungen, andere Tablet-Nutzungsgewohnheiten, andere Unterrichtsmethoden. Modelle brauchen regelmäßige Revalidierung an aktuellen Stichproben.
Was mit der Einführung wirklich passiert — und was nicht
Der technische Teil ist der einfachste. Der pädagogisch-organisatorische Teil ist, wo die meisten Projekte scheitern.
Was Lehrkräfte erleben: Das Screening läuft, Scores kommen. Und dann? Lehrkräfte sind keine Datenwissenschaftlerinnen. Ein Risikoscore ohne klares Handlungsprotokoll führt zu Überforderung oder — schlimmer — zu Ignoranz. „Das System hat da etwas geflagged, aber ich weiß nicht, was ich damit mache.”
Was Eltern erleben: Eltern merken, dass ihre Kinder getrackt werden — nicht immer wurde vorher klar kommuniziert, was das bedeutet. Einige werden besorgt, einige werden aktiv widerständig. Widerstand wächst, wenn das Gefühl entsteht, das System „stempelt” Kinder.
Was der Schulpsychologische Dienst erlebt: Plötzlich kommen mehr Überweisungsanfragen. Wenn das Kapazitätsproblem nicht vorab adressiert wurde, führt das zu längeren Wartezeiten statt kürzeren — das Gegenteil des intendierten Effekts.
Was konkret hilft:
- Elternabend vor Einführung: Was wird gemessen, was passiert mit den Daten, wer sieht was, was ist kein Diagnosebefund?
- Protokoll für Lehrkräfte: Was sind die nächsten Schritte bei einem erhöhten Score? (Intensivere Beobachtung für X Wochen → wenn bestätigt: Gespräch mit Schulleitung → dann Überweisung)
- Kapazitätsklärung mit Schulpsychologischem Dienst vorab: Wie viele Kinder können pro Quartal abgeklärt werden?
- Lehrer-Fortbildung: Was ist Legasthenie, was sagt ein KI-Score aus — und was nicht?
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Konzept und Abstimmung | Monat 1–2 | Prozessdesign mit Schulleitung, Schulpsychologischem Dienst, Datenschutzbeauftragtem; Bundesland-Erlass prüfen | Schulpsychologischer Dienst hat keine Kapazität — Projekt ohne Partner nicht sinnvoll |
| DSGVO und EU AI Act Prüfung | Monat 2–3 | AVV mit Anbieter abschließen, Hochrisiko-Einstufung nach Anhang III prüfen, Elterninformation vorbereiten | Anbieter liefert keine verwertbare Konformitätsdokumentation — Anbieterwechsel oder Projektpause |
| Pilotklasse | Monat 3–6 | Screening läuft in einer Pilotklasse; Lehrkraft beobachtet parallel klassisch; Übereinstimmung zwischen KI-Score und Lehrkrafteinschätzung wird dokumentiert | Zu wenige Kinder im Pilot für statistisch valide Aussage über Modellqualität |
| Datenbasis aufbauen | Semester 1–2 | Interaktionsdaten sammeln; Überweisungen und schulpsychologische Gutachten werden als Goldstandard dokumentiert | Goldstandard-Daten fehlen oder sind nicht systematisch erfasst — Modell nicht trainierbar |
| Modellvalidierung | Ab Schuljahr 2 | ML-Modell auf Grundlage eigener Daten oder Anbietermodell für eigene Population anpassen | Modell zu konservativ (zu viele False Negatives) oder zu aggressiv (überflutet Schulpsychologen) |
| Schulweiter Rollout | Ab Schuljahr 3 | Alle Klassen, systematisches Monitoring, jährliche Revalidierung planen | Fachkraft, die das System betreut, verlässt die Schule — kein Nachfolger benannt |
Häufige Einwände — und was dahintersteckt
„Das ist doch Überwachung von Kindern.” Dieser Einwand kommt häufig — und er verdient eine ehrliche Antwort, keine Abwiegelung. Ja: Das System erfasst Verhaltensdaten von Minderjährigen im Schulbetrieb. Der Unterschied zur klassischen Überwachung liegt im Zweck (Förderung, nicht Kontrolle), in der Datensparsamkeit (nur die für Screening notwendigen Merkmale) und in der Transparenz (Eltern werden informiert). Schulen erheben seit Jahrzehnten Leistungsdaten über Schülerinnen — das ist keine neue Praxis. Was neu ist: die Präzision und Automatisierung. Wer diesen Einwand wegdiskutiert, hat ihn nicht verstanden; wer einen klaren Prozess für Transparenz und Zweckbindung aufgebaut hat, kann ihn ehrlich beantworten.
„Die KI ist voreingenommen gegenüber bestimmten Kindern.” Das ist ein reales Risiko, kein hypothetisches. KI-Modelle für Lesediagnose zeigen in Studien schlechtere Genauigkeit bei Kindern mit nicht-deutschen Erstsprachen, bei Kindern aus sozioökonomisch benachteiligten Umfeldern und bei Kindern mit Hörproblemen. Ein Kind, das zwei- oder mehrsprachig aufwächst und auf Deutsch noch lernend ist, zeigt ähnliche Muster wie ein Kind mit Legasthenie — für ein Modell, das den Spracherwerbskontext nicht kennt. Lösung: Modelle für die eigene Schülerschaft validieren, demografische Verzerrungen aktiv messen, Screening-Ergebnisse niemals ohne Kontext interpretieren.
„Dafür brauchen wir eine IT-Abteilung, die wir nicht haben.” Für eine Custom-ML-Lösung: Ja. Für eKidz.AI: Nein — die App läuft auf Tablets, die Lehrkraft installiert sie selbst. Wer klein anfängt (eine Klasse, ein Semester, eKidz.AI als Monitoring-Tool), braucht keinen IT-Spezialisten. Wer eine schulträgerweite Lösung mit eigenem Modell will, braucht professionelle Unterstützung — das ist kein KI-Problem, das ist ein IT-Projektproblem.
Woran du merkst, dass das zu dir passt
Wann es passt:
- Deine Schule arbeitet bereits mit Tablets im Erstleseunterricht und ihr erfasst schon Interaktionsdaten
- Ihr habt eine funktionierende Zusammenarbeit mit dem Schulpsychologischen Dienst — und dieser ist bereit, das Verfahren einzubeziehen
- Ihr könnt Eltern die Erhebung transparent erklären und habt DSGVO-Kompetenz im Schulträger (eigener Datenschutzbeauftragter)
- Ihr habt einen langen Zeithorizont: Ihr plant für Schuljahr 3–4, nicht für nächsten Monat
- Ihr seid Teil eines Schulverbunds oder Schulträgers, der Daten aus mehreren Schulen aggregieren kann — Einzelschule allein hat zu wenig Fälle für statistisch valides Modell
Wann es sich noch nicht lohnt — drei harte Ausschlusskriterien:
-
Ihr habt keine ausreichende Tablet-Infrastruktur (mindestens ein Gerät pro Kind für reguläre Leseübungen). Kein Hardware = keine Interaktionsdaten = kein Screening. Bevor hier investiert wird, kommt die Infrastruktur.
-
Ihr erwartet ein fertiges, sofort einsetzbares Diagnosesystem. Das gibt es heute für den deutschen Markt nicht. Wer ein abgeschlossenes Produkt kaufen und einsetzen will, wird enttäuscht. Was es gibt: einen BMBF-geförderten Monitoring-Ansatz (eKidz.AI), der Lernfortschritte misst und Auffälligkeiten signalisiert — aber kein vollständiges Screening-Paket nach Schulstandard.
-
Der Schulpsychologische Dienst kann oder will keine zusätzlichen Überweisungen verarbeiten. Wenn das Nadelöhr der Schulpsychologische Dienst ist — wie in vielen deutschen Regionen — hilft ein besseres Screening-Tool wenig, weil die Abklärungskapazität das Bottleneck ist. In diesem Fall sind politische Forderungen nach mehr schulpsychologischen Kapazitäten sinnvoller als technologische Investitionen.
Das kannst du heute noch tun
Der sinnvollste erste Schritt kostet nichts und braucht keinen Computer: Führe ein strukturiertes Beobachtungsgespräch mit der Schulpsychologin oder dem Schulpsychologischen Dienst in deiner Region. Frag konkret: Welche Signale nehmt ihr in Überweisungen als besonders aussagekräftig wahr? Bei welchen Kindern hättet ihr euch eine frühere Überweisung gewünscht?
Dieser Schritt kostet eine Stunde — und gibt dir mehr Klarheit über den Handlungsbedarf als jede Software-Demo.
Wenn du darüber hinaus die KI-gestützte Perspektive erkunden willst: Lade die eKidz.AI-App herunter und führe einen Testlauf mit einigen Kindern durch. Du wirst sofort sehen, wie die Lesestufen-Einstufung funktioniert und was das System ausgibt.
Für Lehrkräfte, die verstehen wollen, welche Verhaltensmerkmale auf Legasthenie hindeuten, und wie man diese Beobachtung als Grundlage für ein strukturiertes Gespräch mit Eltern nutzt — hier ist ein Prompt, der dabei hilft:
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- Prävalenz Legasthenie in Deutschland: Bundesverband Legasthenie und Dyskalkulie (BVL), „Aktueller Wissensstand Legasthenie” (Stand: 2025); KiGGS-Studie des Robert Koch-Instituts. Prävalenzangaben variieren stark nach Diagnosemethode (1,9–15,6 % je nach Kriterium; BVL geht von 3–10 % aus).
- Fraunhofer IDMT/eKidz.eu „LeseKind”: Pressemitteilung Fraunhofer IDMT, Oktober 2024, idmt.fraunhofer.de. BMBF-gefördertes Projekt (2021–2024), Partner: Universität Regensburg, Hochschule Flensburg, eKidz.eu (München). Automatische Spracherkennung für Leseflüssigkeitsbewertung, 12 KI-Tests, 13 Lesestufen.
- PMC Review KI-Diagnosemethoden: Kaur et al. (2024), „A Review of Artificial Intelligence-Based Dyslexia Detection Techniques”, PMC 11545100. Analysegenauigkeiten nach Modalität: Eye-Tracking 89–97 %, EEG 79–99 %, Handschrift 77–98 %, Verhalten 84–99 %. Identifizierte Hauptprobleme: Black-Box-Modelle, kleine Datensätze, fehlende Generalisierbarkeit.
- Web-basiertes Screening Genauigkeit Deutsch: Rello & Ballesteros (2021), „A Universal Screening Tool for Dyslexia by a Web-Game and Machine Learning”, Frontiers in Computer Science. Genauigkeit 0,74 für Deutsch — deutlich unter Ansätzen mit eye-tracking oder speech analysis.
- Stigmatisierung bei Lernstörungen: PMC 10090527 (2023), systematisches Review: Kinder mit LD-Labels erhalten messbar niedrigere Erwartungshaltungen von Lehrkräften — auch bei falschen Diagnosen.
- University at Buffalo Handschrift-KI: Govindaraju et al. (2025), „AI-powered handwriting analysis for dyslexia detection”, University at Buffalo, Mai 2025. Noch in der Entwicklungsphase; Vergleich mit menschlichen Testerinnen als nächster Schritt.
- WLLP-R Klassensatz: Hogrefe Testzentrale, Stand Mai 2026, 154 €. testzentrale.de
- LRS-Erlass Bundesländer: BVL-Übersicht Nachteilsausgleich, bvl-legasthenie.de/schule/nachteilsausgleich.html
- EU AI Act Hochrisiko-Einstufung Bildung: Art. 6 Abs. 2 i.V.m. Anhang III Nr. 3 EU AI Act. KI-Systeme zur Bewertung von Lernergebnissen und Steuerung von Lernprozessen = Hochrisiko-KI; vollständig wirksam ab August 2026.
- Custom-ML-Kostenspanne: Erfahrungswerte aus Schul-KI-Projekten im deutschsprachigen Raum (2023–2025).
Du willst verstehen, ob deine Schule oder dein Schulträger die Voraussetzungen für einen strukturierten Piloten hat? Meld dich — wir klären gemeinsam, welcher Schritt als nächster realistisch ist.
Diesen Inhalt teilen:
Interesse an diesem Use Case?
Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.
Weitere Use Cases
KI-Tutoren für Lernende
KI-gestützte Tutorsysteme beantworten Fragen von Schülern und Studierenden rund um die Uhr, erklären Inhalte auf verschiedenen Niveaustufen und passen sich dem Lernstand an.
Mehr erfahrenUnterrichtsplanung und Materialerstellung mit KI
KI erstellt Unterrichtsentwürfe, Arbeitsblätter, Quiz-Fragen und Erklärvideokonzepte — Lehrkräfte verbringen weniger Zeit mit Vorbereitung und mehr Zeit mit Schülern.
Mehr erfahrenAufgaben und Tests mit KI erstellen
KI generiert Aufgaben, Klausurfragen und Quiz auf verschiedenen Schwierigkeitsniveaus — in Minuten, inklusive Musterlösung und Bewertungshinweisen.
Mehr erfahren