Bildung & Weiterbildung schreibenargumentationfeedback

KI-gestützte Schreib- und Argumentationskompetenzentwicklung

KI gibt Schülerinnen strukturiertes Feedback zu Texten, Argumentationsaufbau, sprachliche Präzision, Kohärenz, und ermöglicht iteratives Überarbeiten als Lernprozess statt einmaliger Abgabe.

⚡ Auf einen Blick

Problem: Schreiben lernt man durch Feedback und Überarbeitung, aber Lehrkräfte können nicht jedem Schüler jede Textstufe individuell rückmelden. Aufsätze werden einmal abgegeben, benotet und selten tiefgehend besprochen.
KI-Lösung: KI-gestütztes Schreib-Tool gibt nach jeder Textstufe formatives Feedback: Identifiziert schwache Argumente, schlägt Umformulierungen vor, zeigt Kohärenzbrüche auf, als Lernbegleitung im Schreibprozess.
Typischer Nutzen: Schreibkompetenz durch iteratives Überarbeiten messbar verbessern, Lehrkraft-Zeit auf inhaltliche Gesprächsebene fokussieren, Schere zwischen starken und schwachen Schreibenden reduzieren.
Setup-Zeit: Einstieg heute möglich: ein Rubrik-Prompt in fobizz oder Claude reicht
Kosteneinschätzung: Kein direkter Kostenvorteil, Wirkung ist Kompetenzaufbau, nicht Einsparung

LLM mit Schreibrubrik-Kontext und formativem Feedback-Modus, DSGVO-konform für Schulumgebungen.

Worum geht's?

Es ist Mittwochabend, 21:47 Uhr. Kai-Uwe Schwarz korrigiert den zwölften von fünfundzwanzig Aufsätzen seiner Klasse 11b an einer Stuttgarter Berufsschule. Thema: „Sollte das Deutschlandticket dauerhaft subventioniert werden?” Er markiert schwache Argumente, schreibt Randbemerkungen, erklärt, warum der Übergang von Argument zu Gegenargument ein Gedankensprung ist. Dreißig Minuten pro Text, fünfundzwanzig Texte, das sind zwölf Stunden Arbeit, verteilt auf drei Abende.

Freitagmittag gibt er die Aufsätze zurück. Die meisten Schülerinnen und Schüler schauen kurz auf die Note, nicken oder verziehen das Gesicht. Die dichten Randbemerkungen liest kaum jemand genau. Überarbeitungsphasen sind nicht vorgesehen, dafür fehlt die Zeit im Lehrplan. Das war’s. Der nächste Aufsatz kommt in sechs Wochen.

Was Kai-Uwe in diesen zwölf Stunden geleistet hat, ist pädagogisch wertvoll, aber es kommt zu spät und zu selten an. Schreiben lernt man durch Überarbeiten. Nicht durch Lesen einer Note.

Das Paradox steckt im System: Lehrkräfte investieren die meiste Schreibfeedback-Arbeit in abgegebene Texte, also dann, wenn der Lernprozess schon abgeschlossen ist. Was Schülerinnen und Schüler wirklich voranbringt, ist Feedback während des Schreibens, nach dem ersten Entwurf, vor der Abgabe. Genau dort fehlt die Zeit.

Für Unternehmen

Nicht nur lesen, umsetzen.

Wir entwickeln KI-Lösungen für genau deinen Anwendungsfall und begleiten dich bei der Einführung.

Für Unternehmen

Das echte Ausmaß des Problems

Argumentatives Schreiben gilt in der Didaktik als Schlüsselkompetenz, für Studium, Beruf und demokratische Teilhabe. Und trotzdem gibt es in deutschen Schulen strukturell zu wenig davon.

Nicht weil Lehrkräfte es nicht wollen. Sondern weil formatives Feedback auf Schreibprozesse enorm zeitaufwendig ist. Eine realistische Schätzung: Fünfundzwanzig Aufsätze mit je einer halben Stunde Korrekturzeit bedeuten zwölf Stunden Arbeit, jedes Mal. Bei wöchentlichem Unterrichtspensum und mehreren Klassen ist das nicht wiederholbar. Die Konsequenz: Aufsätze werden einmal abgegeben, einmal korrigiert, einmal zurückgegeben. Keine Überarbeitung. Keine zweite Chance.

Erschwerend kommt hinzu, was die Bildungsforschung schon lange zeigt: Einmaliges Feedback ohne Überarbeitungsphase hat kaum messbare Wirkung auf die Schreibkompetenz. Schreiben ist ein iterativer Prozess, wer nicht mehrfach überarbeitet, lernt nicht schreiben, sondern lernt, Aufsätze einzureichen.

Das Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik (IPN) hat in seinem DARIUS-Projekt (2021–2024) drei kontrollierte Studien durchgeführt, die genau das belegen: Automatisiertes formatives Feedback auf argumentative Texte, das Schülerinnen und Schüler zu Überarbeitungen auffordert, verbessert die Argumentationsqualität messbar, vorausgesetzt, das Feedback ist strukturspezifisch, nicht nur oberflächlich. Dr. Thorben Jansen, der das Projekt leitete, betonte dabei: Der Algorithmus lernt aus Tausenden von Beispielen, wie erfahrene Lehrkräfte Feedback geben, und kann dieses Feedback dann zeitnah, konsistent und in beliebiger Menge liefern.

Die Kehrseite ist ebenso dokumentiert: Eine großangelegte Auswertung von 655 Schulklassen mit mehr als 14.000 Schülerinnen und Schülern (ACM LAK-Konferenz 2025) zeigte, dass rund die Hälfte der Lernenden nach dem Erhalt von KI-Feedback keinen einzigen Buchstaben im Text veränderte. Das Feedback kam, und verpuffte. Das ist kein technisches Problem. Es ist ein didaktisches.

Mit vs. ohne KI, ein ehrlicher Vergleich

Kennzahl	Ohne KI	Mit KI-Feedback-Schleife
Feedback-Zeitpunkt	Nach Abgabe	Während des Schreibens (jeder Entwurf)
Überarbeitungszyklen pro Aufsatz	0–1	2–4 (strukturiert)
Lehrkraft-Zeit für Zwischen-Feedback	8–15 Std. pro Klassensatz	0 Std. (KI übernimmt)
Lehrkraft-Zeit für finales Feedback	8–15 Std.	8–15 Std. (bleibt)
Feedbacktiefe zwischen Entwürfen	Keine (keine Zeit)	Strukturiert nach Rubrik
Lerneffekt je Schreib-Einheit	Gering (einmalig)	Moderat bis deutlich (iterativ)
Skalierbarkeit auf viele Klassen	Nicht möglich	Beliebig skalierbar

Die Einsparung entsteht nicht beim finalen Feedback, das bleibt Lehrkraft-Arbeit. Eingespart werden die Zwischen-Feedback-Schleifen, die ohne KI schlicht nicht stattfinden, weil keine Zeit dafür ist.

Einschätzung auf einen Blick

Zeitersparnis, hoch (4/5) Die Einsparung ist real, aber sie liegt an einer ungewohnten Stelle: nicht beim finalen Korrekturlesen, sondern beim Zwischenfeedback. Lehrkräfte, die bisher zwischen Erstentwurf und Abgabe gar kein Feedback geben konnten, weil die Zeit fehlte, können das jetzt via fobizz oder Claude-Prompt delegieren. Das entspricht bis zu 80 Prozent der Feedback-Zeit bei mehreren Entwurfsphasen. Den Platz auf vier statt fünf begründet der verbleibende Koordinationsaufwand: Prompts einrichten, Schülerinnen anleiten, Ergebnisse sichten.

Kosteneinsparung, kaum vorhanden (1/5) Es gibt keine direkte Kosteneinsparung, Schreibkompetenz ist kein Prozess, den man billiger machen kann. Die Wirkung ist pädagogisch, nicht betriebswirtschaftlich. Wer diesen Anwendungsfall mit einem ROI in Euro begründen will, rechnet am falschen Maßstab. Die niedrigste Bewertung ist deshalb korrekt.

Schnelle Umsetzung, hoch (4/5) Ein Lehrender kann heute noch anfangen: ein fobizz-Konto oder ein Claude-Pro-Abo, ein eingerichteter Rubrik-Prompt, eine Klasse. Die erste Feedback-Schleife ist in einer Unterrichtsstunde möglich. Komplex wird es erst, wenn das System schulweit ausgerollt und mit konkreten Bewertungsrubric systematisiert werden soll, dann braucht es Abstimmung und etwas mehr Vorlauf. Den vollen Fünfer verhindert genau dieser Unterschied zwischen persönlichem Einstieg und institutionellem Rollout.

ROI-Sicherheit, mittel (3/5) Der Lerneffekt ist durch mehrere kontrollierte Studien belegt, aber er hängt stark davon ab, ob Schülerinnen und Schüler das Feedback aktiv aufnehmen, oder es passiv zur Kenntnis nehmen und den Text unverändert lassen. Textqualität lässt sich mit Rubrik-Bewertungen messen, aber der Langzeiteffekt auf Schreibkompetenz ist schwerer zu isolieren als zum Beispiel bei Prüfungsauswertung mit KI, wo Korrektheit klarer messbar ist.

Skalierbarkeit, maximal (5/5) Das ist die stärkste Achse dieses Anwendungsfalls: Ein eingerichteter Rubrik-Prompt skaliert von einer Klasse auf zwanzig Klassen, von zehn Schülerinnen auf zweihundert, ohne zusätzliche Kosten oder Aufwand. Eine Lehrkraft kann denselben Prompt in jeder Unterrichtseinheit einsetzen. Eine Schule kann denselben Ansatz schulweit ausrollen. Das ist strukturell anders als Feedback, das an Menschenzeit gebunden ist.

Richtwerte, stark abhängig von Schulform, Klassenstufe, gewähltem Tool und didaktischer Einbettung.

Was das System konkret macht

Kein KI-Tool schreibt Aufsätze. Das ist keine Selbstverständlichkeit, es muss explizit konfiguriert werden.

Was das System bei korrekter Einrichtung tut: Die Schülerin oder der Schüler schreibt einen Erstentwurf und gibt ihn (über die Lehrkraft oder direkt in ein DSGVO-konformes Tool wie fobizz) zur Analyse. Das System liest den Text gegen eine hinterlegte Argumentations-Rubrik:

These vorhanden? Ist eine klare Hauptbehauptung erkennbar?
Argumente belegt? Werden Behauptungen durch Fakten, Beispiele oder Quellen gestützt?
Gegenargument behandelt? Wird ein Einwand aufgegriffen und entkräftet?
Kohärenz? Folgen die Absätze einer logischen Abfolge?
Sprachliche Präzision? Werden Begriffe klar und konsistent verwendet?

Das System gibt dann strukturiertes Feedback, nicht als abschließende Benotung, sondern als Arbeitsprogramm für die nächste Überarbeitungsrunde: „Dein zweites Argument bleibt ohne Beleg. Welche Daten könntest du einfügen, um es zu stützen?” oder „Du springst in Absatz 3 vom Argument direkt zur Schlussfolgerung, das Gegenargument fehlt dazwischen.”

Technisch beruht das auf einem LLM (Claude, GPT-4 oder einem vergleichbaren Modell), das mit einem präzisen System-Prompt so eingestellt wurde, dass es ausschließlich formatives Feedback in definierten Kategorien gibt, und ausdrücklich keine fertigen Formulierungen liefert. Der Prompt ist der entscheidende Hebel: Ohne ihn gibt das System generische Lobeshymnen oder korrigiert oberflächlich Grammatik. Mit ihm analysiert es Argumentationsstruktur.

Oberflächenfeedback und Strukturfeedback, der entscheidende Unterschied

Das ist der Kern, den viele Einsteiger übersehen: Nicht jedes KI-Feedback zu Texten ist pädagogisch wertvoll.

Oberflächenfeedback betrifft Rechtschreibung, Grammatik und Interpunktion. Das kann LanguageTool zuverlässig und DSGVO-konform erledigen. Es ist nützlich, aber es entwickelt keine Argumentationskompetenz. Ein Schüler, der seinen Aufsatz grammatikalisch korrekt schreibt, aber keine These hat und Argumente ohne Belege aneinanderreiht, hat ein strukturell schwaches Stück Text.

Strukturfeedback geht tiefer: Trägt die These? Sind die Argumente in einer Hierarchie aufgebaut? Wird das Gegenargument nicht nur erwähnt, sondern entkräftet? Ist der Schluss aus den Argumenten logisch ableitbar? Das erfordert ein LLM mit klarem Kontext, und einen Prompt, der diese Kategorien explizit abfragt.

Forschungsbefunde aus dem Projekt DARIUS (Leibniz-IPN) sowie aus mehreren internationalen Studien (2023–2025) zeigen: Standardmäßig tendieren KI-Modelle zum Oberflächenfeedback. Sie kommentieren Satzlänge, Wortwiederholungen und Verbindungswörter, nicht die Qualität der Argumentation dahinter. Wer das System nicht bewusst auf Strukturfeedback ausrichtet, bekommt ein teures Grammatikprogramm.

Die Lösung: eine Argumentations-Rubrik, die als System-Prompt hinterlegt wird und dem Modell vorschreibt, was es bewerten soll und was nicht. Nur dann entsteht das Feedback, das Schreibkompetenz tatsächlich entwickelt.

Die Grenze zum Täuschungsversuch, wo die Linie liegt

Dieser Anwendungsfall lebt von einer klaren Grenze, die pädagogisch und rechtlich explizit gemacht werden muss.

KI als Lernbegleitung: Schülerinnen und Schüler erhalten Feedback auf ihre eigenen Texte. Sie überarbeiten selbst. Das ist didaktisch wertvoll und auch rechtlich unbedenklich, wenn es transparent und von der Lehrkraft geplant ist.

KI als Ghostwriter: Schülerinnen und Schüler geben dem Modell den Aufsatz-Prompt und reichen den generierten Text als eigene Arbeit ein. Das ist nach einem Urteil des Hamburger Verwaltungsgerichts (Dezember 2025) auch ohne explizites Schulverbot ein Täuschungsversuch, weil die Aufgabe implizit die eigene sprachliche Leistung verlangt.

Der Unterschied liegt nicht im Tool, sondern im Prozess: Wer Feedback erhält und überarbeitet, schreibt selbst. Wer das Ergebnis direkt übernimmt, täuscht.

Für Lehrkräfte bedeutet das praktisch: Den KI-Einsatz im Unterricht explizit thematisieren und dokumentieren, was erlaubt ist und was nicht. Nicht als Regelungsreflex, sondern weil Schülerinnen und Schüler diese Grenze kennen müssen, um sinnvoll mit dem Tool zu arbeiten. Wer weiß, dass Feedback zum Überarbeiten dient, und nicht zum Kopieren, nutzt es anders.

Eine gute Orientierung: Wenn der endgültige Text nach drei KI-Feedback-Schleifen immer noch erkennbar die eigene Sprache und die eigenen Ideen trägt, ist die Grenze eingehalten. Wenn der Text nach der Überarbeitung dem KI-Feedback-Text entspricht, nicht mehr dem eigenen Entwurf, ist sie überschritten.

Konkrete Werkzeuge, was wann passt

Die Tool-Wahl hängt von einer entscheidenden Frage ab: Wer gibt das Feedback ein, die Lehrkraft oder direkt die Schülerin?

Direkte KI-Nutzung durch Schülerinnen und Schüler unter 18 Jahren ist ohne datenschutzrechtliche Absicherung in Deutschland nicht zulässig. ChatGPT und Claude-Konsumenten-Apps sind nicht DSGVO-konform für Minderjährige, sofern keine Schullizenz oder ein Auftragsverarbeitungsvertrag mit der Schule besteht.

fobizz, der sichere Einstieg für Schulen fobizz ist die erste Wahl für Schulen in Deutschland. Alle Daten werden auf deutschen Servern verarbeitet, eine Schüleranmeldung ist für viele Funktionen nicht nötig, und die Tools sind pädagogisch für den Schulkontext kuratiert. Lehrkräfte können eigene KI-Chats einrichten und den Schülerinnen und Schülern zugänglich machen, mit eigenem Rubrik-Kontext, ohne dass die Lernenden einen eigenen Account brauchen. Schullizenz ab 500 €/Jahr, in mehreren Bundesländern über Staatslizenzen kostenlos verfügbar (Rheinland-Pfalz, Mecklenburg-Vorpommern, Sachsen-Anhalt).

Claude über Bedrock (Lehrkraft-Nutzung) Claude ist für Schreibfeedback besonders gut geeignet, weil das Modell nuanciertes, differenziertes Feedback zu Textstruktur und Argumentation gibt, ohne in generische Lobhudeleien zu verfallen. Für den schulischen Einsatz empfiehlt sich die Nutzung über AWS Bedrock (Frankfurt) oder als Teil einer Schullizenz, nicht die Consumer-App claude.ai, die keine EU-Datenhaltung für Schülerinnen bietet. Für Lehrkräfte, die selbst Feedback vorverarbeiten und dann weiterreichen: Claude Pro (20 USD/Monat) reicht für eine einzelne Klasse.

LanguageTool, für den Grammatik-Layer LanguageTool ist der richtige Einstieg für den Oberflächenlayer: Rechtschreibung, Grammatik, Zeichensetzung, Konsistenz. EU-gehostet, DSGVO-konform, starker Deutschsupport. Premium ab ca. 7 €/Monat. Wichtig: Das Tool analysiert keine Argumentationsstruktur. Es ergänzt den Struktur-Feedback-Workflow, ersetzt ihn nicht.

ChatGPT, mit Vorsicht ChatGPT kann mit dem richtigen Rubrik-Prompt gutes Strukturfeedback geben. Für die direkte Nutzung durch Schülerinnen und Schüler unter 18 ist es ohne Schullizenz oder AVV datenschutzrechtlich problematisch. Für Lehrkräfte, die Feedback zentral erstellen und dann in Papierkopie oder fobizz weitergeben: nutzbar, aber fobizz ist für Schulen der bessere Weg.

Zusammenfassung: Wann welcher Ansatz

Schülerinnen und Schüler direkt am Tool: → fobizz (mit eingerichtetem Rubrik-Chat)
Lehrkraft verarbeitet Feedback zentral, gibt es weiter: → Claude via Bedrock oder fobizz
Grammatik- und Rechtschreib-Layer: → LanguageTool Premium (EU-gehostet)
Schnelltest heute ohne Lizenzaufwand: → Lehrkraft mit Claude Pro und Rubrik-Prompt, Feedback in Textdokument schreiben und Schülerinnen austeilen

Datenschutz und Datenhaltung

Sobald Schülertexte, insbesondere von Minderjährigen, in ein KI-System eingegeben werden, gilt die DSGVO strikt. Das schließt auch pseudonymisierte Texte ein, wenn sie erkennbar einer bestimmten Person zuzuordnen sind.

Für den deutschen Schulkontext gilt:

fobizz, alle Daten auf deutschen Servern, kein Schüler-Login erforderlich für Teacher-side-Nutzung, AVV mit Schule möglich. Empfehlung für den direkten Schüler-Zugang.
Claude über AWS Bedrock (Frankfurt), Verarbeitung in der EU-Region, AVV über AWS, geeignet für Schulen mit IT-Abteilung. Consumer-App claude.ai für Schüler unter 18 nicht empfohlen.
LanguageTool Premium/Teams, EU-gehostet, DSGVO-konform, AVV verfügbar. Für Grammatik-Feedback unproblematisch.
ChatGPT Education, OpenAI bietet Lizenzen für Schulen an, die DSGVO-Compliance ermöglichen sollen. Details variieren je nach Schulvertrag, vor Einsatz mit Datenschutzbeauftragten abstimmen.

Praxisregel: Bevor Schülerinnen und Schüler Texte direkt in ein KI-System eingeben, muss die Schule einen AVV mit dem Anbieter abgeschlossen haben. Das ist kein bürokratischer Luxus, sondern Voraussetzung für den rechtssicheren Betrieb. fobizz bietet diesen Weg am einfachsten, deshalb ist es für Schulen die erste Empfehlung.

Was es kostet, realistisch gerechnet

Einstieg (Lehrkraft-Nutzung, sofort)

Claude Pro: 20 USD/Monat, für eine Lehrkraft, die Feedback selbst verarbeitet und weitergibt. Keine Schüler-Direktzugänge.
LanguageTool Premium: ca. 7 €/Monat, als Ergänzung für den Grammatik-Layer.
fobizz Einzellizenz: 119 €/Jahr (Tools-Flatrate), für eine Lehrkraft mit Schüler-Zugang über geteilten Chat.

Schullizenz (ab fünf Lehrkräfte)

fobizz: ab 500 €/Jahr, für alle Lehrkräfte, DSGVO-konform, Schüler-Zugang möglich.
In Bundesländern mit Staatslizenz (u. a. Rheinland-Pfalz, Mecklenburg-Vorpommern): kostenlos.

Was du dagegenrechnen kannst Direkte Kostenersparnis gibt es nicht. Die Rechnung ist pädagogisch, nicht betriebswirtschaftlich: Zwei bis drei Überarbeitungszyklen pro Aufsatz statt null. Messbar bessere Textstruktur in der Nachfolgebewertung. Weniger Frustration bei Lehrkräften, die sehen, dass Feedback ankommt. Und, das wird selten explizit ausgesprochen, eine Entlastung der Korrekturnächte, weil Schülerinnen und Schüler besser vorbereitete Texte abgeben, wenn sie vorher iterativ gearbeitet haben.

Was du nicht einsparen kannst Die finale Benotung und das abschließende Lehrkraft-Feedback. Die bleiben. KI-Feedback ersetzt nicht die pädagogische Beziehung und die inhaltliche Einschätzung durch die Lehrkraft, es verschiebt Arbeit von der Korrekturnacht in die Unterrichtsphase.

Drei typische Einstiegsfehler

1. Den Prompt nicht einrichten, und dann generisches Feedback bekommen. Wer einen Aufsatz ohne Kontext in Claude oder ChatGPT eingibt und fragt „Gib mir Feedback”, bekommt generische Lobeshymnen mit zwei Stilhinweisen. Das hilft niemandem. Der Prompt muss explizit vorschreiben: welche Kriterien bewertet werden, was nicht kommentiert werden soll (Inhalt erfindet das System nicht), und wie das Feedback strukturiert sein soll. Ohne diesen Setup-Schritt ist der Anwendungsfall wertlos. Der Prompt am Ende dieses Artikels ist ein valider Startpunkt.

2. KI-Feedback direkt als Note kommunizieren. „Die KI hat dein Argument als schwach bewertet” ist keine pädagogische Rückmeldung, es ist eine Delegation von Bewertungsverantwortung. KI-Feedback ist immer formativ, nie summativ. Es ist ein Arbeitsprogramm für die nächste Überarbeitung, nicht eine Zwischennote. Wenn Schülerinnen und Schüler das falsch verstehen, entsteht Widerstand gegen das Tool, weil sie sich von einem Algorithmus bewertet fühlen.

3. Kein Pflichtschritt nach dem Feedback, und damit kein Lernen. Die oben zitierte LAK-Studie mit 14.000 Schülerinnen und Schülern zeigte: Rund die Hälfte veränderte nach dem Feedback keinen einzigen Buchstaben. Das Feedback verpuffte. Warum? Weil die Überarbeitungsrunde nicht verpflichtend war und kein strukturierter Reflexionsschritt folgte. Die Lösung ist nicht technisch, sondern didaktisch: Schülerinnen und Schüler müssen dokumentieren, was sie auf Basis des Feedbacks geändert haben, und warum. Dieser Schritt schafft die Brücke zwischen Feedback-Lesen und Feedback-Lernen.

4. Das Tool als Dauerlösung ohne Pflege. KI-Feedback ist so gut wie der Kontext, den du ihm gibst. Rubriken veralten, was in Klasse 9 als Bewertungsmaßstab gilt, passt nicht für Klasse 12. Wenn sich die Aufgabenformate ändern, muss der Prompt angepasst werden. Das ist keine einmalige Arbeit, sondern ein laufender Pflegeaufwand, der realistisch alle drei bis sechs Monate anfällt.

Was mit der Einführung wirklich passiert, und was nicht

Die Technik ist nicht das Problem. Das Schwierige ist die Unterrichtsarchitektur.

Drei Muster tauchen konsistent auf, wenn Lehrkräfte beginnen, KI-Feedback in den Schreibprozess zu integrieren:

Die Überarbeitung wird zur Scheinhandlung. Schülerinnen und Schüler lesen das Feedback, ändern ein paar Worte und geben den Text wieder ab, ohne wirklich zu verstehen, was die Kritik bedeutet. Der Overreliance-Effekt aus der Forschung ist real: Wer gelernt hat, dass das Tool einem sagt, was zu ändern ist, hört auf, selbst zu urteilen. Gegenmittel: Der Reflexionsschritt wird Pflicht. „Was habe ich geändert und warum?” in zwei Sätzen, handschriftlich oder im LMS. Wer das nicht ausfüllt, darf die überarbeitete Version nicht einreichen.

Starke Schreibende profitieren, schwache nicht. Schülerinnen und Schüler, die bereits grundlegende Argumentationsstruktur beherrschen, nutzen das Feedback, um ihren Text zu schärfen. Wer nicht weiß, was eine These ist, kann mit dem Feedback „Deine These ist nicht klar erkennbar” nichts anfangen, weil das fehlende Wissen im Kopf sitzt, nicht im Text. KI-Feedback setzt Grundkenntnisse voraus. Lehrkräfte müssen zuerst erklären, was Argumentation strukturell bedeutet, erst dann bringt das Feedback etwas.

Die Lehrkraft-Entlastung kommt, aber anders als erwartet. Die Korrekturnacht wird nicht kürzer, die finalen Texte brauchen weiterhin Zeit. Was sich ändert: Die abgegebenen Texte sind besser vorbereitet, weil Schülerinnen und Schüler bereits mehrfach überarbeitet haben. Die Lehrkraft kommentiert weniger strukturelle Basics und kann sich auf inhaltliche Tiefe konzentrieren. Das ist eine andere Art von Arbeit, anspruchsvoller, aber befriedigender.

Was konkret hilft:

Überarbeitungsrunde als Pflichtschritt im Unterrichtsplan einbauen, mit Zeitslot, nicht als Hausaufgabe
Reflexionsprotokoll einführen: Was wurde geändert, was nicht, warum
Erstes Feedback auf Klassenebene sichten: Zeigen häufige KI-Hinweise ein gemeinsames Lernfeld? Dann im Plenum besprechen
Starke Schreibende nutzen als Peer-Feedback-Ressource, nicht als Referenz

Realistischer Zeitplan mit Risikohinweisen

Phase	Dauer	Was passiert	Typisches Risiko
Setup & Rubrik-Entwicklung	Woche 1	Argumentations-Rubrik definieren, Prompt einrichten, Tool-Zugang klären	Rubrik zu grob oder zu kleinteilig, ein Testlauf mit echten Schülerinnen-Texten zeigt Schwächen
Pilotschleife (eine Klasse)	Woche 2–3	Erste Feedback-Runde mit einer Klasse, Schülerinnen-Reaktionen beobachten, Reflexionsprotokoll einführen	Passives Feedback-Verhalten: Schülerinnen lesen, ändern nichts, Reflexionspflicht muss durchgesetzt werden
Adjustierung	Woche 4	Prompt und Rubrik auf Basis der Pilotbeobachtungen anpassen	Feedback-Qualität variiert je nach Texttyp, Rubrik für verschiedene Aufgabenformate anpassen
Routinebetrieb	Ab Woche 5	Zwei bis drei Feedback-Schleifen pro Aufsatz, finales Lehrkraft-Feedback verbleibt	Pflege-Vergessen: Wenn sich Aufgabenformate ändern, muss der Prompt mit angepasst werden

Was du nicht erwarten kannst: Dass die Textqualität sich nach dem ersten Feedback-Zyklus dramatisch verbessert. Schreibkompetenz ist ein langsamer Lernprozess. Beobachtbar sind Fortschritte nach drei bis vier Aufsätzen mit je zwei Überarbeitungsrunden, das sind typischerweise ein bis zwei Schulhalbjahre.

Häufige Einwände, und was dahintersteckt

„Die Schülerinnen und Schüler lassen KI einfach den Text schreiben.” Das ist ein reales Risiko, aber es ist kein Argument gegen das Feedback-Tool, sondern ein Argument für die richtige didaktische Rahmung. Wer KI-Feedback im Unterricht explizit als Lernbegleitung einführt (und Täuschung klar benennt), hat weniger Probleme als wer das Tool heimlich einführt und hofft, dass es schon gut geht. Transparenz schützt besser als Verbote. Das Hamburger Verwaltungsgericht hat 2025 klargestellt: Täuschungsversuch liegt auch ohne explizites Verbot vor, das stärkt die Position der Lehrkräfte.

„KI kann Schreibqualität gar nicht richtig beurteilen.” Teils richtig, teils falsch. KI beurteilt Argumentationsstruktur nach hinterlegten Kriterien besser als Grammatikprogramme, aber schlechter als eine erfahrene Lehrkraft, die den Kontext, den Schüler und die Aufgabe kennt. Der Anwendungsfall ist nicht: KI statt Lehrkraft. Er ist: KI als Zwischenschicht, die Schülerinnen und Schüler zur Überarbeitung bringt, damit die finale Lehrkraft-Rückmeldung auf höherem Niveau ansetzt.

„Das macht mehr Aufwand, nicht weniger.” In der Einführungsphase stimmt das. Das Einrichten des Prompts, die erste Pilotschleife, das Reflexionsprotokoll, das kostet Zeit. Nach der Routinisierung (typisch: ab dem dritten Aufsatz-Zyklus) sinkt der Steuerungsaufwand erheblich. Wer sofort Entlastung sucht, ist mit einem anderen Anwendungsfall besser beraten. Wer in Schreibkompetenz investieren will, braucht diesen Vorlauf.

Woran du merkst, dass das zu dir passt

Gute Voraussetzungen:

Du unterrichtest Deutsch, Wirtschaft, Geschichte, Ethik oder ein anderes schreibintensives Fach und beklagst, dass Aufsatz-Feedback zu selten und zu spät ankommt
Du hast mindestens eine Klasse, in der schriftliche Argumentation regelmäßig Thema ist (nicht nur einmal im Halbjahr)
Du bist bereit, die Überarbeitungsrunde als strukturierten Unterrichtsschritt zu planen, nicht als optionale Hausaufgabe
Deine Schule hat fobizz (oder eine vergleichbare DSGVO-konforme Plattform) oder du bist bereit, Feedback als Lehrkraft zentral zu erstellen und weiterzugeben

Drei harte Ausschlusskriterien:

Schülerinnen und Schüler beherrschen Grundstruktur von Argumentation noch nicht. Wenn die Klasse noch nicht weiß, was eine These ist, was den Unterschied zwischen Argument und Behauptung ausmacht, oder wie ein Gegenargument aufgebaut ist, dann kann KI-Feedback auf Strukturebene nichts ausrichten. Es setzt Grundkenntnisse voraus, die zuerst im Unterricht erarbeitet werden müssen. Für die Einführungsphase der Argumentationsgrundlagen ist ein anderer Anwendungsfall besser geeignet, etwa direktes KI-Tutoring.
Kein DSGVO-konformes Tool verfügbar und keine Kapazität, Feedback zentral zu erstellen. Wenn weder fobizz noch eine vergleichbare Schullizenz vorhanden ist und die Lehrkraft nicht die Zeit hat, Feedback selbst zu erstellen und weiterzugeben, ist der Datenschutz-Weg zu umständlich für den regulären Betrieb. In diesem Fall erst die Lizenzfrage klären, dann starten.
Schreibaufgaben werden nie überarbeitet, und das soll auch so bleiben. Wenn im Lehrplan oder im schulischen Bewertungssystem keine Möglichkeit besteht, überarbeitete Fassungen einzureichen oder zu bewerten, fehlt der strukturelle Anker. KI-Feedback ohne Überarbeitungsphase ist pädagogischer Selbstzweck, schön anzusehen, aber wirkungslos. Zuerst die Unterrichtsarchitektur anpassen, dann das Tool einführen.

Das kannst du heute noch tun

Öffne fobizz, wenn deine Schule eine Lizenz hat, direkt im Browser, kein Download. Richte einen neuen KI-Chat mit dem untenstehenden Prompt ein. Gib dann einen alten Schülertext (oder einen Beispieltext, den du selbst verfasst hast) ein und lies das Feedback.

Das dauert 20 Minuten. Was du danach weißt: Ob die Feedback-Qualität auf Strukturebene ausreicht, um es deiner Klasse zuzumuten, oder ob der Prompt noch angepasst werden muss.

Argumentations-Feedback-Prompt

Du bist ein Schreibcoach für argumentative Aufsätze. Analysiere den folgenden Schülertext und gib strukturiertes formatives Feedback nach diesen Kriterien: 1. THESE: Ist eine klare Hauptbehauptung erkennbar? Wo steht sie? 2. ARGUMENTE: Werden Behauptungen durch Belege, Fakten oder Beispiele gestützt? Welche Argumente fehlen einen Beleg? 3. GEGENARGUMENT: Wird ein Einwand aufgegriffen? Wird er entkräftet oder nur genannt? 4. KOHÄRENZ: Folgen die Absätze einer logischen Reihenfolge? Gibt es Gedankensprünge? 5. SPRACHLICHE PRÄZISION: Werden zentrale Begriffe klar und konsistent verwendet? Wichtige Regeln: - Formuliere KEINE fertigen Sätze oder Textpassagen für den Schüler - Sage nicht, was gut ist, ohne zu erklären, was noch fehlt - Stelle nach jedem Kritikpunkt eine Frage, die den Schüler zur Überarbeitung auffordert - Bewerte NICHT die inhaltliche Richtigkeit der Argumente, nur die Struktur und den Beleg - Halte das Feedback auf maximal 250 Wörter Thema der Aufgabe: [AUFGABENTHEMA EINFÜGEN] Schülertext: [SCHÜLERTEXT EINFÜGEN]

Funktioniert mit fobizz, Claude, ChatGPT

Beispiel-Ausgabe

Mitarbeiter:in

Thema: Sollte das Deutschlandticket dauerhaft subventioniert werden? Schülertext: Das Deutschlandticket ist sehr günstig und deshalb gut für alle Menschen. Es kostet 49 Euro im Monat. Viele Menschen nutzen den öffentlichen Nahverkehr. Das ist gut für die Umwelt. Außerdem ist das Auto teuer und macht Lärm. Deshalb sollte das Ticket weiter subventioniert werden.

KI-Assistent

**Feedback zum Entwurf:** **1. These:** Eine Richtung ist erkennbar (Subventionierung ist gut), aber die eigentliche Behauptung ist nicht als These formuliert. Wo genau steht, warum es subventioniert werden *sollte*? Formuliere eine präzise These am Anfang: Was ist dein zentrales Argument? **2. Argumente:** Du nennst mehrere Punkte (günstig, Umwelt, Autoalternative), aber keiner ist belegt. Welche konkreten Daten oder Beispiele könntest du anführen? Wie viele Fahrgäste hat das Ticket hinzugewonnen? Wie viel CO₂ wurde eingespart? **3. Gegenargument:** Du nennst kein Gegenargument. Welche Einwände gibt es gegen die Subventionierung? Wer bezahlt sie? Ist das gerecht? Ohne Gegenargument bleibt der Text einseitig. **4. Kohärenz:** Die Sätze stehen nebeneinander, ohne verbunden zu sein. Wie hängt der Punkt "Auto ist teuer" mit der Subventionierung zusammen? Füge einen Übergang ein. **5. Sprachliche Präzision:** "Gut für alle Menschen" ist unpräzise. Für wen genau? Nicht alle haben ein Monatsticket für 49 Euro. → Überarbeite zuerst die These und füge für ein Argument einen konkreten Datenbeleg ein.

Quellen & Methodik

DARIUS-Projekt (Leibniz-IPN, 2021–2024): Dr. Thorben Jansen, Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik. Drei kontrollierte experimentelle Studien zeigen, dass KI-generiertes formatives Feedback auf argumentative Texte die Überarbeitungsbereitschaft und Argumentationsqualität bei Schülerinnen und Schülern verbessert. Projekthomepage: leibniz-ipn.de/de/forschen/projekte/darius
Passive Feedback-Nutzung: Studie präsentiert auf der ACM LAK-Konferenz 2025 (Learning Analytics and Knowledge): „Feedback from Generative AI: Correlates of Student Engagement in Text Revision from 655 Classes from Primary and Secondary School”, ca. die Hälfte der Schülerinnen und Schüler veränderte nach KI-Feedback keinen einzigen Buchstaben. dl.acm.org/doi/10.1145/3706468.3706494
Oberflächenfeedback-Problem: „Effects of feedback on deep-level features of argumentative writing over multiple drafts”, Springer Reading and Writing, 2025, KI-Feedback tendiert zu oberflächlichen Merkmalen, wenn kein strukturierter Kontext hinterlegt ist. link.springer.com/article/10.1007/s11145-025-10638-8
Täuschungsversuch: Hamburger Verwaltungsgericht, Beschluss vom 15. Dezember 2025: KI-Nutzung für eigene Leistungserbringung ist auch ohne explizites Verbot ein Täuschungsversuch, wenn die Aufgabe eigene sprachliche Leistung verlangt. Berichterstattung: heise.de
Preisinformationen fobizz: Anbieter-Website fobizz.com/de/preise/ (Stand Mai 2026). SchulKI-Preismodell: 12,99 €/Jahr für 2 Millionen Tokens, laut deutsches-schulportal.de.
DSGVO-Einschätzungen: Datenschutz-Hinweise beziehen sich auf die gültige DSGVO-Fassung (Art. 8 für Minderjährige, Art. 28 für Auftragsverarbeitung) sowie auf Anbieter-Datenschutzerklärungen von fobizz, Claude, LanguageTool (Stand Mai 2026).

Du willst den Prompt auf dein Fach oder deine Klassenstufe anpassen und wissen, wie du die Feedback-Schleifen in deinen Unterrichtsplan einbaust? Meld dich, das besprechen wir in einem kurzen Gespräch.

Diesen Inhalt teilen:

LinkedIn X / Twitter E-Mail WhatsApp

🤝

Wissen ist der erste Schritt. Der zweite kostet Zeit.

Du kannst diesen Use Case selbst umsetzen. Realistisch sind das ein paar Wochen Einarbeitung, einige Fehlversuche bei Datenschutz und Toolauswahl und das Risiko, dass es im Alltag doch nicht greift. Oder wir gehen es gemeinsam an: kostenlos und unverbindlich im Erstgespräch.

Alle KI-Tools für Bildung & Weiterbildung vergleichen

Weitere Use Cases

KI-Tutoren für Lernende

KI-gestützte Tutorsysteme beantworten Fragen von Schülern und Studierenden rund um die Uhr, erklären Inhalte auf verschiedenen Niveaustufen und passen sich dem Lernstand an.

Mehr erfahren

Unterrichtsplanung und Materialerstellung mit KI

KI erstellt Unterrichtsentwürfe, Arbeitsblätter, Quiz-Fragen und Erklärvideokonzepte, Lehrkräfte verbringen weniger Zeit mit Vorbereitung und mehr Zeit mit Schülern.

Mehr erfahren

Aufgaben und Tests mit KI erstellen

KI generiert Aufgaben, Klausurfragen und Quiz auf verschiedenen Schwierigkeitsniveaus, in Minuten, inklusive Musterlösung und Bewertungshinweisen.

Mehr erfahren

Zurück zu Bildung & Weiterbildung

Frieda Funke

Konzeptentwicklerin

Ich frage nicht, was KI kann. Ich frage, was du in deinem Alltag damit anfängst. Erst wenn ich eine ehrliche Antwort habe, entsteht daraus ein konkreter Use Case. Fehlt ein Anwendungsfall, der zu dir passt? Schreib mir kurz.

Fehlt dein Anwendungsfall? Mehr über das Team

KI-gestützte Schreib- und Argumentationskompetenzentwicklung

Das echte Ausmaß des Problems

Mit vs. ohne KI, ein ehrlicher Vergleich

Einschätzung auf einen Blick

Was das System konkret macht

Oberflächenfeedback und Strukturfeedback, der entscheidende Unterschied

Die Grenze zum Täuschungsversuch, wo die Linie liegt

Konkrete Werkzeuge, was wann passt

Datenschutz und Datenhaltung

Solche Praxis-Analysen, regelmäßig in deinem Postfach

Was es kostet, realistisch gerechnet

Drei typische Einstiegsfehler

Was mit der Einführung wirklich passiert, und was nicht

Realistischer Zeitplan mit Risikohinweisen

Häufige Einwände, und was dahintersteckt

Woran du merkst, dass das zu dir passt

Das kannst du heute noch tun

Quellen & Methodik

Wissen ist der erste Schritt. Der zweite kostet Zeit.

Weitere Use Cases

KI-Tutoren für Lernende

Unterrichtsplanung und Materialerstellung mit KI

Aufgaben und Tests mit KI erstellen

Bleib auf dem neuesten Stand der KI

Bleib auf dem neuesten
Stand der KI