Aufgaben und Tests mit KI erstellen
KI generiert Aufgaben, Klausurfragen und Quiz auf verschiedenen Schwierigkeitsniveaus — in Minuten, inklusive Musterlösung und Bewertungshinweisen.
- Problem
- Aufgabenerstellung ist zeitintensiv und leidet unter Kreativitätsermüdung — am Ende einer langen Woche entstehen ähnliche Aufgaben wie letzte Woche.
- KI-Lösung
- Ein LLM (ChatGPT, Claude) generiert per strukturiertem Prompt Aufgabensets zu beliebigen Themen in verschiedenen Formaten mit Musterlösung und Bewertungshinweisen.
- Typischer Nutzen
- Aufgaben-Erstellungszeit halbieren, breitere Variation von Aufgabenformaten, automatische Differenzierung nach Niveaustufen.
- Setup-Zeit
- Erster produktiver Einsatz in unter einer Woche möglich
- Kosteneinschätzung
- 0 € Einrichtung, 0–20 €/Monat laufend
Es ist Freitagabend, 17:30 Uhr.
Julia unterrichtet Geschichte und Sozialkunde. Heute war Elternsprechtag bis 16 Uhr, davor sechs Unterrichtsstunden. Jetzt sitzt sie an ihrer Klassenarbeit für Montag. Klasse 9, Weimarer Republik. Sie öffnet die Arbeit vom letzten Halbjahr: Fünf Multiple-Choice-Fragen, zwei offene Fragen, eine Quellenanalyse. Sie verändert drei Daten und ein Bild.
Die Arbeit ist fertig — in dem Sinne, dass sie auf dem Papier steht. Ob sie gut ist, ob sie differenziert, ob sie testet was getestet werden soll, ob eine starke Schülerin sich unterfordert fühlt und eine schwächere keine Chance hat — dafür fehlt heute die Energie.
Montag sitzt die Klasse vor dieser Arbeit.
Das echte Ausmaß des Problems
Lehrkräfte an deutschen Schulen verbringen laut GEW-Erhebungen 8 bis 12 Stunden pro Woche mit Vor- und Nachbereitung des Unterrichts. Ein erheblicher Teil davon: Aufgabenerstellung. Neue Übungsblätter, Klassenarbeitsfragen, Differenzierungsmaterial für verschiedene Leistungsniveaus.
Das Problem ist nicht nur die Zeit — es ist die Kreativitätsstagnation. Nach einem langen Unterrichtstag und mehreren Korrekturrunden entstehen am Freitagnachmittag dieselben Aufgabentypen wie letzte Woche: Multiple Choice zu denselben Themen, Lückentexte im immer gleichen Format. Lehrkräfte wissen das — und ärgern sich darüber.
Die Differenzierung macht es noch schwieriger: Für eine Klasse mit heterogenem Leistungsstand bräuchte man nicht eine Version, sondern idealerweise drei. Dieser Aufwand potenziert die Erstellungszeit erheblich und wird in der Praxis oft nicht geleistet.
Mit vs. ohne KI — ein ehrlicher Vergleich
| Kennzahl | Ohne KI | Mit KI-Unterstützung |
|---|---|---|
| Zeit für Klausur (28 Schülerinnen, 3 offene Fragen) | 2–3 Stunden mit Musterlösung | 45–90 Minuten inkl. Prüfung |
| Aufgabenformate pro Klassenarbeit | Oft 2–3 immer gleiche Formate | Systematisch variiert auf Bestellung |
| Differenzierungsvarianten | Meist 1 (Zeitdruck) | 3 Niveaus in 10 Minuten zusätzlich |
| Musterlösung erstellt | Separat, 30–45 Minuten extra | Automatisch mitgeneriert |
| Kreativitätsermüdung | Real nach 15 Uhr deutlich | Prompt generiert auch um 22 Uhr frisch |
Einschätzung auf einen Blick
Zeitersparnis — hoch (4/5) Aufgabenerstellung ist direkte, quantifizierbare Routinearbeit — ideal für KI. Die Zeitersparnis von typischerweise 50 Prozent (Schätzwert aus Praxisberichten) ist real und schnell erfahrbar. Leicht schwächer als die Unterrichtsplanung insgesamt, weil Aufgaben sorgfältiger fachlich geprüft werden müssen als Strukturentwürfe.
Kosteneinsparung — niedrig (2/5) Kein direkter monetärer Nutzen für die Schule. Zeit wird eingespart — aber das Einsparpotenzial bleibt im indirekten Bereich (weniger Überstunden, mehr Qualität).
Schnelle Umsetzung — sehr hoch (5/5) Der schnellste Einstieg in dieser Kategorie: Keine DSGVO-Problematik (keine Schülerdaten im Prompt), keine Systemintegration nötig, keine IT-Projekte. Ein guter Prompt für das eigene Fach kann in einer Stunde entwickelt und sofort produktiv genutzt werden. Der niedrigste Einstiegsaufwand unter allen 13 Bildungs-Anwendungsfällen.
ROI-Sicherheit — hoch (4/5) Die Zeitersparnis ist direkt messbar. Die Aufgabenqualität kann objektiver werden — weil mehr Energie in die inhaltliche Prüfung statt in das Tippen fließt. Einschränkung: KI-Aufgaben müssen immer geprüft werden; ungeprüfte Übernahme kann zu fachlichen Fehlern führen.
Skalierbarkeit — hoch (4/5) Jede gut entwickelte Prompt-Vorlage funktioniert für alle Themen eines Fachs. Kollegiumsweites Teilen multipliziert den Nutzen ohne weiteren Aufwand. Wächst gut mit neuen Fächern und Klassen.
Richtwerte — Qualitätsgewinn hängt stark von der Bereitschaft ab, KI-Entwürfe zu prüfen und zu verbessern.
Was KI bei der Aufgabenerstellung konkret macht
KI-gestützte Aufgabenerstellung funktioniert als strukturierter Dialog: Du gibst Thema, Niveau, Format und Anforderungen vor — die KI generiert einen Entwurf, den du prüfst und anpasst.
Das entscheidende Prinzip: Je konkreter der Prompt, desto besser das Ergebnis. „Erstelle 5 Multiple-Choice-Fragen zur Weimarer Republik für Klasse 9” liefert Durchschnittsmaterial. „Erstelle 5 Multiple-Choice-Fragen zur Entstehung der Weimarer Republik 1918/19, Klasse 9 Gymnasium, je 4 Antwortoptionen (eine korrekt, drei plausibel falsch, keine offensichtlich unsinnigen Optionen), Schwerpunkt Ursachen und Akteure — mit Musterlösung und Erklärung der Falschantworten” liefert etwas Brauchbares.
Drei Anwendungsfelder, die sofort funktionieren
Differenzierte Aufgabensets: Dieselbe Frage in drei Schwierigkeitsgraden — in unter fünf Minuten. Basisversion für schwächere Lernende, Standardversion, Transferversion für starke Schülerinnen. Die Lehrkraft prüft, ob die Stufen tatsächlich unterschiedlich sind.
Formatvarianten: Dieselbe Fragestellung als Multiple Choice, als offene Frage, als Lückentext, als Zuordnungsaufgabe — auf Wunsch. Das bricht Eintönigkeit und testet dasselbe Wissen auf verschiedenen Wegen.
Musterlösungen und Bewertungshinweise: KI generiert nicht nur die Aufgabe, sondern auch Musterlösung, Bewertungsrubrik und Hinweise zu typischen Fehlern. Besonders wertvoll, wenn Aufgaben von Vertretungslehrkräften oder Korrektoren übernommen werden.
Konkrete Werkzeuge — was wann passt
ChatGPT — Das vielseitigste Tool für Aufgabenerstellung. Unterstützt alle Fächer, alle Formate, alle Niveaustufen. Kann Aufgaben auf Basis von Lehrplaninhalten, Lehrbuchtexten oder eigenen Vorgaben generieren. Ab 0 Euro (Gratis) oder 20 Euro/Monat für bessere Qualität.
Claude — Besonders stark für aufgabenintensive Texte: längere Leseaufgaben, Schreibaufgaben mit komplexen Bewertungsrubriken, Differenzierungsmaterial mit erklärenden Texten. 20 Euro/Monat.
Diffit — Spezialisiertes Bildungstool für differenziertes Lesematerial. Kann Texte automatisch für verschiedene Sprachniveaus anpassen. Kostenloser Einstieg, Pro ab ca. 10 Dollar/Monat. Für englischsprachige Texte deutlich besser als für deutschsprachige.
MagicSchool AI — KI-Plattform speziell für Lehrkräfte mit vorbereiteten Workflows für Aufgabenerstellung, Rubrikerstellung und Differenzierungsmaterial. Basisversion kostenlos, Pro ca. 8 Euro/Monat. Guter FERPA-Datenschutz — DSGVO separat prüfen.
Microsoft 365 Copilot — Für Schulen mit M365-Lizenz: Aufgaben direkt in Word generieren, in OneNote speichern, in Teams teilen. Integration in bestehende Schulinfrastruktur ist der Hauptvorteil. Ca. 3–6 Euro/Nutzer/Monat on top.
Datenschutz und Datenhaltung
Aufgabenerstellung mit KI ist datenschutzrechtlich unkompliziert, solange keine personenbezogenen Schülerdaten eingegeben werden. Eine Lehrkraft, die Aufgaben zur Weimarer Republik generiert, gibt keine Schülerinformationen ein.
Die einzige relevante Einschränkung: Wenn Aufgaben auf spezifische Klassen zugeschnitten werden und dabei konkrete Schülermerkmale oder Namen eingegeben werden — das sollte generell vermieden werden. Standard-Aufgabenerstellung ohne Personenbezug ist ohne DSGVO-Komplikationen möglich.
Für den institutionellen Schulbetrieb mit zentraler Plattform gilt: Mit jedem Anbieter, der im Auftrag der Schule Daten verarbeitet, muss ein AVV nach Art. 28 DSGVO abgeschlossen werden.
Was es kostet — realistisch gerechnet
Einstieg (ChatGPT Gratis oder Plus):
- Kosten: 0–20 Euro/Monat
- Nutzen: Aufgabenerstellungszeit halbieren für alle Standardformate
- Einschränkung: Gratis-Version hat begrenzte Qualität
Spezialisiertes Bildungstool (MagicSchool AI Pro):
- Kosten: ca. 8 Euro/Monat
- Nutzen: Vorfertigte Lehrkraft-Workflows, bessere Datenschutz-Compliance als generische Tools
- Vorteil: Weniger Prompt-Engineering nötig, schul-spezifische Funktionen sofort verfügbar
ROI für Schule (30 Lehrkräfte): 3 Stunden/Woche Aufgabenerstellung → 1,5 Stunden mit KI = 1,5 Stunden gespart. Bei 40 Schulwochen: 60 Stunden/Jahr/Lehrkraft. Schule mit 30 Lehrkräften: 1.800 Stunden zurückgewonnen — für Unterrichtsqualität, Schülerbegleitung oder schlicht Erholung. Tool-Kosten: ca. 2.880 Euro/Jahr (30 Lizenzen à 8 Euro).
Drei typische Einstiegsfehler
1. KI-Aufgaben ungeprüft einsetzen. Der verführerischste Fehler: Die KI liefert einen überzeugend aussehenden Aufgabentext, die Lehrkraft druckt ihn aus. Inhaltliche Fehler, falsche Jahreszahlen, unklare Formulierungen, nicht lehrplankonforme Anforderungen können enthalten sein — und niemand hat sie geprüft. Lösung: Jede KI-Aufgabe fachlich prüfen. Das dauert fünf Minuten — und ist nicht verhandelbar.
2. Zu vage prompten. „Erstelle Aufgaben zu Photosynthese” liefert Material für eine allgemeine Naturwissenschaft-Klasse irgendwo. „Erstelle 4 Aufgaben zur Fotosynthese für Klasse 8 Gymnasium NRW, Schwerpunkt Lichtreaktion, eine davon als Diagramm-Interpretation, Musterlösung inklusive” liefert etwas Brauchbares. Kontext ist alles.
3. Keine Prompt-Templates anlegen. Wer jedes Mal von vorne anfängt, verliert den Effizienzgewinn. Gut entwickelte Prompts für die eigenen Fächer sind Kapital — sie speichern und weitergeben.
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Tool-Auswahl und erste Tests | Woche 1–2 | Mit echten Unterrichtsthemen testen, Qualität beurteilen | Erster Eindruck zu positiv — ohne kritische Prüfung fachlich falsche Aufgaben übernehmen |
| Prompt-Templates entwickeln | Woche 2–4 | Schul- und fachspezifische Vorlagen entwickeln | Keine Struktur — jedes Mal von vorne anfangen, kein Effizienzgewinn |
| Erste Kolleginnen einführen | Woche 4–6 | 2–3 interessierte Personen einbeziehen, Erfahrungen teilen | „Das klingt nach Schummeln” — klarmachen, dass Überprüfung Pflicht bleibt |
| Systematische Nutzung | Ab Woche 6 | Alle neuen Aufgaben als KI-Entwurf, dann geprüft und angepasst | Aufgaben werden ungeprüft übernommen — Qualitätssicherungs-Schritt explizit verankern |
Häufige Einwände — und was dahintersteckt
„KI-generierte Aufgaben sind zu generisch — die passen nicht zu meiner Klasse.” Das stimmt für unspezifische Prompts. Mit konkretem Kontext — aktuell behandelter Stoff, Schwerpunkte, Vorkenntnisse — werden die Aufgaben deutlich passgenauer. Der Entwurf ist ein Ausgangspunkt.
„Schülerinnen können dieselbe KI nutzen, um die Aufgaben zu lösen.” Das ist ein reales Problem — und kein neues. Die Antwort liegt nicht im Verbot, sondern in der Aufgabengestaltung: Offene Fragen, persönliche Einschätzungen, Bezüge auf konkrete Unterrichtsinhalte. KI kann helfen, genau solche Aufgaben schneller zu entwickeln.
Woran du merkst, dass das zu dir passt
- Du erstellst ähnliche Aufgaben immer wieder, weil die Energie für Neues am Freitagnachmittag fehlt
- Du möchtest mehr Aufgabenvielfalt — verschiedene Formate, verschiedene Kontexte — hast aber nicht die Zeit dafür
- Differenzierungsmaterial fehlt wegen Zeitdruck oft
- Du möchtest Musterlösungen schneller erstellen, ohne sie jedes Mal separat schreiben zu müssen
- Du bist bereit, jede KI-Ausgabe fachlich zu prüfen bevor du sie verwendest
Wann es sich (noch) nicht lohnt:
- Wenn Aufgaben hauptsächlich mündlich gestellt werden und schriftliches Material selten ist
- Wenn die Schule oder das Bundesland bestimmte Plattformen vorschreibt, die keine KI-Integration haben
- Wenn die Klasse so klein ist (unter 10 Lernende), dass der Differenzierungsaufwand ohnehin handhabbar ist
Das kannst du heute noch tun
Öffne ChatGPT oder Claude und nimm ein Unterrichtsthema, das du diese Woche unterrichtest. Gib den folgenden Prompt ein und passe die Felder an:
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- Lehrkraft-Arbeitszeiterhebung: GEW (Gewerkschaft Erziehung und Wissenschaft), Arbeitszeit-Studie 2023; Zahlen zur wöchentlichen Vor-/Nachbereitungszeit
- Aufgabenvielfalt und Lernqualität: Fachdidaktische Grundsätze zu Aufgabenformaten (Bloom-Taxonomie); OECD Bildungsforschung 2023
- KMK-Rahmen KI: Kultusministerkonferenz, Handlungsempfehlung Oktober 2024
- Preisangaben: Veröffentlichte Tarife der Anbieter (Stand April 2026)
Diesen Inhalt teilen:
Interesse an diesem Use Case?
Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.
Weitere Use Cases
KI-Tutoren für Lernende
KI-gestützte Tutorsysteme beantworten Fragen von Schülern und Studierenden rund um die Uhr, erklären Inhalte auf verschiedenen Niveaustufen und passen sich dem Lernstand an.
Mehr erfahrenUnterrichtsplanung und Materialerstellung mit KI
KI erstellt Unterrichtsentwürfe, Arbeitsblätter, Quiz-Fragen und Erklärvideokonzepte — Lehrkräfte verbringen weniger Zeit mit Vorbereitung und mehr Zeit mit Schülern.
Mehr erfahrenAutomatisiertes Lernfeedback
KI gibt Lernenden sofortiges, konstruktives Feedback zu Aufgaben und Texten — ohne Wartezeit auf die nächste Unterrichtsstunde.
Mehr erfahren