Zum Inhalt springen
Bildung & Weiterbildung aufgabentestklausur

Aufgaben und Tests mit KI erstellen

KI generiert Aufgaben, Klausurfragen und Quiz auf verschiedenen Schwierigkeitsniveaus — in Minuten, inklusive Musterlösung und Bewertungshinweisen.

⚡ Auf einen Blick
Problem
Aufgabenerstellung ist zeitintensiv und leidet unter Kreativitätsermüdung — am Ende einer langen Woche entstehen ähnliche Aufgaben wie letzte Woche.
KI-Lösung
Ein LLM (ChatGPT, Claude) generiert per strukturiertem Prompt Aufgabensets zu beliebigen Themen in verschiedenen Formaten mit Musterlösung und Bewertungshinweisen.
Typischer Nutzen
Aufgaben-Erstellungszeit halbieren, breitere Variation von Aufgabenformaten, automatische Differenzierung nach Niveaustufen.
Setup-Zeit
Erster produktiver Einsatz in unter einer Woche möglich
Kosteneinschätzung
0 € Einrichtung, 0–20 €/Monat laufend
ChatGPT / Claude direkt (kein Setup)Spezialtool für Lehrkräfte (MagicSchool AI)M365 Copilot in Schulinfrastruktur
Worum geht's?

Es ist Freitagabend, 17:30 Uhr.

Julia unterrichtet Geschichte und Sozialkunde. Heute war Elternsprechtag bis 16 Uhr, davor sechs Unterrichtsstunden. Jetzt sitzt sie an ihrer Klassenarbeit für Montag. Klasse 9, Weimarer Republik. Sie öffnet die Arbeit vom letzten Halbjahr: Fünf Multiple-Choice-Fragen, zwei offene Fragen, eine Quellenanalyse. Sie verändert drei Daten und ein Bild.

Die Arbeit ist fertig — in dem Sinne, dass sie auf dem Papier steht. Ob sie gut ist, ob sie differenziert, ob sie testet was getestet werden soll, ob eine starke Schülerin sich unterfordert fühlt und eine schwächere keine Chance hat — dafür fehlt heute die Energie.

Montag sitzt die Klasse vor dieser Arbeit.

Das echte Ausmaß des Problems

Lehrkräfte an deutschen Schulen verbringen laut GEW-Erhebungen 8 bis 12 Stunden pro Woche mit Vor- und Nachbereitung des Unterrichts. Ein erheblicher Teil davon: Aufgabenerstellung. Neue Übungsblätter, Klassenarbeitsfragen, Differenzierungsmaterial für verschiedene Leistungsniveaus.

Das Problem ist nicht nur die Zeit — es ist die Kreativitätsstagnation. Nach einem langen Unterrichtstag und mehreren Korrekturrunden entstehen am Freitagnachmittag dieselben Aufgabentypen wie letzte Woche: Multiple Choice zu denselben Themen, Lückentexte im immer gleichen Format. Lehrkräfte wissen das — und ärgern sich darüber.

Die Differenzierung macht es noch schwieriger: Für eine Klasse mit heterogenem Leistungsstand bräuchte man nicht eine Version, sondern idealerweise drei. Dieser Aufwand potenziert die Erstellungszeit erheblich und wird in der Praxis oft nicht geleistet.

Mit vs. ohne KI — ein ehrlicher Vergleich

KennzahlOhne KIMit KI-Unterstützung
Zeit für Klausur (28 Schülerinnen, 3 offene Fragen)2–3 Stunden mit Musterlösung45–90 Minuten inkl. Prüfung
Aufgabenformate pro KlassenarbeitOft 2–3 immer gleiche FormateSystematisch variiert auf Bestellung
DifferenzierungsvariantenMeist 1 (Zeitdruck)3 Niveaus in 10 Minuten zusätzlich
Musterlösung erstelltSeparat, 30–45 Minuten extraAutomatisch mitgeneriert
KreativitätsermüdungReal nach 15 Uhr deutlichPrompt generiert auch um 22 Uhr frisch

Einschätzung auf einen Blick

Zeitersparnis — hoch (4/5) Aufgabenerstellung ist direkte, quantifizierbare Routinearbeit — ideal für KI. Die Zeitersparnis von typischerweise 50 Prozent (Schätzwert aus Praxisberichten) ist real und schnell erfahrbar. Leicht schwächer als die Unterrichtsplanung insgesamt, weil Aufgaben sorgfältiger fachlich geprüft werden müssen als Strukturentwürfe.

Kosteneinsparung — niedrig (2/5) Kein direkter monetärer Nutzen für die Schule. Zeit wird eingespart — aber das Einsparpotenzial bleibt im indirekten Bereich (weniger Überstunden, mehr Qualität).

Schnelle Umsetzung — sehr hoch (5/5) Der schnellste Einstieg in dieser Kategorie: Keine DSGVO-Problematik (keine Schülerdaten im Prompt), keine Systemintegration nötig, keine IT-Projekte. Ein guter Prompt für das eigene Fach kann in einer Stunde entwickelt und sofort produktiv genutzt werden. Der niedrigste Einstiegsaufwand unter allen 13 Bildungs-Anwendungsfällen.

ROI-Sicherheit — hoch (4/5) Die Zeitersparnis ist direkt messbar. Die Aufgabenqualität kann objektiver werden — weil mehr Energie in die inhaltliche Prüfung statt in das Tippen fließt. Einschränkung: KI-Aufgaben müssen immer geprüft werden; ungeprüfte Übernahme kann zu fachlichen Fehlern führen.

Skalierbarkeit — hoch (4/5) Jede gut entwickelte Prompt-Vorlage funktioniert für alle Themen eines Fachs. Kollegiumsweites Teilen multipliziert den Nutzen ohne weiteren Aufwand. Wächst gut mit neuen Fächern und Klassen.

Richtwerte — Qualitätsgewinn hängt stark von der Bereitschaft ab, KI-Entwürfe zu prüfen und zu verbessern.

Was KI bei der Aufgabenerstellung konkret macht

KI-gestützte Aufgabenerstellung funktioniert als strukturierter Dialog: Du gibst Thema, Niveau, Format und Anforderungen vor — die KI generiert einen Entwurf, den du prüfst und anpasst.

Das entscheidende Prinzip: Je konkreter der Prompt, desto besser das Ergebnis. „Erstelle 5 Multiple-Choice-Fragen zur Weimarer Republik für Klasse 9” liefert Durchschnittsmaterial. „Erstelle 5 Multiple-Choice-Fragen zur Entstehung der Weimarer Republik 1918/19, Klasse 9 Gymnasium, je 4 Antwortoptionen (eine korrekt, drei plausibel falsch, keine offensichtlich unsinnigen Optionen), Schwerpunkt Ursachen und Akteure — mit Musterlösung und Erklärung der Falschantworten” liefert etwas Brauchbares.

Drei Anwendungsfelder, die sofort funktionieren

Differenzierte Aufgabensets: Dieselbe Frage in drei Schwierigkeitsgraden — in unter fünf Minuten. Basisversion für schwächere Lernende, Standardversion, Transferversion für starke Schülerinnen. Die Lehrkraft prüft, ob die Stufen tatsächlich unterschiedlich sind.

Formatvarianten: Dieselbe Fragestellung als Multiple Choice, als offene Frage, als Lückentext, als Zuordnungsaufgabe — auf Wunsch. Das bricht Eintönigkeit und testet dasselbe Wissen auf verschiedenen Wegen.

Musterlösungen und Bewertungshinweise: KI generiert nicht nur die Aufgabe, sondern auch Musterlösung, Bewertungsrubrik und Hinweise zu typischen Fehlern. Besonders wertvoll, wenn Aufgaben von Vertretungslehrkräften oder Korrektoren übernommen werden.

Konkrete Werkzeuge — was wann passt

ChatGPT — Das vielseitigste Tool für Aufgabenerstellung. Unterstützt alle Fächer, alle Formate, alle Niveaustufen. Kann Aufgaben auf Basis von Lehrplaninhalten, Lehrbuchtexten oder eigenen Vorgaben generieren. Ab 0 Euro (Gratis) oder 20 Euro/Monat für bessere Qualität.

Claude — Besonders stark für aufgabenintensive Texte: längere Leseaufgaben, Schreibaufgaben mit komplexen Bewertungsrubriken, Differenzierungsmaterial mit erklärenden Texten. 20 Euro/Monat.

Diffit — Spezialisiertes Bildungstool für differenziertes Lesematerial. Kann Texte automatisch für verschiedene Sprachniveaus anpassen. Kostenloser Einstieg, Pro ab ca. 10 Dollar/Monat. Für englischsprachige Texte deutlich besser als für deutschsprachige.

MagicSchool AI — KI-Plattform speziell für Lehrkräfte mit vorbereiteten Workflows für Aufgabenerstellung, Rubrikerstellung und Differenzierungsmaterial. Basisversion kostenlos, Pro ca. 8 Euro/Monat. Guter FERPA-Datenschutz — DSGVO separat prüfen.

Microsoft 365 Copilot — Für Schulen mit M365-Lizenz: Aufgaben direkt in Word generieren, in OneNote speichern, in Teams teilen. Integration in bestehende Schulinfrastruktur ist der Hauptvorteil. Ca. 3–6 Euro/Nutzer/Monat on top.

Datenschutz und Datenhaltung

Aufgabenerstellung mit KI ist datenschutzrechtlich unkompliziert, solange keine personenbezogenen Schülerdaten eingegeben werden. Eine Lehrkraft, die Aufgaben zur Weimarer Republik generiert, gibt keine Schülerinformationen ein.

Die einzige relevante Einschränkung: Wenn Aufgaben auf spezifische Klassen zugeschnitten werden und dabei konkrete Schülermerkmale oder Namen eingegeben werden — das sollte generell vermieden werden. Standard-Aufgabenerstellung ohne Personenbezug ist ohne DSGVO-Komplikationen möglich.

Für den institutionellen Schulbetrieb mit zentraler Plattform gilt: Mit jedem Anbieter, der im Auftrag der Schule Daten verarbeitet, muss ein AVV nach Art. 28 DSGVO abgeschlossen werden.

Was es kostet — realistisch gerechnet

Einstieg (ChatGPT Gratis oder Plus):

  • Kosten: 0–20 Euro/Monat
  • Nutzen: Aufgabenerstellungszeit halbieren für alle Standardformate
  • Einschränkung: Gratis-Version hat begrenzte Qualität

Spezialisiertes Bildungstool (MagicSchool AI Pro):

  • Kosten: ca. 8 Euro/Monat
  • Nutzen: Vorfertigte Lehrkraft-Workflows, bessere Datenschutz-Compliance als generische Tools
  • Vorteil: Weniger Prompt-Engineering nötig, schul-spezifische Funktionen sofort verfügbar

ROI für Schule (30 Lehrkräfte): 3 Stunden/Woche Aufgabenerstellung → 1,5 Stunden mit KI = 1,5 Stunden gespart. Bei 40 Schulwochen: 60 Stunden/Jahr/Lehrkraft. Schule mit 30 Lehrkräften: 1.800 Stunden zurückgewonnen — für Unterrichtsqualität, Schülerbegleitung oder schlicht Erholung. Tool-Kosten: ca. 2.880 Euro/Jahr (30 Lizenzen à 8 Euro).

Drei typische Einstiegsfehler

1. KI-Aufgaben ungeprüft einsetzen. Der verführerischste Fehler: Die KI liefert einen überzeugend aussehenden Aufgabentext, die Lehrkraft druckt ihn aus. Inhaltliche Fehler, falsche Jahreszahlen, unklare Formulierungen, nicht lehrplankonforme Anforderungen können enthalten sein — und niemand hat sie geprüft. Lösung: Jede KI-Aufgabe fachlich prüfen. Das dauert fünf Minuten — und ist nicht verhandelbar.

2. Zu vage prompten. „Erstelle Aufgaben zu Photosynthese” liefert Material für eine allgemeine Naturwissenschaft-Klasse irgendwo. „Erstelle 4 Aufgaben zur Fotosynthese für Klasse 8 Gymnasium NRW, Schwerpunkt Lichtreaktion, eine davon als Diagramm-Interpretation, Musterlösung inklusive” liefert etwas Brauchbares. Kontext ist alles.

3. Keine Prompt-Templates anlegen. Wer jedes Mal von vorne anfängt, verliert den Effizienzgewinn. Gut entwickelte Prompts für die eigenen Fächer sind Kapital — sie speichern und weitergeben.

Realistischer Zeitplan mit Risikohinweisen

PhaseDauerWas passiertTypisches Risiko
Tool-Auswahl und erste TestsWoche 1–2Mit echten Unterrichtsthemen testen, Qualität beurteilenErster Eindruck zu positiv — ohne kritische Prüfung fachlich falsche Aufgaben übernehmen
Prompt-Templates entwickelnWoche 2–4Schul- und fachspezifische Vorlagen entwickelnKeine Struktur — jedes Mal von vorne anfangen, kein Effizienzgewinn
Erste Kolleginnen einführenWoche 4–62–3 interessierte Personen einbeziehen, Erfahrungen teilen„Das klingt nach Schummeln” — klarmachen, dass Überprüfung Pflicht bleibt
Systematische NutzungAb Woche 6Alle neuen Aufgaben als KI-Entwurf, dann geprüft und angepasstAufgaben werden ungeprüft übernommen — Qualitätssicherungs-Schritt explizit verankern

Häufige Einwände — und was dahintersteckt

„KI-generierte Aufgaben sind zu generisch — die passen nicht zu meiner Klasse.” Das stimmt für unspezifische Prompts. Mit konkretem Kontext — aktuell behandelter Stoff, Schwerpunkte, Vorkenntnisse — werden die Aufgaben deutlich passgenauer. Der Entwurf ist ein Ausgangspunkt.

„Schülerinnen können dieselbe KI nutzen, um die Aufgaben zu lösen.” Das ist ein reales Problem — und kein neues. Die Antwort liegt nicht im Verbot, sondern in der Aufgabengestaltung: Offene Fragen, persönliche Einschätzungen, Bezüge auf konkrete Unterrichtsinhalte. KI kann helfen, genau solche Aufgaben schneller zu entwickeln.

Woran du merkst, dass das zu dir passt

  • Du erstellst ähnliche Aufgaben immer wieder, weil die Energie für Neues am Freitagnachmittag fehlt
  • Du möchtest mehr Aufgabenvielfalt — verschiedene Formate, verschiedene Kontexte — hast aber nicht die Zeit dafür
  • Differenzierungsmaterial fehlt wegen Zeitdruck oft
  • Du möchtest Musterlösungen schneller erstellen, ohne sie jedes Mal separat schreiben zu müssen
  • Du bist bereit, jede KI-Ausgabe fachlich zu prüfen bevor du sie verwendest

Wann es sich (noch) nicht lohnt:

  • Wenn Aufgaben hauptsächlich mündlich gestellt werden und schriftliches Material selten ist
  • Wenn die Schule oder das Bundesland bestimmte Plattformen vorschreibt, die keine KI-Integration haben
  • Wenn die Klasse so klein ist (unter 10 Lernende), dass der Differenzierungsaufwand ohnehin handhabbar ist

Das kannst du heute noch tun

Öffne ChatGPT oder Claude und nimm ein Unterrichtsthema, das du diese Woche unterrichtest. Gib den folgenden Prompt ein und passe die Felder an:

Aufgabenset-Prompt mit Differenzierung
Erstelle ein Aufgabenset zum Thema [THEMA] für [SCHULART], Klasse [JAHRGANGSSTUFE], Fach [FACH], Bundesland [BUNDESLAND]. Aufgaben: - 3 Multiple-Choice-Fragen (4 Optionen, eine korrekt, drei plausibel falsch) - 2 offene Kurzfragen (5–8 Sätze erwartete Antwort) - 1 Transferaufgabe (Anwendung des Gelernten auf neuen Kontext) Für jede Aufgabe: - Musterlösung oder Schlüsselaspekte der erwarteten Antwort - Bewertungshinweis (Punkte und Kriterien) - Hinweis auf typischen Fehler Am Ende: eine vereinfachte Version der offenen Kurzfragen für Lernende mit Förderbedarf (kürzere Sätze, weniger Teilaspekte).
Funktioniert mit ChatGPT, Claude, MagicSchool AI
Beispiel-Ausgabe

Mitarbeiter:in

Thema: Weimarer Republik, Gymnasium Bayern, Klasse 9, Geschichte

KI-Assistent

**Multiple Choice 1:** Welches Ereignis markierte das offizielle Ende des Deutschen Kaiserreichs? (a) Unterzeichnung des Versailler Vertrags — ✗ (das war Juni 1919) (b) Abdankung Kaiser Wilhelms II. am 9. November 1918 — ✓ (c) Ausrufung der Räterepublik in München — ✗ (das war April 1919) (d) Ermordung Rosa Luxemburgs — ✗ (Januar 1919) Musterlösung: (b) — Bewertung: 1 Punkt Typischer Fehler: Verwechslung mit Versailler Vertrag (zeitlich späteres Ereignis) **Offene Kurzfrage 1:** Erläutere zwei wesentliche Schwachstellen der Weimarer Verfassung und erkläre, wie diese zur Instabilität der Republik beitrugen. Schlüsselaspekte: Artikel 48 (Notstandsdekrete), Verhältniswahlrecht (Parteienzersplitterung), mangelnde Demokratieerfahrung. Bewertung: 4 Punkte (2 Aspekte à 2 Punkte: 1 für Nennung, 1 für Erklärung des Zusammenhangs) **Vereinfachte Version für Förderbedarf:** Nenne eine Schwachstelle der Weimarer Verfassung. Erkläre in 2–3 Sätzen, was damit gemeint ist.

Quellen & Methodik

  • Lehrkraft-Arbeitszeiterhebung: GEW (Gewerkschaft Erziehung und Wissenschaft), Arbeitszeit-Studie 2023; Zahlen zur wöchentlichen Vor-/Nachbereitungszeit
  • Aufgabenvielfalt und Lernqualität: Fachdidaktische Grundsätze zu Aufgabenformaten (Bloom-Taxonomie); OECD Bildungsforschung 2023
  • KMK-Rahmen KI: Kultusministerkonferenz, Handlungsempfehlung Oktober 2024
  • Preisangaben: Veröffentlichte Tarife der Anbieter (Stand April 2026)

Diesen Inhalt teilen:

🤝

Interesse an diesem Use Case?

Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.

Deine Daten werden ausschließlich zur Bearbeitung deiner Anfrage verwendet (Art. 6 Abs. 1 lit. b DSGVO). Mehr in unserer Datenschutzerklärung.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–3 Themen — du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar