Zum Inhalt springen
Kreativwirtschaft kalkulationprojektnachkalkulationcontrolling

Automatisierte Projektnachkalkulation und Lernbericht

KI vergleicht Projektkalkulation und tatsächlichen Zeitaufwand, identifiziert Muster bei Über- und Unterschreitungen und erstellt strukturierte Lernberichte für künftige Kalkulationen.

⚡ Auf einen Blick
Problem
Agenturen kalkulieren systematisch falsch, immer an denselben Projekttypen. Nachkalkulationen werden selten gemacht, weil niemand Zeit hat, Stundentabellen auszuwerten. Das kostet Marge.
KI-Lösung
Ein LLM analysiert Zeit-Tracking-Daten und vergleicht sie mit der ursprünglichen Kalkulation. Muster werden erkannt: Welche Leistungen werden chronisch unterschätzt? Welche Kunden-Typen kosten mehr Zeit?
Typischer Nutzen
Kalkulations-Genauigkeit verbessert sich innerhalb von 6 Monaten um 20–30 %, Marge pro Projekt steigt, Nachkalkulation dauert 30 Min. statt 4 Std.
Setup-Zeit
Erste Analyse in 1–2 Wochen; aussagekräftige Muster nach 3–6 Monaten
Kosteneinschätzung
LLM-Lizenz 20–30 USD/Monat; kein zusätzliches Setup-Tool erforderlich
LLM analysiert Time-Tracking-ExportLLM + Kumulationstabelle pro ProjekttypAutomatisierter Workflow mit Make/Zapier
Worum geht's?

Es ist Freitag, 17:12 Uhr.

Projektleiterin Lena Straub scrollt durch den Abschlussbericht für die Kampagne, die gerade ausgeliefert wurde. Dem Kunden gefällt sie. Die Agentur hat gute Arbeit gemacht. Und trotzdem stimmt etwas nicht: In der Kalkulation waren 60 Stunden Design eingetragen. Tatsächlich gebucht wurden 89.

Lena weiß, warum das passiert ist, ungefähr. Die Feedback-Schleife mit dem Kunden-Komitee hatte drei Runden mehr als geplant. Die Texter haben eine Woche länger gebraucht, weil das Briefing nicht klar genug war. Der Strategieworkshop am Anfang war kein Einzel-Meeting, sondern vier. Sie kennt diese Muster aus dem Bauchgefühl, seit Jahren. Sie weiß auch, dass sie beim nächsten Angebot für ein ähnliches Projekt wieder zu knapp kalkulieren wird, weil das Bauchgefühl beim Angebotsgespräch nicht so laut spricht wie die Zahl, die der Kunde als fair empfindet.

Eine Nachkalkulation würde helfen. Eine, die nicht nur zeigt, dass dieses Projekt 29 Stunden über Plan war, sondern warum, in welchen Phasen, und ob das Muster schon beim dritten ähnlichen Projekt in Folge auftritt. Die Agentur hat die Daten dafür im Zeiterfassungstool. Sie liegen dort, seit Jahren.

Niemand wertet sie aus. Dafür ist keine Zeit.

Für Unternehmen

Nicht nur lesen, umsetzen.

Wir entwickeln KI-Lösungen für genau deinen Anwendungsfall und begleiten dich bei der Einführung.

Für Unternehmen

Das echte Ausmaß des Problems

Lena ist keine Ausnahme. Laut der Function Point Creative Industry Studie 2025 berichten 79 Prozent der Agenturen, dass sie Kunden regelmäßig über den Projektumfang hinaus bedienen, ohne dafür bezahlt zu werden. 58 Prozent nennen Umsatzsteuerung als ihre größte Herausforderung überhaupt. Das ist kein Qualitätsproblem und kein Personalproblem. Es ist ein Mess- und Lernproblem: Agenturen wissen nach einem Projekt oft nicht genau, wo der Aufwand wirklich geblieben ist, und gehen mit denselben blinden Flecken ins nächste Angebot.

Das Tragische daran: Die Daten wären vorhanden. 76 Prozent der befragten Agenturen erfassen Projektzeiten auf allen Projekten, 13 Prozent auf den meisten. Die Rohdaten für eine systematische Nachkalkulation liegen in Toggl, Clockify oder Harvest, strukturiert nach Projekt, Mitarbeitenden und Aufgaben. Sie werden am Ende des Projekts exportiert, wenn überhaupt, oder ignoriert.

Welche Leistungen werden am häufigsten unterschätzt? Aus Praxisberichten und Branchenanalysen zeichnen sich drei Muster ab:

  • Feedback- und Abstimmungsrunden: Jede Runde ist im Angebot als halbe Stunde einkalkuliert. In Wirklichkeit kostet ein Feedback-Loop bei komplexen Projekten mit mehreren Entscheidungsebenen leicht drei bis fünf Stunden je Iteration, Briefingauswertung, Rückfragen, Überarbeitung, Qualitätssicherung.
  • Projektmanagement und Koordination: In den meisten Angeboten sind 10–15 Prozent für PM vorgesehen. In der Praxis klettert der Koordinationsaufwand bei Projekten mit vielen Stakeholdern regelmäßig auf 20–30 Prozent.
  • Korrekturrunden durch zu-früh-begonnene Produktion: Wenn die Konzeptphase nicht klar abgenommen ist, bevor Produktion beginnt, entstehen Korrekturen, die im Angebot schlicht nicht vorkommen.

Das sind keine neuen Erkenntnisse. Sie tauchen in den Gesprächen bei jeder Agenturgröße auf, und sie verschwinden nie, solange niemand die Muster aus echten Projektdaten zieht.

Mit vs. ohne KI, ein ehrlicher Vergleich

KennzahlOhne KI-AnalyseMit systematischer Nachkalkulation per KI
Nachkalkulationsquote0–20 % aller Projekte90–100 % (Analyse läuft nach jedem Projekt)
Zeit für eine Nachkalkulation3–5 Stunden je Projekt20–30 Minuten je Projekt
ErkenntnistiefeEinzelprojekt, subjektivMuster über 10–50 Projekte, objektiv
Einfluss auf nächste KalkulationBauchgefühl des ProjektleitendenKonkrete Stunden-Faktoren je Leistungstyp
Dauer bis erste aussagekräftige MusterNie (zu selten erhoben)3–6 Monate bei 5–15 Projekten/Monat

Der Vergleich ist wichtig, weil er zeigt, wo KI hier wirklich hilft: nicht im einzelnen Projekt, sondern in der Konsequenz, weil Nachkalkulationen endlich regelmäßig passieren statt nie.

Einschätzung auf einen Blick

Zeitersparnis, mittel (3/5) Wer bisher gar keine Nachkalkulationen gemacht hat, spart mit KI-Unterstützung formal keine Zeit, er macht etwas, das er vorher ausgelassen hat. Wer dagegen regelmäßig manuell auswertet, spart 3–4 Stunden je Projekt. Die tägliche Arbeitszeit wird kaum berührt; der Effekt liegt in einem einmaligen monatlichen oder quartalsweisen Analysezyklus. Auf dieser Achse schlägt Texterstellung oder Social-Content-Produktion den Use Case klar.

Kosteneinsparung, stark (4/5) Der direkte Hebel ist die Verbesserung der Kalkulationsgenauigkeit. Wenn du weißt, dass Feedback-Runden bei Enterprise-Kunden im Schnitt 40 Prozent mehr Zeit kosten als kalkuliert, kannst du das im nächsten Angebot einpreisen. Erfahrungswerte aus Agenturen, die Nachkalkulation systematisch eingeführt haben, sprechen von 5–15 Prozent Margeverbesserung je Projekt innerhalb von sechs Monaten. Das ist konkret messbar, und damit klar besser als indirekte Nutzeneffekte. Nicht auf Platz 5 (den hat Projektkalkulation mit dem direkteren Hebel), aber deutlich über dem Branchendurchschnitt.

Schnelle Umsetzung, mittel (3/5) Die erste Analyse ist in einer Woche möglich: Time-Tracking-Export, Kalkulation als CSV oder Tabelle, beides in ein LLM einspeisen, strukturierten Output erhalten. Was länger dauert: auf genug Projekte zu warten, damit Muster statistisch belastbar sind. Drei bis sechs Monate sind realistisch, bevor du wirklich handlungsleitende Empfehlungen hast. Der Einstieg ist niedrigschwellig, der Nutzen kommt mit Verzögerung.

ROI-Sicherheit, mittel (3/5) Der ROI ist messbar, das unterscheidet diesen Use Case von vielen anderen. Du kannst Projektmargen vor und nach der Einführung vergleichen. Was die Sicherheit begrenzt: der Effekt hängt davon ab, ob die Projektleitenden die Erkenntnisse tatsächlich in bessere Angebote übersetzen. KI liefert den Lernbericht. Ob er die nächste Kalkulation verändert, entscheidet das Team. Dazu kommt: Wenn die Zeiterfassungsdaten inkonsistent sind, verwässert das die Muster. Die ROI-Sicherheit ist höher als bei rein qualitativen KI-Einsätzen, aber niedriger als bei direkt messbaren Automatisierungen.

Skalierbarkeit, mittel (3/5) Technisch skaliert die Analyse problemlos von 5 auf 200 Projekten im Jahr, gleicher Aufwand, gleiches Tool, nur mehr Daten. Was nicht automatisch skaliert: der organisatorische Lernzyklus. Ob 20 Projektleitende ihre Kalkulations-Gewohnheiten auf Basis von KI-Reports anpassen, ist eine Führungsaufgabe. Die Technik ist das Leichteste.

Richtwerte, stark abhängig von Projektvolumen, Konsistenz der Zeiterfassung und tatsächlicher Nutzung der Erkenntnisse in Folgeprojekten.

Was die Analyse konkret macht

Das Grundprinzip ist einfacher als es klingt. Du kombinierst zwei Datensätze:

  1. Die ursprüngliche Kalkulation: Was hat die Agentur dem Kunden angeboten oder intern geplant? Stunden je Leistungsposition (Konzeption, Design, Text, Projektmanagement, Kundengespräche, Korrekturrunden).
  2. Die tatsächlichen Zeitbuchungen: Was wurde im Zeiterfassungstool wirklich gebucht? Selbe Struktur, oder zumindest annähernd.

Diese beiden Datensätze gibst du einem LLM und fragst gezielt: Wo lagen die Unterschiede? Welche Leistungstypen wurden systematisch unterschätzt oder überschätzt? Welche Faktoren (Kundengröße, Projekttyp, Teamzusammensetzung) korrelieren mit Überschreitungen?

Das LLM macht dabei keine statistische Analyse im klassischen Sinne. Es liest die Zahlen, interpretiert Muster und formuliert Hypothesen, die dann durch mehrere Projekte überprüft werden können. Das Ergebnis ist kein Dashboard, sondern ein strukturierter Text: “Bei Enterprise-Kunden mit mehr als zwei internen Stakeholdern werden Abstimmungsrunden im Schnitt um X Stunden überschritten. Empfehlung: Faktor 1,4 auf alle Koordinationspositionen bei dieser Kundenkategorie.”

Das ist schon viel mehr, als die meisten Agenturen heute systematisch wissen.

Die Analyse-Pipeline Schritt für Schritt

Schritt 1: Zeiterfassung exportieren Aus Toggl Track, Clockify oder Harvest exportierst du den Detailed-Report für alle abgeschlossenen Projekte eines bestimmten Zeitraums als CSV. Wichtig: Der Export sollte nach Projekt, Aufgabenkategorie und Mitarbeitenden aufgeschlüsselt sein, nicht nur als Gesamtsumme.

Schritt 2: Kalkulation bereitstellen Für jedes Projekt brauchst du die ursprüngliche Stundenschätzung je Position. Wenn die in Excel oder deinem Projektmanagementsystem liegt, reicht ein kopierter Tabellenausschnitt. Wenn deine Agentur mit einem Tool wie MOCO oder awork arbeitet, gibt es oft direkte Exports, die Soll-Ist-Vergleiche schon vorberechnen.

Schritt 3: Beides in das LLM einspeisen Öffne ChatGPT oder Claude. Lade den CSV-Export hoch (Datei-Upload-Funktion) oder füge die relevanten Zeilen als formatierte Tabelle ein. Dazu kommt die Kalkulations-Tabelle. Dann formulierst du einen konkreten Analyse-Auftrag (Beispiel weiter unten).

Schritt 4: Lernbericht strukturieren Das LLM gibt dir einen strukturierten Text zurück: Welche Leistungstypen lagen wie weit daneben? Welche Hypothesen erklärt das Muster? Welche Empfehlungen ergeben sich für künftige Angebote? Diesen Text legst du ab, nicht als Ablagedokument, sondern als lebendiges Referenzdokument für die nächste Angebotsrunde.

Schritt 5: Muster über mehrere Projekte akkumulieren Beim ersten Projekt lernst du wenig, das über den Einzelfall hinausgeht. Beim zehnten Projekt mit ähnlichem Setup siehst du systematische Muster. Die Analyse wird wertvoller, je mehr Projekte du einbeziehst. Tipp: Führe eine einfache Tabelle (Projekt, Kalkulationsgenauigkeit je Leistungstyp, Kundentyp), auf die du bei jeder neuen Analyse zugreifst, als kumulierende Wissensbasis.

Was du aus der ersten Analyse lernst, und was nicht

Dieser Punkt ist wichtig genug für einen eigenen Abschnitt, weil viele Agenturen hier ihre Erwartungen falsch kalibrieren.

Was die erste Analyse dir geben kann:

  • Eine ehrliche Zahl: Wie groß war die Abweichung tatsächlich, in Stunden und in Euro?
  • Eine erste Hypothese: In welcher Phase ist der Aufwand weggeglitten?
  • Den Einstieg: Ein strukturiertes Nachkalkulationsdokument, das die nächste Analysed eichter macht

Was die erste Analyse dir nicht geben kann:

  • Statistisch belastbare Muster. Ein Einzelprojekt ist ein Datenpunkt, keine Stichprobe. Wenn die KI sagt, “Abstimmungsrunden werden unterschätzt”, muss das auf mehrere Projekte zutreffen, bevor du darauf vertraust.
  • Kausalität. Das LLM sieht Korrelationen in den Zahlen, keine Ursachen. Dass ein Projekt 30 Stunden über Plan lag, kann am Kundentyp liegen, am Briefing, an der Teamzusammensetzung oder an einem externen Faktor (Krankheit, Urlaubsperiode). Die Interpretation bleibt menschliche Aufgabe.
  • Eine Entscheidung. Die KI formuliert Hypothesen und Empfehlungen. Ob du die Empfehlung umsetzt, also im nächsten Angebot für Enterprise-Kunden 40 Prozent mehr auf Koordination einplanst, entscheidest du.

Realistisch ist: Nach drei bis sechs Monaten konsequenter Nachkalkulation hast du genug Daten, um mindestens zwei oder drei belastbare Muster zu identifizieren. Das ist der Zeitpunkt, an dem sich die Investition in den Prozess wirklich auszahlt.

Konkrete Werkzeuge, was wann passt

Für diesen Use Case brauchst du grundsätzlich zwei Komponenten: ein Zeiterfassungstool mit sauberem CSV-Export und ein LLM, das Tabellen verarbeiten und strukturierte Berichte erstellen kann.

Zeiterfassung:

Toggl Track, Kostenlos bis 5 Nutzer, sauberer CSV-Export nach Projekt und Aufgabe, EU-Datenhaltung (Estland). Für kleine bis mittelgroße Agenturen die unkomplizierteste Wahl. Der Detailed-Report exportiert genau die Datenstruktur, die für eine Nachkalkulations-Analyse benötigt wird.

Clockify, Kostenlos ohne Nutzerlimit, ähnlicher Funktionsumfang wie Toggl. Besonders geeignet, wenn das Team bereits Jira oder Asana nutzt (direkte Browser-Extension-Integration). EU-Datenspeicherort ab dem Pro-Plan (7,99 $/Seat/Monat).

Harvest (nicht KI-basiert, daher kein Tool-Eintrag), Speziell auf Agenturen ausgerichtet, mit integrierter Budgetüberwachung und Invoicing. Ab 9 USD/Seat/Monat (Teams-Plan). Hat nach der Übernahme durch Bending Spoons 2025 Berichte über starke Preiserhöhungen erhalten, wer neu evaluiert, sollte aktuelle Preise direkt auf getharvest.com prüfen.

LLM für die Analyse:

ChatGPT (Plus oder Team), Datei-Upload-Funktion ermöglicht direktes Hochladen des CSV-Exports. Data Analysis-Modus kann Tabellen einlesen und visualisieren. Einfachster Einstieg für einmalige oder monatliche Analysen. Für Teams mit mehreren Nutzern lohnt sich der Team-Plan (25 USD/Nutzer/Monat).

Claude (Pro oder Team), Starke Lesekompetenz für komplexe Tabellen, natürlichsprachige Berichte mit differenzierten Formulierungen. Besonders geeignet, wenn der Lernbericht direkt für Geschäftsführung oder Kundenpräsentationen weiterverwendet werden soll.

Julius AI, Auf Datenanalyse spezialisiert: CSV hochladen, Fragen stellen, Visualisierungen generieren. Wenn du die Muster nicht nur als Text, sondern als Grafiken (Balkendiagramme, Zeitreihen) darstellen willst, ist Julius AI die gezieltere Wahl als allgemeine LLMs.

Automatisierung (optional):

Make oder Zapier, Wenn du die Analyse nicht monatlich manuell anstoßen, sondern automatisch nach Projektabschluss auslösen willst. Machbar, aber erfordert Einrichtungsaufwand (~4–8 Stunden für einen stabilen Workflow).

Wann welcher Ansatz:

  • Erste Analyse, Einstieg: Toggl Track kostenlos + ChatGPT Plus, manuell
  • Laufende monatliche Analyse, klein-mittelgroße Agentur: Clockify Free + Claude Pro
  • Tiefer Datentaucher, visuelle Reports: Clockify/Toggl + Julius AI
  • Skaliert automatisiert: Zeiterfassungstool + Make/Zapier + LLM

Datenschutz und Datenhaltung

Zeiterfassungsdaten aus Agenturen enthalten typischerweise Projektnamen, Kundennamen und Mitarbeiterdaten. Das macht die Frage, wohin diese Daten beim LLM-Upload gehen, relevant.

Für die DSGVO gelten drei Grundsätze:

Erstens: Sobald Mitarbeiterdaten (Namen + Stunden) verarbeitet werden, ist das personenbezogene Daten nach Art. 4 DSGVO. Wer diese Daten an ein US-amerikanisches Cloud-LLM sendet, muss prüfen, ob ein Auftragsverarbeitungsvertrag (AVV) vorliegt und ob die Übermittlung in ein Drittland zulässig ist.

Zweitens: Die einfachste Lösung ist Anonymisierung vor dem Upload. Ersetze Mitarbeiter-Namen durch Kürzel (MA1, MA2) und Kundennamen durch Codes (KD-A, KD-B). Der Analysewert bleibt vollständig erhalten, du brauchst die echten Namen nicht, um Muster zu erkennen. Das Freitext-Feld “Beschreibung” in den Zeitbuchungen ist oft der kritische Ort, wo Teams personenbezogene Details eintragen: “Call mit Maria Meier wegen Feedback” sollte vor dem Upload auf “Client call” reduziert werden.

Drittens: Für Teams, die Klarnamen und vollständige Projektbezeichnungen mit Kundenbezug verarbeiten wollen, empfiehlt sich entweder Claude via AWS Bedrock (Frankfurt) oder ein selbst gehostetes Open-Source-Modell, beide ermöglichen Verarbeitung in der EU ohne US-Datentransfer.

Hinweis: Dieser Abschnitt beschreibt allgemeine DSGVO-Grundsätze für typische Agenturszenarien. Für abschließende rechtliche Beurteilung konsultiere deinen Datenschutzbeauftragten oder Anwalt.

Newsletter

Solche Praxis-Analysen, regelmäßig in deinem Postfach

Neue KI-Use-Cases, ehrliche Tool-Tests und DSGVO-Updates, verständlich aufbereitet. Kein Spam, jederzeit abbestellbar.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Was es kostet, realistisch gerechnet

Einmalige Einrichtungskosten

  • Zeiterfassungstool einrichten oder aufräumen: 4–8 Stunden intern (Kategorien vereinheitlichen, Projektstruktur bereinigen)
  • Ersten Analyse-Prompt entwickeln und testen: 2–4 Stunden
  • Kumulationsdatei aufsetzen (einfache Tabelle): 1 Stunde
  • Gesamt Einrichtung: 7–13 Stunden, keine externen Kosten bei freien Tools

Laufende Kosten (monatlich)

  • Toggl Track Free + ChatGPT Plus: 20–30 USD/Monat (ein Nutzer)
  • Clockify Free + Claude Pro: 20 USD/Monat
  • Julius AI: 20–50 USD/Monat (je nach Plan)
  • Make/Zapier für Automatisierung: 10–20 €/Monat (je nach Projektvolumen)

Konservative ROI-Rechnung Eine Agentur mit 10 Projekten pro Monat und einem durchschnittlichen Projekthonorar von 15.000 Euro: Wenn die Kalkulations-Genauigkeit sich innerhalb von sechs Monaten um 5 Prozent verbessert (konservativ, basierend auf Praxisberichten ähnlicher Digitalisierungsmaßnahmen in Agenturen), entspricht das 7.500 Euro zusätzlicher Marge pro Monat, bei 10 Projekten à 15.000 Euro und angenommener Istkosten-Unterschreitung von 5 Prozent. Selbst bei 2 Prozent Verbesserung und kleineren Projekten rechnet sich der Prozess in wenigen Monaten gegen die Werkzeugkosten.

Wie du den Nutzen misst Der direkteste Weg: Führe eine einfache Tabelle mit Kalkulationsgenauigkeit je Projekt (Abweichung in Prozent) und vergleiche Quartale. Wenn die Streuung kleiner wird, d.h. nicht mehr die Hälfte aller Projekte zwischen +5 % und +40 % Aufwand variiert, sondern die meisten im Korridor von ±10 % liegen, ist der Effekt nachgewiesen.

Drei typische Einstiegsfehler

1. Mit inkonsistenten Zeitkategorien starten Der häufigste und folgenreichste Fehler: Das Team erfasst Zeit, aber jede Person nennt dieselbe Tätigkeit anders. Sven bucht “Kundengespräch”, Jana bucht “Abstimmung Kunde”, Michael bucht “Call”. Für das LLM sind das drei verschiedene Kategorien, die Muster, die es erkennen soll, liegen aber quer zu diesen Kategorien verteilt. Das Ergebnis klingt strukturiert, ist aber bedeutungslos.

Lösung: Bevor du die erste Analyse machst, investiere zwei Stunden in ein einheitliches Kategorieschema, maximal 10–15 Kategorien, die für alle gelten. Dann retroaktiv die letzten drei Monate neu kategorisieren (in Clockify und Toggl ist das in Bulk möglich). Erst danach analysieren.

2. Einmalige Analyse als Erkenntnis behandeln Eine Nachkalkulation über ein einzelnes Projekt liefert einen Datenpunkt, keine Erkenntnis. Wenn das erste Projekt 20 Prozent über Plan lag, weißt du noch nicht, ob das Muster ist oder Ausnahme. Wer nach der ersten Analyse Kalkulationsregeln ändert, riskiert, Ausreißer zu verallgemeinern.

Lösung: Mindestens fünf bis sieben vergleichbare Projekte analysieren, bevor eine Empfehlung in der nächsten Kalkulation umgesetzt wird. Das LLM sollte explizit auf Datenmenge hingewiesen werden: “Ich zeige dir 3 Projekte, markiere alle Empfehlungen als vorläufige Hypothesen.”

3. Den Lernbericht erstellen, aber nicht nutzen Das ist der gefährlichste Fehler, weil er still passiert. Die Nachkalkulation läuft, der Bericht liegt in einem Ordner. Beim nächsten Angebot öffnet niemand diesen Ordner. Der Prozess war aufwändig, der Effekt ist null.

Lösung: Der Lernbericht braucht einen festen Platz im Angebotsprozess. Bevor ein neues Angebot finalisiert wird, werden die relevanten Mustererkenntnisse aus dem Bericht konsultiert. Das klingt trivial, ist es nicht, wenn es nicht explizit entschieden und kommuniziert wurde.

Was mit der Einführung wirklich passiert, und was nicht

Die erste Reaktion in Agenturen, wenn Projektleitende zum ersten Mal eine vollständige Soll-Ist-Analyse mit LLM-Kommentar sehen, ist oft ein Mischung aus “das wussten wir doch eigentlich” und echtem Überraschungsmoment. “Dass Abstimmungsrunden immer zu kurz kalkuliert sind, war mir klar. Dass es bei Kampagnenprojekten genau 1,8-mal mehr ist als bei anderen Projekten, das habe ich vorher nicht so gesehen.”

Was nicht passiert: Das Team ändert ab sofort spontan alle Kalkulationsgewohnheiten. Kalkulieren ist eine Praxis, die tief in der Erfahrung einzelner Projektleitenden verankert ist. Wer seit zehn Jahren nach demselben Schema anbietet, ändert das nicht nach einem Bericht. Es braucht Wiederholung, Vertrauen in die Daten und Führungsentscheidung, das neue Wissen im nächsten Angebot auch einzusetzen, auch wenn es bedeutet, dass das Angebot teurer wird.

Widerstandsmuster, die auftauchen:

“Unsere Projekte sind alle anders”, Das stimmt. Kein Projekt ist identisch. Aber Projekttypen haben Gemeinsamkeiten, und Muster entstehen über Projekttypen hinweg, nicht über Einzelprojekte. Das Argument ist ein Schutzreflex, der legitim ist: Niemand will zugeben, dass ein Algorithmus Kalkulationsmuster erkennt, die man selbst nach Jahren nicht systematisiert hat.

“Der Kunde will das nicht bezahlen”, Das ist die eigentlich wichtige Frage. Wenn die Analyse zeigt, dass Feedback-Runden mit Enterprise-Kunden tatsächlich dreimal so lange dauern wie einkalkuliert, gibt es zwei Möglichkeiten: Entweder wird das eingepreist (was Gegenwehr beim Kunden erzeugen kann), oder es wird vertraglich begrenzt (klare Definition von Revisionsphasen). Beides ist eine strategische Entscheidung, die die Analyse erst auslöst, sie trifft sie nicht.

Was konkret hilft:

  • Nachkalkulations-Review als kurzen, festen Agendapunkt in monatliche Teamrunden einbauen (15–20 Minuten)
  • Eine Person pro Agentur als “Dataverantwortliche” benennen, die die Kumulationstabelle pflegt und bei jeder Analyse Überblick behält
  • Mindestens eine Kalkulation pro Quartal mit direktem Verweis auf einen Mustererkennungspunkt aus dem Bericht durchführen, als Beweis für sich selbst, dass der Prozess funktioniert

Realistischer Zeitplan mit Risikohinweisen

PhaseDauerWas passiertTypisches Risiko
Datenaudit & KategorienbereinigungWoche 1–2Zeiterfassungs-Kategorien vereinheitlichen, letzte 3–6 Monate retroaktiv bereinigenMehr Inkonsistenzen als erwartet, erhöhter Reinigungsaufwand
Erste Analyse-PilotWoche 2–33–5 abgeschlossene Projekte analysieren, Prompt entwickeln, Lernbericht-Vorlage festlegenDaten reichen noch nicht für Muster, nur Einzelfall-Erkenntnisse möglich
Regelmäßiger ZyklusMonat 2–3Alle abgeschlossenen Projekte nach festem Schema analysieren, Kumulationstabelle aufbauenProzess wird vergessen, wenn keine Person Verantwortung trägt
Erste KalibrierungMonat 3–6Erste belastbare Muster sichtbar, Kalkulationsrichtlinien anpassenErkenntnisse werden ignoriert weil “Kunden das nicht bezahlen wollen”
StabilisierungAb Monat 6Nachkalkulation als Routineprozess, Muster werden direkt in neue Angebote eingearbeitetRückfall in Schätzungs-Gewohnheiten bei Personalwechsel

Häufige Einwände, und was dahintersteckt

“Wir machen das doch schon, wir schauen uns die Stunden am Ende an.” Ein kurzer Blick auf die Gesamtstunden am Projektende ist keine Nachkalkulation. Eine Nachkalkulation vergleicht geplante vs. tatsächliche Stunden je Leistungsposition, identifiziert die Ursache der Abweichung und zieht strukturierte Schlüsse für die nächste Kalkulation. Das “draufschauen” bringt das Bewusstsein: “Wir lagen drüber.” Die Nachkalkulation bringt das Wissen: “Wir lagen bei Korrekturrunden immer drüber, und zwar im Durchschnitt um 8 Stunden, weil der Zustand vor der Abnahme nie klar definiert ist.”

“Das kann man nicht pauschalisieren, jedes Projekt ist anders.” Das stimmt für Einzelprojekte. Für Projekttypen nicht. Eine Agentur, die jährlich zwanzig Corporate-Website-Relaunches und fünfzehn Markenentwicklungen macht, hat genug Datenbasis, um verlässliche Muster je Typ zu erkennen. Die Analyse pauschalisiert nicht, sie segmentiert.

“Wir haben keine Zeit, das aufzusetzen.” Die Einrichtung des Prozesses (Kategorienschema + Analyse-Prompt) dauert einen halben Tag. Die erste Analyse selbst dauert 30 Minuten. Wer keine Zeit für 30 Minuten monatliche Analyse hat, aber Zeit für 4 Stunden manuelle Stunden-Auswertung, rechnet nicht korrekt. Der Einwand meint eigentlich: “Das ist nicht priorisiert.” Das ist eine andere Frage.

Woran du merkst, dass das zu dir passt

Das spricht dafür:

  • Deine Agentur schließt mehr als fünf Projekte pro Monat ab, genug Datenvolumen für erste Muster
  • Ihr erfasst Projektzeiten bereits in einem Tool, Toggl, Clockify, Harvest oder einem Agenturmanagement-Tool wie MOCO oder awork
  • Ihr habt in den letzten zwölf Monaten mindestens drei Projekte mit Aufwandsüberschreitung von mehr als 20 Prozent abgeschlossen, und habt nicht genau gewusst, warum
  • Die Geschäftsführung oder Projektleitung hat das Gefühl, immer wieder dieselben Kalkulationsfehler zu machen, aber keine Zahlen dazu
  • Ihr seid bereits mit KI-Tools vertraut und habt erste Erfahrungen mit CSV-Analyse oder LLM-Prompting

Wann es (noch) nicht passt, drei harte Ausschlusskriterien:

  1. Weniger als zehn abgeschlossene Projekte pro Jahr. Bei dieser Projektdichte dauert es zu lange, bis genug Datenpunkte für belastbare Muster vorhanden sind. Der Einrichtungsaufwand lohnt sich nicht, eine ehrliche manuelle Nachkalkulation je Projekt reicht und kostet weniger.

  2. Zeit wird nicht konsistent nach Aufgabentyp erfasst. Wenn Zeitbuchungen keine einheitliche Kategorienstruktur haben, oder wenn ein erheblicher Teil der Projektzeit retrospektiv aus dem Gedächtnis eingetragen wird, ist die Datenbasis für LLM-Analyse zu unzuverlässig. Erst Zeiterfassungs-Disziplin etablieren, dann analysieren.

  3. Kein etablierter Angebotsprozess mit strukturierten Leistungspositionen. Wenn Angebote nach Bauchgefühl oder als Pauschalpreise entstehen, ohne dass Leistungen einzeln ausgewiesen werden, fehlt die Vergleichsgrundlage für die Nachkalkulation. Dann ist zuerst Projektkalkulation der richtige Schritt, eine Struktur für Angebote, bevor die Abweichungen davon analysiert werden können.

Das kannst du heute noch tun

Nimm ein abgeschlossenes Projekt aus den letzten drei Monaten. Exportiere den Zeiterfassungsreport aus deinem Tool als CSV (oder kopiere die relevanten Zeilen). Stelle daneben die ursprüngliche Kalkulation. Dann öffne ChatGPT oder Claude und benutze diesen Prompt:

Nachkalkulationsanalyse und Lernbericht
Du bist ein erfahrener Agentur-Controller und analysierst eine Projektnachkalkulation für eine Kreativagentur. KALKULATION (geplante Stunden je Position): [HIER KALKULATION EINFÜGEN, Leistungsposition | Geplante Stunden] TATSÄCHLICHE ZEITBUCHUNGEN: [HIER CSV-EXPORT EINFÜGEN oder Daten als Tabelle einfügen, Leistungsposition | Gebuchte Stunden] Erstelle einen strukturierten Lernbericht mit folgenden Abschnitten: 1. ABWEICHUNGS-ÜBERSICHT: Liste alle Leistungspositionen mit Soll, Ist und prozentualer Abweichung auf. 2. MUSTER-HYPOTHESEN: Welche zwei oder drei Positionen zeigen die auffälligsten Abweichungen? Formuliere für jede eine Hypothese, warum diese Position unter- oder überschätzt wurde. 3. RISIKOFAKTOREN: Welche Projektmerkmale (Kundentyp, Anzahl Stakeholder, Umfang Feedbackprozess, Briefingqualität) könnten zu den Abweichungen beigetragen haben? 4. HANDLUNGSEMPFEHLUNGEN: Welche konkreten Korrekturfaktoren empfiehlst du für die nächste Kalkulation eines ähnlichen Projekts? Formuliere als Faustregeln ("Bei mehr als zwei Kundenentscheidenden: Abstimmungsaufwand × 1,5 einplanen"). 5. DATENVORBEHALT: Markiere explizit, welche Empfehlungen auf einem Einzelprojekt basieren und erst nach mehreren ähnlichen Projekten als belastbar gelten können. Verwende einen sachlichen, direkten Ton, keine Beschönigungen. Nutze das Lernpotenzial des Projekts, nicht die Kritik am Team.
Funktioniert mit ChatGPT Plus, Claude Pro, Claude Team
Beispiel-Ausgabe

Mitarbeiter:in

KALKULATION: Konzeption | 20 Std. Design (3 Varianten) | 30 Std. Copywriting | 15 Std. Abstimmungsrunden (3×) | 6 Std. Projektmanagement | 10 Std. GESAMT | 81 Std. TATSÄCHLICHE BUCHUNGEN: Konzeption | 18 Std. Design | 47 Std. Copywriting | 19 Std. Abstimmung/Kundenkommunikation | 21 Std. Projektmanagement | 14 Std. GESAMT | 119 Std.

KI-Assistent

## Projektnachkalkulation, Strukturierter Lernbericht ### 1. Abweichungs-Übersicht | Position | Geplant | Tatsächlich | Abweichung | |---|---|---|---| | Konzeption | 20 Std. | 18 Std. | −10 % ✓ | | Design | 30 Std. | 47 Std. | +57 % ⚠️ | | Copywriting | 15 Std. | 19 Std. | +27 % | | Abstimmung | 6 Std. | 21 Std. | +250 % ⚠️ | | Projektmanagement | 10 Std. | 14 Std. | +40 % | | **Gesamt** | **81 Std.** | **119 Std.** | **+47 %** | ### 2. Muster-Hypothesen **Abstimmungsrunden (6 → 21 Stunden, +250 %)**: Das auffälligste Signal. Drei Runden waren geplant, die tatsächlichen Buchungen deuten auf mindestens 6–8 Abstimmungspunkte hin. Hypothese: Das Projekt hatte mehrere Entscheidungsebenen auf Kundenseite, die nicht im Briefing sichtbar waren. Jede Iteration löste weitere interne Klärungsrunden beim Kunden aus, die jeweils erneute Anpassungen erforderten. **Design (30 → 47 Stunden, +57 %)**: Konsistent mit der Abstimmungsüberschreitung, jede zusätzliche Feedbackrunde erzeugt Designarbeit. Die Kalkulation ging von 3 Varianten aus; tatsächliche Iterationstiefe war deutlich höher. ### 3. Risikofaktoren - Mehrere interne Stakeholder beim Kunden: erhöht Abstimmungsaufwand systematisch - Design wurde möglicherweise zu früh in Produktion gestartet, bevor Konzept final abgenommen ### 4. Handlungsempfehlungen (als Faustregeln) - **Abstimmung × 3 einplanen** bei Projekten mit mehr als einem Kundenansprechpartner auf Entscheiderebene - **Design-Start erst nach schriftlicher Konzeptabnahme**, reduziert Iterationsschleifen strukturell - **Vertragliche Revisionsdefinition**: Was ist eine "Runde"? Ab wann entstehen Zusatzkosten? ### 5. Datenvorbehalt Diese Empfehlungen basieren auf einem Einzelprojekt. Belastbar werden sie erst, wenn das Muster in 3–5 ähnlichen Projekten bestätigt ist. Bitte als vorläufige Hypothesen behandeln, nicht als Kalkulations-Regel.

Quellen & Methodik

  • FunctionFox/Function Point Creative Industry Report 2025: 79 % der Agenturen berichten regelmäßige Überlieferung ohne Zusatzvergütung; 58 % nennen Umsatzsteuerung als größte Herausforderung; 76 % erfassen Zeiten auf allen Projekten. Quelle: functionfox.com/5-key-takeaways-from-the-2025-creative-industry-report/ (2025).
  • Mediabistro, When Agencies Start Billing Clients for Revision Rounds: Praxisbericht zur Schwierigkeit, Revisionsphasen zu definieren und abzurechnen; Scope-Creep durch undefinierte Iterationstiefe. Quelle: mediabistro.com (2024).
  • Harvest Pricing (getharvest.com/pricing): Teams-Plan ab 9 USD/Seat/Monat (monatlich) bzw. 11 USD/Seat/Monat (jährliche Abrechnung); Stand Mai 2026.
  • Toggl Track Pricing (toggl.com/track): Kostenloser Plan bis 5 Nutzer mit vollem Funktionsumfang; Starter ab 10 USD/Nutzer/Monat; Stand Mai 2026.
  • Clockify Pricing (clockify.me): Kostenloser Plan ohne Nutzerlimit; Pro-Plan mit EU-Datenspeicherort ab 7,99 $/Seat/Monat (Jahresabrechnung); Stand Mai 2026.
  • ROI-Schätzung 5–15 % Margeverbesserung: Eigene Schätzung auf Basis von Praxisberichten ähnlicher Controlling-Digitalisierungen in Dienstleistungsagenturen; keine repräsentative Studie, sondern Orientierungswert.
  • Datenmenge für belastbare Muster: Eigene Einschätzung auf Basis von Erfahrungswerten aus Analyse-Projekten; für statistische Signifikanz wären formale Methoden nötig, die hier nicht beansprucht werden.

Du willst wissen, ob euer Zeiterfassungs-Setup eine solide Datenbasis für die erste Nachkalkulation hergibt, und wo ihr anfangen solltet? Meld dich, das klären wir gerne gemeinsam.

Diesen Inhalt teilen:

🤝

Wissen ist der erste Schritt. Der zweite kostet Zeit.

Du kannst diesen Use Case selbst umsetzen. Realistisch sind das ein paar Wochen Einarbeitung, einige Fehlversuche bei Datenschutz und Toolauswahl und das Risiko, dass es im Alltag doch nicht greift. Oder wir gehen es gemeinsam an: kostenlos und unverbindlich im Erstgespräch.

Deine Daten werden ausschließlich zur Bearbeitung deiner Anfrage verwendet (Art. 6 Abs. 1 lit. b DSGVO). Mehr in unserer Datenschutzerklärung.

Frieda Funke

Konzeptentwicklerin

Ich frage nicht, was KI kann. Ich frage, was du in deinem Alltag damit anfängst. Erst wenn ich eine ehrliche Antwort habe, entsteht daraus ein konkreter Use Case. Fehlt ein Anwendungsfall, der zu dir passt? Schreib mir kurz.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–4 Themen, du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar