Automatisierte Projektnachkalkulation und Lernbericht
KI vergleicht Projektkalkulation und tatsächlichen Zeitaufwand, identifiziert Muster bei Über- und Unterschreitungen und erstellt strukturierte Lernberichte für künftige Kalkulationen.
- Problem
- Agenturen kalkulieren systematisch falsch, immer an denselben Projekttypen. Nachkalkulationen werden selten gemacht, weil niemand Zeit hat, Stundentabellen auszuwerten. Das kostet Marge.
- KI-Lösung
- Ein LLM analysiert Zeit-Tracking-Daten und vergleicht sie mit der ursprünglichen Kalkulation. Muster werden erkannt: Welche Leistungen werden chronisch unterschätzt? Welche Kunden-Typen kosten mehr Zeit?
- Typischer Nutzen
- Kalkulations-Genauigkeit verbessert sich innerhalb von 6 Monaten um 20–30 %, Marge pro Projekt steigt, Nachkalkulation dauert 30 Min. statt 4 Std.
- Setup-Zeit
- Erste Analyse in 1–2 Wochen; aussagekräftige Muster nach 3–6 Monaten
- Kosteneinschätzung
- LLM-Lizenz 20–30 USD/Monat; kein zusätzliches Setup-Tool erforderlich
Es ist Freitag, 17:12 Uhr.
Projektleiterin Lena Straub scrollt durch den Abschlussbericht für die Kampagne, die gerade ausgeliefert wurde. Dem Kunden gefällt sie. Die Agentur hat gute Arbeit gemacht. Und trotzdem stimmt etwas nicht: In der Kalkulation waren 60 Stunden Design eingetragen. Tatsächlich gebucht wurden 89.
Lena weiß, warum das passiert ist, ungefähr. Die Feedback-Schleife mit dem Kunden-Komitee hatte drei Runden mehr als geplant. Die Texter haben eine Woche länger gebraucht, weil das Briefing nicht klar genug war. Der Strategieworkshop am Anfang war kein Einzel-Meeting, sondern vier. Sie kennt diese Muster aus dem Bauchgefühl, seit Jahren. Sie weiß auch, dass sie beim nächsten Angebot für ein ähnliches Projekt wieder zu knapp kalkulieren wird, weil das Bauchgefühl beim Angebotsgespräch nicht so laut spricht wie die Zahl, die der Kunde als fair empfindet.
Eine Nachkalkulation würde helfen. Eine, die nicht nur zeigt, dass dieses Projekt 29 Stunden über Plan war, sondern warum, in welchen Phasen, und ob das Muster schon beim dritten ähnlichen Projekt in Folge auftritt. Die Agentur hat die Daten dafür im Zeiterfassungstool. Sie liegen dort, seit Jahren.
Niemand wertet sie aus. Dafür ist keine Zeit.
Für Unternehmen
Nicht nur lesen, umsetzen.
Wir entwickeln KI-Lösungen für genau deinen Anwendungsfall und begleiten dich bei der Einführung.
Das echte Ausmaß des Problems
Lena ist keine Ausnahme. Laut der Function Point Creative Industry Studie 2025 berichten 79 Prozent der Agenturen, dass sie Kunden regelmäßig über den Projektumfang hinaus bedienen, ohne dafür bezahlt zu werden. 58 Prozent nennen Umsatzsteuerung als ihre größte Herausforderung überhaupt. Das ist kein Qualitätsproblem und kein Personalproblem. Es ist ein Mess- und Lernproblem: Agenturen wissen nach einem Projekt oft nicht genau, wo der Aufwand wirklich geblieben ist, und gehen mit denselben blinden Flecken ins nächste Angebot.
Das Tragische daran: Die Daten wären vorhanden. 76 Prozent der befragten Agenturen erfassen Projektzeiten auf allen Projekten, 13 Prozent auf den meisten. Die Rohdaten für eine systematische Nachkalkulation liegen in Toggl, Clockify oder Harvest, strukturiert nach Projekt, Mitarbeitenden und Aufgaben. Sie werden am Ende des Projekts exportiert, wenn überhaupt, oder ignoriert.
Welche Leistungen werden am häufigsten unterschätzt? Aus Praxisberichten und Branchenanalysen zeichnen sich drei Muster ab:
- Feedback- und Abstimmungsrunden: Jede Runde ist im Angebot als halbe Stunde einkalkuliert. In Wirklichkeit kostet ein Feedback-Loop bei komplexen Projekten mit mehreren Entscheidungsebenen leicht drei bis fünf Stunden je Iteration, Briefingauswertung, Rückfragen, Überarbeitung, Qualitätssicherung.
- Projektmanagement und Koordination: In den meisten Angeboten sind 10–15 Prozent für PM vorgesehen. In der Praxis klettert der Koordinationsaufwand bei Projekten mit vielen Stakeholdern regelmäßig auf 20–30 Prozent.
- Korrekturrunden durch zu-früh-begonnene Produktion: Wenn die Konzeptphase nicht klar abgenommen ist, bevor Produktion beginnt, entstehen Korrekturen, die im Angebot schlicht nicht vorkommen.
Das sind keine neuen Erkenntnisse. Sie tauchen in den Gesprächen bei jeder Agenturgröße auf, und sie verschwinden nie, solange niemand die Muster aus echten Projektdaten zieht.
Mit vs. ohne KI, ein ehrlicher Vergleich
| Kennzahl | Ohne KI-Analyse | Mit systematischer Nachkalkulation per KI |
|---|---|---|
| Nachkalkulationsquote | 0–20 % aller Projekte | 90–100 % (Analyse läuft nach jedem Projekt) |
| Zeit für eine Nachkalkulation | 3–5 Stunden je Projekt | 20–30 Minuten je Projekt |
| Erkenntnistiefe | Einzelprojekt, subjektiv | Muster über 10–50 Projekte, objektiv |
| Einfluss auf nächste Kalkulation | Bauchgefühl des Projektleitenden | Konkrete Stunden-Faktoren je Leistungstyp |
| Dauer bis erste aussagekräftige Muster | Nie (zu selten erhoben) | 3–6 Monate bei 5–15 Projekten/Monat |
Der Vergleich ist wichtig, weil er zeigt, wo KI hier wirklich hilft: nicht im einzelnen Projekt, sondern in der Konsequenz, weil Nachkalkulationen endlich regelmäßig passieren statt nie.
Einschätzung auf einen Blick
Zeitersparnis, mittel (3/5) Wer bisher gar keine Nachkalkulationen gemacht hat, spart mit KI-Unterstützung formal keine Zeit, er macht etwas, das er vorher ausgelassen hat. Wer dagegen regelmäßig manuell auswertet, spart 3–4 Stunden je Projekt. Die tägliche Arbeitszeit wird kaum berührt; der Effekt liegt in einem einmaligen monatlichen oder quartalsweisen Analysezyklus. Auf dieser Achse schlägt Texterstellung oder Social-Content-Produktion den Use Case klar.
Kosteneinsparung, stark (4/5) Der direkte Hebel ist die Verbesserung der Kalkulationsgenauigkeit. Wenn du weißt, dass Feedback-Runden bei Enterprise-Kunden im Schnitt 40 Prozent mehr Zeit kosten als kalkuliert, kannst du das im nächsten Angebot einpreisen. Erfahrungswerte aus Agenturen, die Nachkalkulation systematisch eingeführt haben, sprechen von 5–15 Prozent Margeverbesserung je Projekt innerhalb von sechs Monaten. Das ist konkret messbar, und damit klar besser als indirekte Nutzeneffekte. Nicht auf Platz 5 (den hat Projektkalkulation mit dem direkteren Hebel), aber deutlich über dem Branchendurchschnitt.
Schnelle Umsetzung, mittel (3/5) Die erste Analyse ist in einer Woche möglich: Time-Tracking-Export, Kalkulation als CSV oder Tabelle, beides in ein LLM einspeisen, strukturierten Output erhalten. Was länger dauert: auf genug Projekte zu warten, damit Muster statistisch belastbar sind. Drei bis sechs Monate sind realistisch, bevor du wirklich handlungsleitende Empfehlungen hast. Der Einstieg ist niedrigschwellig, der Nutzen kommt mit Verzögerung.
ROI-Sicherheit, mittel (3/5) Der ROI ist messbar, das unterscheidet diesen Use Case von vielen anderen. Du kannst Projektmargen vor und nach der Einführung vergleichen. Was die Sicherheit begrenzt: der Effekt hängt davon ab, ob die Projektleitenden die Erkenntnisse tatsächlich in bessere Angebote übersetzen. KI liefert den Lernbericht. Ob er die nächste Kalkulation verändert, entscheidet das Team. Dazu kommt: Wenn die Zeiterfassungsdaten inkonsistent sind, verwässert das die Muster. Die ROI-Sicherheit ist höher als bei rein qualitativen KI-Einsätzen, aber niedriger als bei direkt messbaren Automatisierungen.
Skalierbarkeit, mittel (3/5) Technisch skaliert die Analyse problemlos von 5 auf 200 Projekten im Jahr, gleicher Aufwand, gleiches Tool, nur mehr Daten. Was nicht automatisch skaliert: der organisatorische Lernzyklus. Ob 20 Projektleitende ihre Kalkulations-Gewohnheiten auf Basis von KI-Reports anpassen, ist eine Führungsaufgabe. Die Technik ist das Leichteste.
Richtwerte, stark abhängig von Projektvolumen, Konsistenz der Zeiterfassung und tatsächlicher Nutzung der Erkenntnisse in Folgeprojekten.
Was die Analyse konkret macht
Das Grundprinzip ist einfacher als es klingt. Du kombinierst zwei Datensätze:
- Die ursprüngliche Kalkulation: Was hat die Agentur dem Kunden angeboten oder intern geplant? Stunden je Leistungsposition (Konzeption, Design, Text, Projektmanagement, Kundengespräche, Korrekturrunden).
- Die tatsächlichen Zeitbuchungen: Was wurde im Zeiterfassungstool wirklich gebucht? Selbe Struktur, oder zumindest annähernd.
Diese beiden Datensätze gibst du einem LLM und fragst gezielt: Wo lagen die Unterschiede? Welche Leistungstypen wurden systematisch unterschätzt oder überschätzt? Welche Faktoren (Kundengröße, Projekttyp, Teamzusammensetzung) korrelieren mit Überschreitungen?
Das LLM macht dabei keine statistische Analyse im klassischen Sinne. Es liest die Zahlen, interpretiert Muster und formuliert Hypothesen, die dann durch mehrere Projekte überprüft werden können. Das Ergebnis ist kein Dashboard, sondern ein strukturierter Text: “Bei Enterprise-Kunden mit mehr als zwei internen Stakeholdern werden Abstimmungsrunden im Schnitt um X Stunden überschritten. Empfehlung: Faktor 1,4 auf alle Koordinationspositionen bei dieser Kundenkategorie.”
Das ist schon viel mehr, als die meisten Agenturen heute systematisch wissen.
Die Analyse-Pipeline Schritt für Schritt
Schritt 1: Zeiterfassung exportieren Aus Toggl Track, Clockify oder Harvest exportierst du den Detailed-Report für alle abgeschlossenen Projekte eines bestimmten Zeitraums als CSV. Wichtig: Der Export sollte nach Projekt, Aufgabenkategorie und Mitarbeitenden aufgeschlüsselt sein, nicht nur als Gesamtsumme.
Schritt 2: Kalkulation bereitstellen Für jedes Projekt brauchst du die ursprüngliche Stundenschätzung je Position. Wenn die in Excel oder deinem Projektmanagementsystem liegt, reicht ein kopierter Tabellenausschnitt. Wenn deine Agentur mit einem Tool wie MOCO oder awork arbeitet, gibt es oft direkte Exports, die Soll-Ist-Vergleiche schon vorberechnen.
Schritt 3: Beides in das LLM einspeisen Öffne ChatGPT oder Claude. Lade den CSV-Export hoch (Datei-Upload-Funktion) oder füge die relevanten Zeilen als formatierte Tabelle ein. Dazu kommt die Kalkulations-Tabelle. Dann formulierst du einen konkreten Analyse-Auftrag (Beispiel weiter unten).
Schritt 4: Lernbericht strukturieren Das LLM gibt dir einen strukturierten Text zurück: Welche Leistungstypen lagen wie weit daneben? Welche Hypothesen erklärt das Muster? Welche Empfehlungen ergeben sich für künftige Angebote? Diesen Text legst du ab, nicht als Ablagedokument, sondern als lebendiges Referenzdokument für die nächste Angebotsrunde.
Schritt 5: Muster über mehrere Projekte akkumulieren Beim ersten Projekt lernst du wenig, das über den Einzelfall hinausgeht. Beim zehnten Projekt mit ähnlichem Setup siehst du systematische Muster. Die Analyse wird wertvoller, je mehr Projekte du einbeziehst. Tipp: Führe eine einfache Tabelle (Projekt, Kalkulationsgenauigkeit je Leistungstyp, Kundentyp), auf die du bei jeder neuen Analyse zugreifst, als kumulierende Wissensbasis.
Was du aus der ersten Analyse lernst, und was nicht
Dieser Punkt ist wichtig genug für einen eigenen Abschnitt, weil viele Agenturen hier ihre Erwartungen falsch kalibrieren.
Was die erste Analyse dir geben kann:
- Eine ehrliche Zahl: Wie groß war die Abweichung tatsächlich, in Stunden und in Euro?
- Eine erste Hypothese: In welcher Phase ist der Aufwand weggeglitten?
- Den Einstieg: Ein strukturiertes Nachkalkulationsdokument, das die nächste Analysed eichter macht
Was die erste Analyse dir nicht geben kann:
- Statistisch belastbare Muster. Ein Einzelprojekt ist ein Datenpunkt, keine Stichprobe. Wenn die KI sagt, “Abstimmungsrunden werden unterschätzt”, muss das auf mehrere Projekte zutreffen, bevor du darauf vertraust.
- Kausalität. Das LLM sieht Korrelationen in den Zahlen, keine Ursachen. Dass ein Projekt 30 Stunden über Plan lag, kann am Kundentyp liegen, am Briefing, an der Teamzusammensetzung oder an einem externen Faktor (Krankheit, Urlaubsperiode). Die Interpretation bleibt menschliche Aufgabe.
- Eine Entscheidung. Die KI formuliert Hypothesen und Empfehlungen. Ob du die Empfehlung umsetzt, also im nächsten Angebot für Enterprise-Kunden 40 Prozent mehr auf Koordination einplanst, entscheidest du.
Realistisch ist: Nach drei bis sechs Monaten konsequenter Nachkalkulation hast du genug Daten, um mindestens zwei oder drei belastbare Muster zu identifizieren. Das ist der Zeitpunkt, an dem sich die Investition in den Prozess wirklich auszahlt.
Konkrete Werkzeuge, was wann passt
Für diesen Use Case brauchst du grundsätzlich zwei Komponenten: ein Zeiterfassungstool mit sauberem CSV-Export und ein LLM, das Tabellen verarbeiten und strukturierte Berichte erstellen kann.
Zeiterfassung:
Toggl Track, Kostenlos bis 5 Nutzer, sauberer CSV-Export nach Projekt und Aufgabe, EU-Datenhaltung (Estland). Für kleine bis mittelgroße Agenturen die unkomplizierteste Wahl. Der Detailed-Report exportiert genau die Datenstruktur, die für eine Nachkalkulations-Analyse benötigt wird.
Clockify, Kostenlos ohne Nutzerlimit, ähnlicher Funktionsumfang wie Toggl. Besonders geeignet, wenn das Team bereits Jira oder Asana nutzt (direkte Browser-Extension-Integration). EU-Datenspeicherort ab dem Pro-Plan (7,99 $/Seat/Monat).
Harvest (nicht KI-basiert, daher kein Tool-Eintrag), Speziell auf Agenturen ausgerichtet, mit integrierter Budgetüberwachung und Invoicing. Ab 9 USD/Seat/Monat (Teams-Plan). Hat nach der Übernahme durch Bending Spoons 2025 Berichte über starke Preiserhöhungen erhalten, wer neu evaluiert, sollte aktuelle Preise direkt auf getharvest.com prüfen.
LLM für die Analyse:
ChatGPT (Plus oder Team), Datei-Upload-Funktion ermöglicht direktes Hochladen des CSV-Exports. Data Analysis-Modus kann Tabellen einlesen und visualisieren. Einfachster Einstieg für einmalige oder monatliche Analysen. Für Teams mit mehreren Nutzern lohnt sich der Team-Plan (25 USD/Nutzer/Monat).
Claude (Pro oder Team), Starke Lesekompetenz für komplexe Tabellen, natürlichsprachige Berichte mit differenzierten Formulierungen. Besonders geeignet, wenn der Lernbericht direkt für Geschäftsführung oder Kundenpräsentationen weiterverwendet werden soll.
Julius AI, Auf Datenanalyse spezialisiert: CSV hochladen, Fragen stellen, Visualisierungen generieren. Wenn du die Muster nicht nur als Text, sondern als Grafiken (Balkendiagramme, Zeitreihen) darstellen willst, ist Julius AI die gezieltere Wahl als allgemeine LLMs.
Automatisierung (optional):
Make oder Zapier, Wenn du die Analyse nicht monatlich manuell anstoßen, sondern automatisch nach Projektabschluss auslösen willst. Machbar, aber erfordert Einrichtungsaufwand (~4–8 Stunden für einen stabilen Workflow).
Wann welcher Ansatz:
- Erste Analyse, Einstieg: Toggl Track kostenlos + ChatGPT Plus, manuell
- Laufende monatliche Analyse, klein-mittelgroße Agentur: Clockify Free + Claude Pro
- Tiefer Datentaucher, visuelle Reports: Clockify/Toggl + Julius AI
- Skaliert automatisiert: Zeiterfassungstool + Make/Zapier + LLM
Datenschutz und Datenhaltung
Zeiterfassungsdaten aus Agenturen enthalten typischerweise Projektnamen, Kundennamen und Mitarbeiterdaten. Das macht die Frage, wohin diese Daten beim LLM-Upload gehen, relevant.
Für die DSGVO gelten drei Grundsätze:
Erstens: Sobald Mitarbeiterdaten (Namen + Stunden) verarbeitet werden, ist das personenbezogene Daten nach Art. 4 DSGVO. Wer diese Daten an ein US-amerikanisches Cloud-LLM sendet, muss prüfen, ob ein Auftragsverarbeitungsvertrag (AVV) vorliegt und ob die Übermittlung in ein Drittland zulässig ist.
Zweitens: Die einfachste Lösung ist Anonymisierung vor dem Upload. Ersetze Mitarbeiter-Namen durch Kürzel (MA1, MA2) und Kundennamen durch Codes (KD-A, KD-B). Der Analysewert bleibt vollständig erhalten, du brauchst die echten Namen nicht, um Muster zu erkennen. Das Freitext-Feld “Beschreibung” in den Zeitbuchungen ist oft der kritische Ort, wo Teams personenbezogene Details eintragen: “Call mit Maria Meier wegen Feedback” sollte vor dem Upload auf “Client call” reduziert werden.
Drittens: Für Teams, die Klarnamen und vollständige Projektbezeichnungen mit Kundenbezug verarbeiten wollen, empfiehlt sich entweder Claude via AWS Bedrock (Frankfurt) oder ein selbst gehostetes Open-Source-Modell, beide ermöglichen Verarbeitung in der EU ohne US-Datentransfer.
Hinweis: Dieser Abschnitt beschreibt allgemeine DSGVO-Grundsätze für typische Agenturszenarien. Für abschließende rechtliche Beurteilung konsultiere deinen Datenschutzbeauftragten oder Anwalt.
Was es kostet, realistisch gerechnet
Einmalige Einrichtungskosten
- Zeiterfassungstool einrichten oder aufräumen: 4–8 Stunden intern (Kategorien vereinheitlichen, Projektstruktur bereinigen)
- Ersten Analyse-Prompt entwickeln und testen: 2–4 Stunden
- Kumulationsdatei aufsetzen (einfache Tabelle): 1 Stunde
- Gesamt Einrichtung: 7–13 Stunden, keine externen Kosten bei freien Tools
Laufende Kosten (monatlich)
- Toggl Track Free + ChatGPT Plus: 20–30 USD/Monat (ein Nutzer)
- Clockify Free + Claude Pro: 20 USD/Monat
- Julius AI: 20–50 USD/Monat (je nach Plan)
- Make/Zapier für Automatisierung: 10–20 €/Monat (je nach Projektvolumen)
Konservative ROI-Rechnung Eine Agentur mit 10 Projekten pro Monat und einem durchschnittlichen Projekthonorar von 15.000 Euro: Wenn die Kalkulations-Genauigkeit sich innerhalb von sechs Monaten um 5 Prozent verbessert (konservativ, basierend auf Praxisberichten ähnlicher Digitalisierungsmaßnahmen in Agenturen), entspricht das 7.500 Euro zusätzlicher Marge pro Monat, bei 10 Projekten à 15.000 Euro und angenommener Istkosten-Unterschreitung von 5 Prozent. Selbst bei 2 Prozent Verbesserung und kleineren Projekten rechnet sich der Prozess in wenigen Monaten gegen die Werkzeugkosten.
Wie du den Nutzen misst Der direkteste Weg: Führe eine einfache Tabelle mit Kalkulationsgenauigkeit je Projekt (Abweichung in Prozent) und vergleiche Quartale. Wenn die Streuung kleiner wird, d.h. nicht mehr die Hälfte aller Projekte zwischen +5 % und +40 % Aufwand variiert, sondern die meisten im Korridor von ±10 % liegen, ist der Effekt nachgewiesen.
Drei typische Einstiegsfehler
1. Mit inkonsistenten Zeitkategorien starten Der häufigste und folgenreichste Fehler: Das Team erfasst Zeit, aber jede Person nennt dieselbe Tätigkeit anders. Sven bucht “Kundengespräch”, Jana bucht “Abstimmung Kunde”, Michael bucht “Call”. Für das LLM sind das drei verschiedene Kategorien, die Muster, die es erkennen soll, liegen aber quer zu diesen Kategorien verteilt. Das Ergebnis klingt strukturiert, ist aber bedeutungslos.
Lösung: Bevor du die erste Analyse machst, investiere zwei Stunden in ein einheitliches Kategorieschema, maximal 10–15 Kategorien, die für alle gelten. Dann retroaktiv die letzten drei Monate neu kategorisieren (in Clockify und Toggl ist das in Bulk möglich). Erst danach analysieren.
2. Einmalige Analyse als Erkenntnis behandeln Eine Nachkalkulation über ein einzelnes Projekt liefert einen Datenpunkt, keine Erkenntnis. Wenn das erste Projekt 20 Prozent über Plan lag, weißt du noch nicht, ob das Muster ist oder Ausnahme. Wer nach der ersten Analyse Kalkulationsregeln ändert, riskiert, Ausreißer zu verallgemeinern.
Lösung: Mindestens fünf bis sieben vergleichbare Projekte analysieren, bevor eine Empfehlung in der nächsten Kalkulation umgesetzt wird. Das LLM sollte explizit auf Datenmenge hingewiesen werden: “Ich zeige dir 3 Projekte, markiere alle Empfehlungen als vorläufige Hypothesen.”
3. Den Lernbericht erstellen, aber nicht nutzen Das ist der gefährlichste Fehler, weil er still passiert. Die Nachkalkulation läuft, der Bericht liegt in einem Ordner. Beim nächsten Angebot öffnet niemand diesen Ordner. Der Prozess war aufwändig, der Effekt ist null.
Lösung: Der Lernbericht braucht einen festen Platz im Angebotsprozess. Bevor ein neues Angebot finalisiert wird, werden die relevanten Mustererkenntnisse aus dem Bericht konsultiert. Das klingt trivial, ist es nicht, wenn es nicht explizit entschieden und kommuniziert wurde.
Was mit der Einführung wirklich passiert, und was nicht
Die erste Reaktion in Agenturen, wenn Projektleitende zum ersten Mal eine vollständige Soll-Ist-Analyse mit LLM-Kommentar sehen, ist oft ein Mischung aus “das wussten wir doch eigentlich” und echtem Überraschungsmoment. “Dass Abstimmungsrunden immer zu kurz kalkuliert sind, war mir klar. Dass es bei Kampagnenprojekten genau 1,8-mal mehr ist als bei anderen Projekten, das habe ich vorher nicht so gesehen.”
Was nicht passiert: Das Team ändert ab sofort spontan alle Kalkulationsgewohnheiten. Kalkulieren ist eine Praxis, die tief in der Erfahrung einzelner Projektleitenden verankert ist. Wer seit zehn Jahren nach demselben Schema anbietet, ändert das nicht nach einem Bericht. Es braucht Wiederholung, Vertrauen in die Daten und Führungsentscheidung, das neue Wissen im nächsten Angebot auch einzusetzen, auch wenn es bedeutet, dass das Angebot teurer wird.
Widerstandsmuster, die auftauchen:
“Unsere Projekte sind alle anders”, Das stimmt. Kein Projekt ist identisch. Aber Projekttypen haben Gemeinsamkeiten, und Muster entstehen über Projekttypen hinweg, nicht über Einzelprojekte. Das Argument ist ein Schutzreflex, der legitim ist: Niemand will zugeben, dass ein Algorithmus Kalkulationsmuster erkennt, die man selbst nach Jahren nicht systematisiert hat.
“Der Kunde will das nicht bezahlen”, Das ist die eigentlich wichtige Frage. Wenn die Analyse zeigt, dass Feedback-Runden mit Enterprise-Kunden tatsächlich dreimal so lange dauern wie einkalkuliert, gibt es zwei Möglichkeiten: Entweder wird das eingepreist (was Gegenwehr beim Kunden erzeugen kann), oder es wird vertraglich begrenzt (klare Definition von Revisionsphasen). Beides ist eine strategische Entscheidung, die die Analyse erst auslöst, sie trifft sie nicht.
Was konkret hilft:
- Nachkalkulations-Review als kurzen, festen Agendapunkt in monatliche Teamrunden einbauen (15–20 Minuten)
- Eine Person pro Agentur als “Dataverantwortliche” benennen, die die Kumulationstabelle pflegt und bei jeder Analyse Überblick behält
- Mindestens eine Kalkulation pro Quartal mit direktem Verweis auf einen Mustererkennungspunkt aus dem Bericht durchführen, als Beweis für sich selbst, dass der Prozess funktioniert
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Datenaudit & Kategorienbereinigung | Woche 1–2 | Zeiterfassungs-Kategorien vereinheitlichen, letzte 3–6 Monate retroaktiv bereinigen | Mehr Inkonsistenzen als erwartet, erhöhter Reinigungsaufwand |
| Erste Analyse-Pilot | Woche 2–3 | 3–5 abgeschlossene Projekte analysieren, Prompt entwickeln, Lernbericht-Vorlage festlegen | Daten reichen noch nicht für Muster, nur Einzelfall-Erkenntnisse möglich |
| Regelmäßiger Zyklus | Monat 2–3 | Alle abgeschlossenen Projekte nach festem Schema analysieren, Kumulationstabelle aufbauen | Prozess wird vergessen, wenn keine Person Verantwortung trägt |
| Erste Kalibrierung | Monat 3–6 | Erste belastbare Muster sichtbar, Kalkulationsrichtlinien anpassen | Erkenntnisse werden ignoriert weil “Kunden das nicht bezahlen wollen” |
| Stabilisierung | Ab Monat 6 | Nachkalkulation als Routineprozess, Muster werden direkt in neue Angebote eingearbeitet | Rückfall in Schätzungs-Gewohnheiten bei Personalwechsel |
Häufige Einwände, und was dahintersteckt
“Wir machen das doch schon, wir schauen uns die Stunden am Ende an.” Ein kurzer Blick auf die Gesamtstunden am Projektende ist keine Nachkalkulation. Eine Nachkalkulation vergleicht geplante vs. tatsächliche Stunden je Leistungsposition, identifiziert die Ursache der Abweichung und zieht strukturierte Schlüsse für die nächste Kalkulation. Das “draufschauen” bringt das Bewusstsein: “Wir lagen drüber.” Die Nachkalkulation bringt das Wissen: “Wir lagen bei Korrekturrunden immer drüber, und zwar im Durchschnitt um 8 Stunden, weil der Zustand vor der Abnahme nie klar definiert ist.”
“Das kann man nicht pauschalisieren, jedes Projekt ist anders.” Das stimmt für Einzelprojekte. Für Projekttypen nicht. Eine Agentur, die jährlich zwanzig Corporate-Website-Relaunches und fünfzehn Markenentwicklungen macht, hat genug Datenbasis, um verlässliche Muster je Typ zu erkennen. Die Analyse pauschalisiert nicht, sie segmentiert.
“Wir haben keine Zeit, das aufzusetzen.” Die Einrichtung des Prozesses (Kategorienschema + Analyse-Prompt) dauert einen halben Tag. Die erste Analyse selbst dauert 30 Minuten. Wer keine Zeit für 30 Minuten monatliche Analyse hat, aber Zeit für 4 Stunden manuelle Stunden-Auswertung, rechnet nicht korrekt. Der Einwand meint eigentlich: “Das ist nicht priorisiert.” Das ist eine andere Frage.
Woran du merkst, dass das zu dir passt
Das spricht dafür:
- Deine Agentur schließt mehr als fünf Projekte pro Monat ab, genug Datenvolumen für erste Muster
- Ihr erfasst Projektzeiten bereits in einem Tool, Toggl, Clockify, Harvest oder einem Agenturmanagement-Tool wie MOCO oder awork
- Ihr habt in den letzten zwölf Monaten mindestens drei Projekte mit Aufwandsüberschreitung von mehr als 20 Prozent abgeschlossen, und habt nicht genau gewusst, warum
- Die Geschäftsführung oder Projektleitung hat das Gefühl, immer wieder dieselben Kalkulationsfehler zu machen, aber keine Zahlen dazu
- Ihr seid bereits mit KI-Tools vertraut und habt erste Erfahrungen mit CSV-Analyse oder LLM-Prompting
Wann es (noch) nicht passt, drei harte Ausschlusskriterien:
-
Weniger als zehn abgeschlossene Projekte pro Jahr. Bei dieser Projektdichte dauert es zu lange, bis genug Datenpunkte für belastbare Muster vorhanden sind. Der Einrichtungsaufwand lohnt sich nicht, eine ehrliche manuelle Nachkalkulation je Projekt reicht und kostet weniger.
-
Zeit wird nicht konsistent nach Aufgabentyp erfasst. Wenn Zeitbuchungen keine einheitliche Kategorienstruktur haben, oder wenn ein erheblicher Teil der Projektzeit retrospektiv aus dem Gedächtnis eingetragen wird, ist die Datenbasis für LLM-Analyse zu unzuverlässig. Erst Zeiterfassungs-Disziplin etablieren, dann analysieren.
-
Kein etablierter Angebotsprozess mit strukturierten Leistungspositionen. Wenn Angebote nach Bauchgefühl oder als Pauschalpreise entstehen, ohne dass Leistungen einzeln ausgewiesen werden, fehlt die Vergleichsgrundlage für die Nachkalkulation. Dann ist zuerst Projektkalkulation der richtige Schritt, eine Struktur für Angebote, bevor die Abweichungen davon analysiert werden können.
Das kannst du heute noch tun
Nimm ein abgeschlossenes Projekt aus den letzten drei Monaten. Exportiere den Zeiterfassungsreport aus deinem Tool als CSV (oder kopiere die relevanten Zeilen). Stelle daneben die ursprüngliche Kalkulation. Dann öffne ChatGPT oder Claude und benutze diesen Prompt:
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- FunctionFox/Function Point Creative Industry Report 2025: 79 % der Agenturen berichten regelmäßige Überlieferung ohne Zusatzvergütung; 58 % nennen Umsatzsteuerung als größte Herausforderung; 76 % erfassen Zeiten auf allen Projekten. Quelle: functionfox.com/5-key-takeaways-from-the-2025-creative-industry-report/ (2025).
- Mediabistro, When Agencies Start Billing Clients for Revision Rounds: Praxisbericht zur Schwierigkeit, Revisionsphasen zu definieren und abzurechnen; Scope-Creep durch undefinierte Iterationstiefe. Quelle: mediabistro.com (2024).
- Harvest Pricing (getharvest.com/pricing): Teams-Plan ab 9 USD/Seat/Monat (monatlich) bzw. 11 USD/Seat/Monat (jährliche Abrechnung); Stand Mai 2026.
- Toggl Track Pricing (toggl.com/track): Kostenloser Plan bis 5 Nutzer mit vollem Funktionsumfang; Starter ab 10 USD/Nutzer/Monat; Stand Mai 2026.
- Clockify Pricing (clockify.me): Kostenloser Plan ohne Nutzerlimit; Pro-Plan mit EU-Datenspeicherort ab 7,99 $/Seat/Monat (Jahresabrechnung); Stand Mai 2026.
- ROI-Schätzung 5–15 % Margeverbesserung: Eigene Schätzung auf Basis von Praxisberichten ähnlicher Controlling-Digitalisierungen in Dienstleistungsagenturen; keine repräsentative Studie, sondern Orientierungswert.
- Datenmenge für belastbare Muster: Eigene Einschätzung auf Basis von Erfahrungswerten aus Analyse-Projekten; für statistische Signifikanz wären formale Methoden nötig, die hier nicht beansprucht werden.
Du willst wissen, ob euer Zeiterfassungs-Setup eine solide Datenbasis für die erste Nachkalkulation hergibt, und wo ihr anfangen solltet? Meld dich, das klären wir gerne gemeinsam.
Diesen Inhalt teilen:
Wissen ist der erste Schritt. Der zweite kostet Zeit.
Du kannst diesen Use Case selbst umsetzen. Realistisch sind das ein paar Wochen Einarbeitung, einige Fehlversuche bei Datenschutz und Toolauswahl und das Risiko, dass es im Alltag doch nicht greift. Oder wir gehen es gemeinsam an: kostenlos und unverbindlich im Erstgespräch.
Weitere Use Cases
Briefing-Analyse und Strategieableitung
KI analysiert Kundenbriefings in Minuten, leitet strategische Fragen ab und erstellt strukturierte Zusammenfassungen, bevor das Kreativteam überhaupt am Tisch sitzt.
Mehr erfahrenNew-Business-Pitch automatisieren
KI strukturiert Pitch-Dokumente, entwickelt Storylines und formuliert überzeugende Pitch-Texte, so geht mehr Zeit in Strategie und Kreation statt in das Zusammenstellen von Folien.
Mehr erfahrenProjektkalkulation und Angebotserstellung
KI schlägt Stundenschätzungen vor, erkennt typische Scope-Creep-Risiken im Briefing und generiert strukturierte Angebote, bevor die erste Zeile Arbeit getan ist.
Mehr erfahrenFrieda Funke
Konzeptentwicklerin
Ich frage nicht, was KI kann. Ich frage, was du in deinem Alltag damit anfängst. Erst wenn ich eine ehrliche Antwort habe, entsteht daraus ein konkreter Use Case. Fehlt ein Anwendungsfall, der zu dir passt? Schreib mir kurz.