Kostenkalkulation für Projektaufträge mit KI
KI liest historische Projektdaten, findet vergleichbare Vorprojekte und schlägt realistische Kostenspannen für neue Mandate vor — mit Risikohinweisen für unbekannte Branchen, juniorgeprägte Teams oder enge Zeitpläne.
- Problem
- Boutique-Beratungen unterbieten Mandate, um den Auftrag zu gewinnen — und verdienen daran nichts. Erfahrungswerte zur Kalkulation stecken in Köpfen einzelner Partner, nicht in der Projektdatenbank.
- KI-Lösung
- Ein RAG-System durchsucht die Datenbank abgeschlossener Projekte semantisch nach Ähnlichkeit, ein LLM liest die Treffer aus und formuliert eine Risikoeinschätzung mit datenbasiertem Kostenintervall für das neue Mandat.
- Typischer Nutzen
- Kalkulationsgenauigkeit messbar verbessert: Angebotszyklus von 4–8 auf 1–3 Stunden verkürzt. Überschreitungsquote und Margenerosion sinken — eine verhinderte Fehlkalkulation bei einem 200.000-€-Mandat sichert 30.000–40.000 € Marge.
- Setup-Zeit
- 12–18 Wochen inkl. Datenbasis-Aufbau und Kalibrierung
- Kosteneinschätzung
- Einrichtung 8.000–35.000 € (je nach Systemtiefe); laufend 200–600 €/Monat (LLM-Lizenzen + Infrastruktur); Datenbereinigung 4–8 Wochen internen Aufwand
Es ist Donnerstagabend, 21:40 Uhr.
Sandra Merz, Engagement Managerin bei einer 28-köpfigen Unternehmensberatung in Frankfurt, starrt auf die Projektabrechnung. Das Restrukturierungsmandat, das sie vor vier Monaten in drei Tagen Intensivkalkulation auf 180.000 Euro taxiert hatte, läuft gerade bei 247.000 Euro tatsächlichem Aufwand. Ausgebucht war das Projekt für 195.000 Euro — nach langen Verhandlungen hatte der Geschäftsführer noch 15.000 Euro runterverhandelt, weil der Wettbewerber ein schärferes Angebot gelegt hatte.
Das Projekt ist profitabel auf dem Papier. Minus 52.000 Euro bei den gebuchten Stunden.
Beim Post-mortem fällt auf: Ein ähnliches Mandat — Restrukturierung, Maschinenbau, ähnliche Unternehmensgröße, fast identischer Scope — hatte die Firma 2021 gemacht. Damals waren 2.200 Stunden gebucht worden. Sandra hatte 1.600 angesetzt. Niemand hatte ihr gesagt, dass es dieses Projekt gab. Es steckte ungetaggt irgendwo in der CRM-Datenbank, unter einem Projektnamen, der keinen Hinweis auf die Branche oder den Scope enthielt.
Das ist kein Einzelfall. Das ist die dritte Margin-Erosion in zwölf Monaten.
Das echte Ausmaß des Problems
Schlechte Kostenkalkulation in der Unternehmensberatung ist nicht in erster Linie ein Kompetenzproblem — es ist ein Datenproblem. Die meisten Berater wissen im Prinzip, wie ein Restrukturierungsprojekt im Mittelstand läuft. Was sie nicht wissen: wie viele Stunden das konkret beim letzten Dutzend vergleichbarer Mandate wirklich waren, wer die Überschreitungen verursacht hat und ob es Muster gibt.
Laut einer Umfrage des Project Management Institute (PMI, 2021) halten nur 62 Prozent aller Projekte das ursprünglich geplante Budget ein — das bedeutet, mehr als jedes dritte Projekt überschreitet sein Budget. In der Unternehmensberatung, wo Festpreisverträge und verhandelte Tagessätze an der Tagesordnung sind, trifft diese Abweichung direkt die eigene Marge.
Das BDU (Bundesverband Deutscher Unternehmensberatungen) beziffert den deutschen Beratungsmarkt auf rund 49 Milliarden Euro Umsatz (2025). Bei kleineren und mittleren Beratungsunternehmen — typisch 10–80 Berater — machen Projekte bis 250.000 Euro den Großteil des Umsatzes aus. Eine systematische Unterschätzung von 15–20 Prozent pro Projekt entspricht dort schnell dem Jahresgewinn einer ganzen Beratungseinheit.
Das Grundproblem: Erfahrungswissen zur Kalkulation ist nicht skalierbar. Der Partner, der das Restrukturierungsmandat 2021 geleitet hat, weiß, dass es am Ende 2.200 Stunden waren. Diese Information lebt in seinem Kopf. Der nächste Kalkulations-Workshop, an dem er nicht teilnimmt, trägt dieses Wissen nicht.
Dazu kommt die psychologische Dimension: Wer ein Mandat gewinnen will, schätzt optimistisch. Das ist keine böse Absicht — es ist ein kognitiver Reflex, den die Forschung gut belegt.
Mit vs. ohne KI — ein ehrlicher Vergleich
| Kennzahl | Ohne KI-Unterstützung | Mit KI-gestützter Kalkulation |
|---|---|---|
| Basis der Schätzung | Erfahrung einzelner Berater, Bauchgefühl | Abgeschlossene Vergleichsprojekte, tatsächliche Stundenwerte |
| Vergleichsprojekte herangezogen | 0–3, zufällig erinnert | 8–15, systematisch nach Ähnlichkeit gewichtet |
| Risikohinweise | Implizit — sofern erfahrener Berater beteiligt | Explizit: neue Branche, junior-geprägtes Team, enge Timeline |
| Kalkulationszeit pro Angebot | 4–8 Stunden Recherche + Abstimmung | 1–3 Stunden (Vergleiche werden automatisch geliefert) |
| Wissenstransfer an neue Berater | Jahrelange Erfahrung erforderlich | Sofortiger Zugriff auf historische Projektdaten |
| Erkennung typischer Scope-Creep-Fallen | Nur bei erfahrenen Seniorberatern | Automatisch aus Projekthistorie ableitbar |
Der wichtigste Effekt ist nicht die Zeitersparnis beim Kalkulieren — das ist der sichtbare Gewinn. Der entscheidende Effekt ist, dass die KI zwingt, mit historischen Ist-Werten zu rechnen, statt mit optimistischen Plan-Werten. Das verhindert den häufigsten Kalkulations-Fehler: das Projekt nach dem Wunsch zu planen, nicht nach der Erfahrung.
Einschätzung auf einen Blick
Zeitersparnis — mittel (3/5) Drei bis fünf Stunden pro Angebotszyklus lassen sich realistisch einsparen — durch wegfallende Recherchearbeit und weniger Abstimmungsrunden mit Seniorpartnern, die als lebende Wissensdatenbank fungieren. Das ist solide, aber nicht der Haupttreiber. Im Vergleich zu Projektdokumentation automatisieren oder der Angebotserstellung für Beratungsprojekte, die tägliche Kernaufgaben beschleunigen, ist der Zeitgewinn bei der Kalkulation moderater und seltener — typisch einmal pro Angebotszyklus.
Kosteneinsparung — hoch (4/5) Hier liegt der eigentliche Wert. Ein verhinderte Fehlkalkulation bei einem 200.000-Euro-Mandat entspricht 30.000–40.000 Euro gesicherter Marge. Bei drei bis fünf Angeboten pro Monat und einer Annahmequote von 30–40 Prozent reicht eine einzige verhinderte systematische Unterschätzung pro Quartal, um den gesamten Systemaufwand zu amortisieren. Deshalb steht dieser Wert deutlich über dem Branchenschnitt in dieser Kategorie.
Schnelle Umsetzung — niedrig (2/5) Der ehrlichste Wert im Chart. Bevor die KI etwas schätzen kann, muss sie von etwas lernen können — und das heißt: Die historischen Projekte müssen sauber strukturiert und einheitlich getaggt in der Datenbasis vorliegen. Das ist in den meisten Boutique-Beratungen nicht der Fall. Realistisch vergehen 12–18 Wochen, davon 4–8 Wochen allein für Datenbereinigung und Strukturierung. Wer das unterschätzt, scheitert an diesem Schritt.
ROI-Sicherheit — mittel (3/5) Die Verbesserung der Kalkulationsgenauigkeit ist messbar: Abweichung Plan vs. Ist in Stunden, über Quartale verglichen. Dass diese Verbesserung kausal auf die KI zurückgeht und nicht auf einen erfahreneren Kalkulationsberater, ist schwerer zu isolieren. Der ROI ist real, aber die Beweiskette ist mittelmäßig sauber — vergleichbar mit anderen Effizienz-Investitionen im Beratungsbereich.
Skalierbarkeit — mittel (3/5) Das System skaliert mit dem Wachstum der Projektdatenbank — je mehr abgeschlossene Projekte, desto besser die Vergleichsbasis. Eine Firma mit 50 Projekten pro Jahr hat nach drei Jahren eine gute Datenbasis. Eine Firma mit 5 Projekten pro Jahr wartet deutlich länger. Und: Wenn die Firma in neue Branchen expandiert, ist die Vergleichsbasis zunächst wieder dünn.
Richtwerte — stark abhängig von Datenbankgröße, Einheitlichkeit der historischen Erfassung und Projektvolumen pro Jahr.
Was das System konkret macht
Der technische Ansatz kombiniert zwei Elemente: eine strukturierte Suche in historischen Projektdaten und ein LLM, das die Befunde in eine lesbare Risikoeinschätzung übersetzt.
Wenn ein neues Angebot kalibriert werden soll, gibt der Berater eine kurze Projektbeschreibung ein: Branche, Unternehmensgröße des Mandanten, Scope in groben Zügen, geplante Projektdauer, vorgesehene Teamzusammensetzung. Das System durchsucht dann die Datenbank abgeschlossener Projekte — nicht nach Schlüsselwörtern, sondern semantisch nach Ähnlichkeit — und gibt die 8–15 vergleichbarsten zurück, gerankt nach Relevanz.
Für jedes Vergleichsprojekt liegen idealerweise vor: geplante Stunden, tatsächlich gebuchte Stunden, Abweichung, Branche, Teamgröße, Seniorität der Berater, Dauer. Das LLM liest diese Menge aus, erkennt Muster und formuliert eine Risikoeinschätzung für das neue Mandat.
Ein typischer Output sieht so aus:
„Die 11 ähnlichsten abgeschlossenen Projekte (Restrukturierung, Maschinenbau, Mittelstand 200–500 MA) hatten einen medianen Ist-Aufwand von 1.980 Stunden, Spanne 1.400–2.800 Stunden. Dein Entwurf sieht 1.600 Stunden vor — das liegt im untersten Quartil der Vergleichsgruppe. Risikohinweis: Zwei der vier Projekte mit Überschreitungen über 30 % hatten einen Junior-Anteil über 50 % im Team. Dein geplantes Team: 60 % Junior. Empfehlung: Puffer von mindestens 300–400 Stunden einplanen oder Teamzusammensetzung anpassen.”
Das ist keine magische Prophezeiung — es ist das Erfahrungswissen der Firma, destilliert und sofort abrufbar. Kein Partnergespräch, kein „ich erinnere mich da an ein ähnliches Projekt von 2021” nötig.
Ankerbias: Warum Berater systematisch zu niedrig schätzen
Bevor wir über technische Lösungen reden, lohnt es sich, das eigentliche Problem beim Namen zu nennen: Berater unterschätzen Projektkosten nicht, weil sie schlechte Kalkulatoren wären. Sie unterschätzen, weil es rationale Gründe gibt, optimistisch zu schätzen.
Die Verhaltensforschung kennt das als Ankerbias (Anchoring Bias): Wenn eine erste Zahl im Raum ist — zum Beispiel das Budget, das der Mandant erwähnt hat, oder das Wettbewerbsangebot, das der Partner gehört hat — tendieren alle folgenden Schätzungen dazu, sich an dieser Zahl zu orientieren, statt unabhängig davon zu rechnen. Die ICEAA (International Cost Estimating and Analysis Association) dokumentiert dieses Muster ausführlich in ihrer 2024er Analyse zu Kalkulations-Biases: Projekte, die mit einer niedrigen Ankerzahl gestartet werden, enden systematisch mit Kostenüberschreitungen.
Daneben wirkt der Optimismus-Bias: Der Wunsch, den Auftrag zu gewinnen, führt dazu, dass Risiken kleiner gerechnet werden als sie tatsächlich sind. Nicht bewusst — aber strukturell. Wer kalkuliert, will gewinnen.
Die KI hat diesen Bias nicht. Sie hat keine Motivation, den Auftrag zu gewinnen. Sie liest die Ist-Werte der letzten zehn Jahre und rechnet damit — unabhängig davon, was der Mandant im Vorgespräch als Budget genannt hat.
Das ist der eigentliche Wert: nicht Zeitersparnis, sondern kognitive Entlastung und erzwungene Konfrontation mit der historischen Realität.
Datenqualität als Voraussetzung: Das unsichtbare Fundament
Hier liegt der Engpass, an dem die meisten Einführungsversuche scheitern — und er verdient eine eigene Betrachtung.
Eine KI kann nur lernen, was sauber erfasst ist. In der Praxis sieht die Projektdatenbank einer typischen Boutique-Beratung so aus: 40 Prozent der Projekte haben keine oder eine uneinheitliche Branchenklassifikation. Die Projektnamen sind intern gebräuchlich, aber extern bedeutungslos: „Projekt Alpha”, „Müller-Restrukturierung”, „Blauer Oktober”. Stunden werden gelegentlich pauschal nachgebucht statt laufend erfasst. Bei einem Drittel der abgeschlossenen Projekte fehlen die finalen Ist-Stunden ganz.
Das ist nicht Nachlässigkeit — das ist die normale Realität von Firmen, die ihren Fokus auf Kundenarbeit legen, nicht auf interne Datenerfassung. Aber für ein KI-Kalkulationssystem bedeutet es: Garbage in, garbage out. Ein Modell, das aus 80 schlecht strukturierten Projekten lernt, produziert Schätzungen, die genauso verwirrend sind wie die Eingangsdaten.
Was ihr vor der KI-Einführung aufräumen müsst:
-
Einheitliche Branchenklassifikation aller Projekte — mindestens Ebene 1 (z. B. Produktion, Handel, Dienstleistung). Besser: Ebene 2 (z. B. Maschinenbau, Medizintechnik, Automotive).
-
Einheitliche Scope-Kategorien — mindestens fünf bis sieben Kategorien, die die Hauptprojekttypen eurer Firma abdecken (Restrukturierung, Strategieentwicklung, IT-Implementierungsbegleitung, Post-Merger-Integration usw.).
-
Vollständige Ist-Stunden für alle Projekte der letzten drei bis fünf Jahre — gebuchte Stunden nach Projektphase, wenn möglich nach Senioritätsstufe.
-
Konsistente Zeiterfassung ab sofort — alle neuen Projekte müssen laufend und präzise gebucht werden. Monatliche Pauschaleinträge sind wertlos für die Kalkulation.
Dieser Aufräumschritt ist mühsam und dauert typisch vier bis acht Wochen. Er lohnt sich aber zweifach: einmal für die KI-gestützte Kalkulation, und einmal als ohnehin überfälliges Fundament für sauberes Projektcontrolling.
Tools, die dabei helfen, dieses Fundament aufzubauen: MOCO (EU-gehostet, speziell für Agenturen und Beratungen, hat Projektrentabilität auf Knopfdruck), Toggl Track (einfache, EU-konforme Zeiterfassung mit Projektstruktur und CSV-Export).
Stunden- vs. Festpreismandate: Warum es einen Unterschied macht
Nicht alle Projekte funktionieren nach derselben Kalkulationslogik — und das beeinflusst, was die KI leisten kann und was nicht.
Stundensatz-/Time-and-Material-Mandate haben das niedrigste Kalkulationsrisiko: Der Mandant zahlt gebuchte Stunden bis zu einem vereinbarten Budget-Cap. Überschreitung ist sichtbar, Nachverhandlung ist möglich. Hier hilft die KI primär bei der realistischen Budgetschätzung für den Cap, damit keine falsche Erwartungshaltung entsteht.
Festpreismandate tragen das Kalkulationsrisiko komplett auf eurer Seite. Jede unterschätzte Stunde ist direkte Margenerosion. Hier ist die KI-gestützte Kalkulation am wertvollsten — und gleichzeitig am kritischsten. Denn ein falsches Sicherheitsgefühl bei einem Festpreisangebot ist gefährlicher als gar keine KI-Unterstützung. Wenn das Modell aus unzureichenden Vergleichsprojekten eine scheinbar präzise Empfehlung generiert, kann das die Bereitschaft senken, kritisch zu hinterfragen.
Retainer-Mandate (monatliches Pauschalhonorar) sind kalkulatorisch das einfachste Modell — aber auch hier hilft die historische Analyse: Was hat ein vergleichbarer Retainer in der Vergangenheit tatsächlich an Aufwand erzeugt? Wurden Puffer systematisch unterschritten oder überschritten?
Praktische Konsequenz: Baut eure Projektdatenbank so auf, dass der Vertragstyp ein Pflichtfeld ist. Eine KI, die Festpreisprojekte mit Time-and-Material-Projekten vermengt, lernt aus systematisch gemischten Signalen — was die Schätzqualität senkt.
Konkrete Werkzeuge — was wann passt
Für ein KI-gestütztes Kalkulationssystem in einer Boutique-Beratung gibt es drei sinnvolle Ansätze, je nach Datenbasis und Budget.
Einstieg mit vorhandenen Tools — für den Anfang
NotebookLM (kostenlos) lässt sich als schnelles Proof-of-Concept nutzen: Lade 20–30 abgeschlossene Projektdokumentationen als PDFs hoch und frag das System nach vergleichbaren Projekten. Das ist kein produktives System, aber du siehst in 30 Minuten, ob das Prinzip funktioniert. Einschränkung: NotebookLM hat kein strukturiertes Datenbankformat und eignet sich nicht für viele Projekte.
ChatGPT (Enterprise, 30 USD/Person/Monat) oder Claude (Pro, 20 USD/Person/Monat) können für einen semi-strukturierten Ansatz genutzt werden: Erstelle eine CSV-Tabelle deiner abgeschlossenen Projekte mit den wichtigsten Attributen und lade sie als Kontext hoch. Das LLM kann dann Vergleichssuchen durchführen und Risikokommentare formulieren. Einfach, schnell einzurichten, aber nicht automatisiert.
Mittelstufe — strukturiertes System ohne Entwickleraufwand
Forecast.app (ab ca. 29 USD/Nutzer/Monat, nach Übernahme durch Accelo auf Anfrage) ist eine speziell für Professional-Services-Firmen entwickelte Plattform, die Predictive Analytics über laufende und abgeschlossene Projekte rechnet. Sie prognostiziert Margen, Ressourcenkonflikte und Budgetüberschreitungen auf Basis echter Delivery-Daten. Einschränkung: Kein deutschsprachiges Interface, US-Hosting, und mindestens 10–20 vergleichbare Projekte in der Datenbank nötig, damit die Prognosen belastbar werden.
MOCO (ab 15 Euro/Nutzer/Monat, EU-Hosting, DATEV-Schnittstelle) ist die empfehlenswertere Grundlage für den deutschen Markt: Die Plattform erfasst Stunden, zeigt Projektrentabilität in Echtzeit und liefert die Datenbasis, die ein KI-Kalkulationsassistent braucht. MOCO selbst ist keine KI-Kalkulations-Engine — aber als Datenquelle für ein darüber gelegtes LLM-System ist es ideal.
Vollausgebaute Lösung — für größere Firmen
Ein RAG-System über eine strukturierte Projektdatenbank (PostgreSQL, Airtable oder Notion) mit Microsoft 365 Copilot oder einer Custom-API-Lösung via OpenAI bietet maximale Kontrolle. Alle historischen Projekte werden als semantisch durchsuchbares Wissensrepositorium zugänglich. Das kostet in der Einrichtung 15.000–35.000 Euro externe Beratungsleistung, bietet aber dauerhaft die stärkste Kalkulationsunterstützung und lässt sich exakt auf die eigene Projektklassifikation ausrichten.
Zusammenfassung: Wann welcher Ansatz
- Pilot, Proof-of-Concept: NotebookLM + CSV-Tabelle
- Mittlere Firma, schneller Start, EU-konform: MOCO als Datenbasis + ChatGPT/Claude für Kalkulations-Analyse
- Wachsende Beratung mit 30+ Projekten/Jahr: Forecast.app oder Custom RAG
- Enterprise, vollintegriert: Custom RAG mit M365 Copilot
Datenschutz und Datenhaltung
Historische Projektdaten einer Unternehmensberatung enthalten fast immer vertrauliche Mandanteninformationen: Branche, Unternehmensgröße, Projektthema, manchmal auch Namen verantwortlicher Personen auf Mandantenseite. Das hat zwei DSGVO-relevante Konsequenzen.
Erstens: Wenn diese Daten in ein externes KI-System eingelesen werden — sei es ChatGPT, Claude oder ein US-gehostetes SaaS-Tool — braucht ihr einen Auftragsverarbeitungsvertrag (AVV) mit dem Anbieter (Art. 28 DSGVO). Das ist Standard und von allen gängigen Anbietern verfügbar, muss aber aktiv eingefordert und unterzeichnet werden.
Zweitens: Je sensibler die Mandanteninformationen, desto kritischer wird die Frage der Datenhaltung. Eine Unternehmensberatung, die für DAX-Konzerne oder regulierte Branchen (Banken, Versicherungen, Pharma) arbeitet, wird mit Mandanten oft spezifische Vertraulichkeitsvereinbarungen haben. Prüft, ob diese Vereinbarungen die Weitergabe von Projektdaten an KI-Systeme erlauben — und wenn nicht, ob anonymisierte Projektprofile (ohne Mandantenname, nur mit Branche und Eckdaten) ausreichen.
Für DSGVO-sensible Umgebungen empfehlen sich:
- MOCO — EU-Hosting Deutschland, DATEV-Schnittstelle, klar auf den deutschen Markt ausgerichtet
- Microsoft 365 Copilot — über das EU Data Boundary-Programm mit Verarbeitung in europäischen Rechenzentren konfigurierbar
- Custom RAG auf Azure (Germany West Central) — vollständige Datenkontrolle, AVV mit Microsoft
Nicht empfehlenswert bei sensiblen Mandantendaten: US-gehostete Tools ohne klare EU-Datenresidenz, GenAI-Consumer-Apps ohne Enterprise-Vertrag.
Was es kostet — realistisch gerechnet
Einmalige Einrichtungskosten
- Datenbereinigung und Strukturierung historischer Projekte: 4–8 Wochen interner Aufwand (ca. 0,5 Vollzeit-Äquivalent), entspricht 8.000–16.000 Euro Opportunitätskosten
- Externe Einrichtung eines einfachen Systems (CSV + LLM): 2.000–5.000 Euro
- Custom-RAG-System mit professioneller Datenbankstruktur: 15.000–35.000 Euro
Laufende Kosten (monatlich)
- ChatGPT Enterprise oder Claude Pro/Team: 20–30 Euro/Person/Monat für die Berater, die kalkulieren
- MOCO als Datenbasis: ab 15 Euro/Nutzer/Monat
- Forecast.app: Preise nach Übernahme auf Anfrage, historisch 29–60 USD/Nutzer/Monat
- Custom-RAG-Infrastruktur: 200–600 Euro/Monat
Konservativer ROI-Nachweis Die ehrlichste Methode, den Nutzen zu messen, ist keine Hochrechnung — es ist ein direkter Vorher-Nachher-Vergleich.
Nehmt eure letzte Jahreskohorte abgeschlossener Projekte: Was war die durchschnittliche Abweichung zwischen Kalkulation und tatsächlichem Aufwand? Wie viele Projekte waren im Minus?
Wenn die Firma 30 Projekte pro Jahr abschließt, im Schnitt 150.000 Euro Auftragsvolumen, und 25 Prozent der Projekte um 15–20 Prozent überschreiten — dann sind das ca. 7–8 Projekte mit zusammen 350.000–450.000 Euro Überschreitungsvolumen. Eine Reduktion der Überschreitungsquote um die Hälfte durch bessere Kalkulation entspricht 175.000–225.000 Euro gesicherter Marge pro Jahr. Verglichen mit einem Systemaufwand von 30.000–50.000 Euro für die Einrichtung: Der Payback liegt unter sechs Monaten — sofern die Datenbasis stimmt.
Wichtig: Diese Rechnung ist hypothetisch, bis ihr sie mit euren eigenen Zahlen macht. Tut das vor der Entscheidung.
Vier typische Einstiegsfehler
1. Mit der KI starten, bevor die Daten sauber sind. Der häufigste Fehler. Das System wird eingerichtet, lernt aus unstrukturierten, inkonsistent getaggten Projekten und gibt Empfehlungen, die intuitiv plausibel klingen, aber statistisch bedeutungslos sind. Das Ergebnis: das Team vertraut der Ausgabe des Systems — und schätzt falsch. Ein KI-Kalkulationssystem, das aus schlechten Daten lernt, ist gefährlicher als gar keine KI, weil es dem schlechten Urteil einen Anschein von Objektivität verleiht.
2. Den Unterschied zwischen Angebots- und Projektmanagement-Funktion vermischen. Die KI schätzt den Aufwand. Sie hilft nicht beim Schreiben des Angebots (das ist UC06, Angebotserstellung für Beratungsprojekte). Wer beide Probleme auf einmal lösen will, kauft Komplexität, die er nicht braucht. Besser: zuerst die Kalkulations-Datenbasis sauber machen, dann die Angebotserstellung automatisieren.
3. Das System als Entscheidungsautomaten behandeln. Die KI gibt eine Empfehlung — keine Entscheidung. Der Engagement Manager oder Partner trifft die finale Kalkulation. Wenn das Team anfängt, die KI-Ausgabe einfach zu übernehmen ohne kritische Einschätzung, verliert das Unternehmen genau das, was Berater wertvoll macht: kontextuelles Urteilsvermögen. Die KI soll Fragen aufwerfen, keine Antworten geben.
4. Keine laufende Zeiterfassung nach der Einführung. Das ist der Wartungsfehler, der still passiert. Die historische Datenbasis ist bereinigt, das System läuft. Aber wenn die neuen Projekte nicht konsequent und vollständig mit tatsächlichen Stunden gebucht werden, veraltet die Datenbasis. Zwei Jahre später lernt das System immer noch aus den alten Projekten — während die Firma andere Projekttypen, andere Teamstrukturen und andere Komplexitätsniveaus hat.
Was mit der Einführung wirklich passiert — und was nicht
Die größte Überraschung bei der Einführung ist meistens nicht technischer Natur. Sie ist menschlich.
Der Widerstand der Seniorpartner. Die Partner, die seit Jahren aus dem Bauch schätzen und damit in der Regel recht hatten, werden die KI-Empfehlung als Infragestellung ihrer Kompetenz lesen. Das ist nicht ausgesprochen, aber gefühlt. Was hilft: die Framing-Frage konsequent umdrehen. Nicht „Die KI überprüft deine Schätzung”, sondern „Die KI gibt dir die Datenbasis, damit du begründen kannst, warum deine Einschätzung richtig ist.” Wenn die KI sagt, vergleichbare Projekte lagen bei 1.800 Stunden, und der Partner ist überzeugt, dass dieses Projekt mit 1.400 auskommt — dann ist das eine dokumentierte Begründung für die niedrigere Kalkulation, keine Fehlermarkierung.
Die Junior-Berater profitieren am meisten. Neue Berater haben keine Vergleichsprojekte im Kopf. Sie brauchen für eine Kalkulation entweder einen erfahrenen Kollegen, der Zeit hat, oder sie schätzen mit dem, was sie haben — was oft zu wenig ist. Ein KI-Kalkulationsassistent gibt Junior-Beratern sofort Zugang zum kollektiven Erfahrungswissen der Firma. Das ist der schnellste messbare Benefit.
Die Datenerfassung wird eine Dauer-Diskussion. Sobald das System läuft und alle sehen, dass die Qualität der Empfehlungen direkt von der Qualität der gebuchten Stunden abhängt, entsteht eine natürliche Motivation für bessere Zeiterfassung. Nutzt das. Ein monatlicher Check — „Sind alle abgeschlossenen Projekte vollständig im System?” — ist kein bürokratischer Aufwand, sondern die wichtigste Qualitätssicherungsmaßnahme des Systems.
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Datenbasis-Audit | Woche 1–2 | Bestandsaufnahme der historischen Projektdaten: Vollständigkeit, Branchenklassifikation, Stundenwerte | Mehr fehlende Daten als erwartet — Priorität setzen: nur die letzten 3 Jahre bereinigen |
| Datenbereinigung | Woche 3–8 | Projekte einheitlich klassifizieren, fehlende Ist-Stunden ergänzen, Projektnamen normalisieren | Zeitaufwand wird unterschätzt — halbe Stellen nötig, die für anderes eingeplant waren |
| System-Setup | Woche 8–10 | Tool-Auswahl finalisieren, Datenbasis einspielen, erste Kalkulations-Tests | Integration mit bestehendem CRM dauert länger als geplant |
| Pilotphase | Woche 10–14 | 3–5 aktuelle Angebote werden parallel zur traditionellen Methode mit KI kalkuliert | Empfehlungen weichen stark von Intuition ab — ohne Erklärung sinkt die Akzeptanz |
| Einführung | Woche 14–18 | Alle kalkulierenden Berater werden eingebunden, Feedback-Loop eingerichtet | Nutzung in der Hektik von Angebotsphasen vergessen — Erinnerung und Champion-Rolle nötig |
Hinweis: Die Pilotphase ist nicht optional. Wenn das System direkt für echte Angebote genutzt wird, ohne vorherige Validierung an bekannten Projekten, ist das Risiko zu hoch, dass eine falsche Empfehlung als korrekt übernommen wird.
Häufige Einwände — und was dahintersteckt
„Unsere Projekte sind alle einzigartig — Vergleiche funktionieren nicht.” Das stimmt für einen Teil der Projekte. Aber nicht für alle. Jede Beratung hat Projekttypen, die sich wiederholen — vielleicht nicht identisch, aber strukturell ähnlich. Eine Post-Merger-Integration in der Lebensmittelbranche ist anders als eine im Maschinenbau, aber die Grundmuster der Aufwandsverteilung sind erkennbar vergleichbar. Das System muss keine perfekten Kopien finden — es muss relevante Signale extrahieren.
„Wenn die KI falsch liegt, verlieren wir das Mandat oder ruinieren die Marge.” Das ist die richtige Frage — und der Grund, warum das System nicht als Entscheidungsautomat funktioniert. Die KI liefert einen Ausgangspunkt und Risikosignale. Die finale Zahl verantwortet der Mensch. Das Risiko ist nicht höher als heute — es ist strukturierter.
„Unsere Berater buchen Stunden nie konsequent.” Das ist kein Argument gegen das System — das ist das Argument dafür, dass ihr ein Problem habt, das ihr lösen müsst, unabhängig von der KI. Fehlende Stundenbuchungen schaden eurem Projektcontrolling, eurer Abrechnung und eurer Kapazitätsplanung. Die KI ist der Anlass, dieses Problem endlich anzugehen. Wer sagt „Wir können das System nicht einführen, weil wir keine Daten haben” — dem fehlt die Prämisse auch für jede andere Controlling-Funktion.
„Das lohnt sich erst ab einer gewissen Firmengröße.” Das stimmt im Kern, ist aber unpräzise. Die kritische Größe ist nicht die Mitarbeiterzahl, sondern die Zahl der Vergleichsprojekte. Eine Firma mit 15 Beratern und 40 Projekten pro Jahr hat nach drei Jahren eine bessere Datenbasis als eine Firma mit 80 Beratern und 8 Projekten pro Jahr.
Woran du merkst, dass das zu dir passt
- Ihr habt in den letzten zwei Jahren mindestens zwei Mandate erlebt, die am Ende deutlich mehr Stunden verschlungen haben als kalkuliert — und ihr wisst nicht genau, warum
- Eure Kalkulations-Meetings enden regelmäßig mit einem „Ich mache das mal Pi-mal-Daumen” eines Seniorpartners, weil niemand wirklich Vergleichsdaten hat
- Neue Berater kommen zu euch und lernen Kalkulation ausschließlich durch Beobachtung erfahrener Kollegen — ein strukturierter Datenzugang existiert nicht
- Ihr macht mehr als 20 Projekte pro Jahr in mindestens zwei bis drei wiederkehrenden Projekttypen
- Ihr habt eine Zeiterfassung, die auch wirklich genutzt wird — oder ihr seid bereit, die Einführung einer konsequenten Zeiterfassung parallel anzugehen
- Der Preisdruck durch Wettbewerber führt dazu, dass ihr Angebote schärfer kalkuliert, als eigentlich sinnvoll wäre — um den Auftrag zu gewinnen
Wann es sich (noch) nicht lohnt — drei harte Ausschlusskriterien:
-
Weniger als 15–20 abgeschlossene Projekte pro Jahr im gleichen Projekttyp. Darunter hat das System zu wenig Vergleichsmaterial. Die Empfehlungen sind statistisch bedeutungslos — und die Gefahr, eine scheinbar präzise aber tatsächlich zufällige Schätzung als belastbar zu behandeln, ist hoch. Wartet, bis die Datenbasis gewachsen ist.
-
Keine konsistente Zeiterfassung. Wenn Stunden pauschal, verspätet oder gar nicht gebucht werden, habt ihr keine Ist-Werte — und damit keine Lerndaten. Das KI-Kalkulationssystem braucht tatsächliche Ist-Stunden, keine Planwerte. Löst das Zeiterfassungsproblem zuerst.
-
Alle Mandate sind echte Unikate ohne vergleichbare Vorgänger. Wenn ihr ausschließlich hochgradig individuelle Einmal-Mandate macht (z. B. sehr spezialisierte Regulierungsberatung für neue Jurisdiktionen) und jeder Auftrag wirklich ein Greenfield-Projekt ist, hat die historische Analyse keinen Ankerpunkt. In diesem Fall ist das Erfahrungsurteil des Beraters die einzige valide Schätzquelle.
Das kannst du heute noch tun
Bevor ihr in ein Tool investiert: Macht zuerst die Bestandsaufnahme eurer historischen Daten. Das dauert zwei Stunden und zeigt euch, ob ihr überhaupt eine brauchbare Datenbasis habt.
Öffnet NotebookLM — kostenlos, kein Setup. Exportiert fünf bis zehn eurer abgeschlossenen Projektdokumentationen (Abschlussberichte, Stunden-Reports, Projektbriefings) als PDFs und ladet sie hoch. Stellt dann folgende Frage:
„Welches dieser Projekte wäre am vergleichbarsten mit einem neuen Restrukturierungsmandat bei einem Maschinenbauer mit 300 Mitarbeitern, geplanter Laufzeit 6 Monate, und was war der tatsächliche Stundenaufwand beim ähnlichsten Projekt?”
Das zeigt euch zwei Dinge: ob das Konzept grundsätzlich funktioniert, und wie gut eure vorhandenen Dokumente als Datenbasis geeignet sind. Wenn NotebookLM antwortet „Dazu finde ich keine spezifischen Stundenwerte in den Unterlagen” — dann habt ihr das Datenproblem bereits identifiziert, bevor ihr einen Cent ausgegeben habt.
Für den produktiven Einsatz mit einer aufgebauten Projektdatenbank:
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- PMI Pulse of the Profession 2021 — Budgeteinhaltung: Project Management Institute, „Pulse of the Profession 2021”, Survey n = 3.168. Befund: Nur 62 % der Projekte halten das ursprünglich geplante Budget ein.
- BDU Branchenstudie 2023 — Deutscher Beratungsmarkt: Bundesverband Deutscher Unternehmensberatungen (BDU), „Branchenstudie 2023”. Deutschen Beratungsmarkt 2025: ca. 49 Mrd. Euro Umsatz, über 243.000 Beschäftigte.
- ICEAA 2024 — Kalkulations-Biases: International Cost Estimating and Analysis Association (ICEAA), „Biases in Project Estimating and Mitigation Strategies to Overcome Them”, Glauser (2024). Dokumentiert Ankerbias und Optimismus-Bias in der Projektkostenabschätzung systematisch.
- Garbage-in-Garbage-out / Datenqualität: Sama, „Garbage In, Garbage Out: Why Data Accuracy Matters for AI Models” (2024); MIT Technology Review, „AI trained on AI garbage” (Juli 2024). Beleg für 15-%-Fehlerquote bei Trainingsdaten als Qualitätsschwelle.
- Implementierungskosten und Erfahrungswerte: Erfahrungswerte aus Professional-Services-Projekten mit KI-Kalkulationssystemen bei Firmen mit 15–80 Beratern (Stand April 2026). Keine repräsentative Studie.
- Preisangaben Tools: Veröffentlichte Tarife der Anbieter (MOCO, Toggl Track, ChatGPT, Claude, Forecast.app nach Accelo-Übernahme) Stand April–Mai 2026. Forecast.app: Preise nach Übernahme auf Anfrage, historische Preise aus Anbieter-Archiv.
Du willst einschätzen, ob eure Projektdatenbank als Grundlage ausreicht, und welcher Ansatz für eure Firmengröße sinnvoll ist? Meld dich — das klären wir in einem kurzen Gespräch ohne Verkaufsgespräch.
Diesen Inhalt teilen:
Interesse an diesem Use Case?
Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.
Weitere Use Cases
Projektdokumentation automatisieren
KI erstellt automatisch Projektdokumentationen aus Meeting-Notizen, E-Mails und Arbeitsergebnissen. Berater dokumentieren weniger und arbeiten mehr.
Mehr erfahrenKundenpräsentation-Assistent
KI erstellt Gerüste für Kundenpräsentationen aus Analyseergebnissen und Projektvorgaben. Story-Struktur, Foliengliederung und erste Textinhalte automatisch generiert.
Mehr erfahrenMarktanalyse mit KI beschleunigen
KI durchsucht und synthetisiert Marktdaten, Studien und Brancheninformationen für Erstanalysen. Sekundärrecherche von Tagen auf Stunden reduziert.
Mehr erfahren