Zum Inhalt springen
Branchenübergreifend hrmitarbeitergesprächperformance

KI-Unterstützung bei Mitarbeitergesprächen und Performance-Reviews

KI bereitet Führungskräfte auf Jahresgespräche vor — analysiert Leistungsdaten, Feedback-Quellen und Gesprächshistorie, schlägt Gesprächsstruktur und konkrete Entwicklungsmaßnahmen vor.

⚡ Auf einen Blick
Problem
Führungskräfte bereiten Mitarbeitergespräche unter Zeitdruck und ohne strukturierte Grundlage vor — Feedback bleibt vage, Entwicklungsmaßnahmen unkonkret und die Gesprächsqualität hängt von der Tagesform der Führungskraft ab.
KI-Lösung
KI aggregiert Leistungsdaten, 360-Grad-Feedback und Zielvereinbarungen der Vorperiode, strukturiert die Erkenntnisse und erstellt eine konkrete Gesprächsvorbereitung mit Agenda, Stärken-Schwächen-Profil und Entwicklungsvorschlägen.
Typischer Nutzen
Vorbereitungszeit pro Mitarbeitergespräch von 1–2 Stunden auf 20–30 Minuten reduzieren und Feedbackqualität durch strukturiertere und datenbasierte Gesprächsvorbereitung verbessern.
Setup-Zeit
1–3 Wochen bis erste Vorlagen und Workflows einsatzbereit
Kosteneinschätzung
0–500 € Einrichtung, 25–30 €/Person/Monat laufend
LLM mit Prompt-Vorlage (ChatGPT/Claude Team)M365 Copilot auf bestehende Teams/SharePoint-DatenPerformance-Plattform mit KI-Modul (Leapsome, Personio)
Worum geht's?

Es ist Montag, 19:47 Uhr.

Sandra Bauer, Teamleiterin in einem mittelständischen Softwarehaus, sitzt vor acht leeren Gesprächsvorbereitungsbögen. Nächste Woche: Jahresgesprächssaison. Acht Termine, acht Personen, acht Stunden Gesprächsvorbereitung — irgendwie noch vor dem Sprint-Review am Donnerstag unterzubringen.

Sie öffnet die Word-Vorlage aus dem letzten Jahr. Das Feld „Entwicklungsmaßnahmen” für Tobias: leer. Sie erinnert sich vage, dass es Anfang des Jahres Ärger wegen der Kundenübergabe gab, aber wie das ausging — keine Ahnung. Bei Laila weiß sie noch weniger. Laila ist erst seit August im Team, technisch gut, aber wie war das mit dem Onboarding-Feedback? Irgendwo in Teams, irgendwann.

Sandra öffnet Teams. Dann SharePoint. Dann die alten Gesprächsprotokolle vom Vorjahr. Dann die Zielvereinbarungen aus März. Kein einheitliches System, kein zentraler Ort, keine Verbindung zwischen den Dokumenten.

Um 21:12 hat sie zwei von acht Bögen ausgefüllt — beide vage, beide auf Basis von dem, was ihr gerade einfällt. Die anderen sechs Menschen werden morgen in Gespräche gehen, die ihre Führungskraft in einer Stunde pro Person vorbereitet hat. Oder weniger.

Das echte Ausmaß des Problems

Laut einer häufig zitierten Erhebung der Society for Human Resource Management (SHRM, 2015) verbringen Führungskräfte im Schnitt mehr als 210 Stunden pro Jahr mit Performance-Management-Aktivitäten — das entspricht über fünf Wochen Vollzeitarbeit. Der größte Teil davon entfällt auf Vorbereitung, Dokumentation und Nachbereitung von Gesprächen, nicht auf die Gespräche selbst.

Das Problem ist nicht mangelndes Interesse. Die meisten Führungskräfte wissen, wie wichtig ein gut vorbereitetes Mitarbeitergespräch ist — für Motivation, Entwicklung, Bindung. Das Problem ist strukturell: Relevante Informationen sind über viele Systeme verteilt, liegen in unterschiedlichen Formaten vor und lassen sich nicht in 20 Minuten überblicken.

Was eine gute Gesprächsvorbereitung eigentlich braucht:

  • Die Zielvereinbarungen aus dem Vorjahr — was war vereinbart, was wurde erreicht, was blieb offen?
  • Projektlogs und Meilensteine aus dem Jahr
  • Feedback von Kolleginnen und Kollegen, sofern vorhanden
  • Gesprächsprotokolle aus unterjährigen Feedbackgesprächen
  • Konkrete Vorfälle — positive und kritische — als Gesprächsgrundlage
  • Entwicklungswünsche der Mitarbeitenden, geäußert im Laufe des Jahres

In der Praxis liegt nichts davon gebündelt vor. Führungskräfte mit fünf oder mehr direkten Berichten schieben die Vorbereitung deshalb bis kurz vor den Gesprächstermin auf — nicht weil sie zu wenig kümmern, sondern weil der Aufwand realistisch nicht leistbar ist. Das Ergebnis: Feedback bleibt allgemein, Entwicklungsmaßnahmen unkonkret und die Gesprächsqualität hängt davon ab, wie gut das Gedächtnis der Führungskraft gerade arbeitet.

Die Folgekosten sind schwerer zu messen, aber real: laut Gallup sind Mitarbeitende, die regelmäßig qualitatives Feedback erhalten, dreimal häufiger engagiert als solche, die es nicht bekommen — und Engagement hat direkte Auswirkungen auf Produktivität und Fluktuation.

Mit vs. ohne KI — ein ehrlicher Vergleich

KennzahlOhne KI-UnterstützungMit KI-Unterstützung
Vorbereitungszeit pro Gespräch60–120 Minuten15–30 Minuten ¹
Qualität der GesprächsstrukturAbhängig von Tagesform und ErinnerungKonsistent, strukturiert, dokumentenbasiert
Abdeckung aller MitarbeitendenTendenziell ungleichmäßigGleicher Aufwand für alle
Formulierungen für schwierige ThemenEigenrecherche oder aus dem Bauch herausKonkrete Sprachvorschläge auf Abruf
EntwicklungsmaßnahmenOft generisch oder leerAn Gesprächshistorie und Zielen ausgerichtet
GesprächsprotokollManuell, oft unvollständigStrukturiert nachbereitbar mit KI-Unterstützung

¹ Erfahrungswerte aus Praxisberichten; hängt stark davon ab, wie vollständig die Datenlage ist.

Der Effekt ist nicht, dass KI die Führungskraft ersetzt — sondern dass sie von der Aufgabe entlastet wird, verstreute Informationen manuell zusammenzutragen, bevor das eigentliche Nachdenken beginnen kann.

Einschätzung auf einen Blick

Zeitersparnis — mittel (3/5) Die Einsparung pro Gespräch ist real: 45–90 Minuten weniger Vorbereitungsaufwand sind für Führungskräfte mit vielen direkten Berichten spürbar. Warum nicht höher? Der Zeiteffekt hängt stark davon ab, wie gut die Ausgangslage ist. Wer keine strukturierten Notizen, keine dokumentierten Ziele und keine Feedback-Aufzeichnungen hat, kann auch wenig zusammenfassen lassen. Und der eigentliche Gesprächsteil — Empathie, Coaching, Konfliktklärung — ist nicht substituierbar. Verglichen mit Meeting-Protokollen oder Berichterstellung, wo KI den Großteil eines Outputs direkt liefert, bleibt die Einsparung hier auf die Vorbereitungsphase begrenzt.

Kosteneinsparung — niedrig (1/5) Das ist der schwächste Wert dieses Anwendungsfalls — und das ist ehrlich gemeint. Mitarbeitergespräche besser vorzubereiten spart keine direkten Kosten. Der Nutzen liegt in Qualitätssteigerung, langfristiger Mitarbeiterbindung und Entwicklung — Dinge, die sich schwer direkt monetarisieren lassen. Wer eine Kosten-Nutzen-Rechnung aufstellen will, muss mit Fluktuationskosten arbeiten: Eine nicht rechtzeitig erkannte Unzufriedenheit, die zu einer Kündigung führt, kostet erfahrungsgemäß 6–12 Bruttomonatsgehälter. Aber dieser Zusammenhang lässt sich nicht sauber isolieren.

Schnelle Umsetzung — hoch (4/5) Das ist der stärkste Wert. Wer einen LLM wie ChatGPT oder Claude nutzt, kann heute noch einen ersten Gesprächsleitfaden erstellen — kein Setup, kein Onboarding. Selbst eine dedizierte Plattform wie Leapsome ist nach 1–3 Wochen für erste Gespräche einsatzbereit. Verglichen mit fast allen anderen Anwendungsfällen in dieser Kategorie ist das Einstiegsrisiko minimal.

ROI-Sicherheit — niedrig (2/5) Ob und wie stark sich die Gesprächsqualität verbessert, ist schwer zu messen. Feedback ist subjektiv, Entwicklungsmaßnahmen wirken langfristig, und ob ein Mitarbeitender das Gespräch als besonders wertvoll erlebt hat, hängt von vielen Faktoren ab. Wer einen klaren, messbaren ROI innerhalb von drei Monaten erwartet, ist bei der Rechnungsverarbeitung oder Qualitätssicherung besser aufgehoben.

Skalierbarkeit — mittel (3/5) Mit jeder weiteren Führungskraft, die das System nutzt, sinkt der Aufwand pro Gespräch. Die Skalierung ist real — aber nicht unbegrenzt. Ein LLM-Prompt funktioniert mit 5 oder 50 Gesprächen gleich gut. Eine spezialisierte Plattform wie Leapsome skaliert mit dem Unternehmen, braucht aber Pflege und Administrations-Aufwand, der mit der Mitarbeiterzahl wächst.

Richtwerte — stark abhängig von vorhandener Datenlage, Führungsspanne und Reifegrad des Feedback-Systems.

Was das System konkret macht

Der Ansatz ist einfacher als er klingt. Du gibst einem LLM die verfügbaren Informationen zu einem Mitarbeitenden — Zielvereinbarungen, Gesprächsnotizen, Feedback-Kommentare, relevante Projekte — und fragst ihn, daraus eine strukturierte Gesprächsvorbereitung zu erstellen.

Das Ergebnis ist kein Urteil, das der LLM über die Person fällt. Es ist eine Aggregationsleistung: Was liegt vor? Was ist auffällig? Welche Themen tauchen wiederholt auf? Was wurde vereinbart und blieb offen? Die KI bringt diese Informationen in eine Struktur, aus der die Führungskraft dann das Gespräch gestaltet.

Was in der Praxis entsteht

Statt eines leeren Vorbereitungsbogens bekommst du:

  • Eine Zusammenfassung der Jahresleistung auf Basis der vorliegenden Notizen und Ziele
  • Einen Stärken-Schwächen-Überblick basierend auf konkreten Beispielen — nicht auf vagen Eindrücken
  • Vorschläge für Entwicklungsmaßnahmen, die zu den erkannten Mustern passen
  • Gesprächseinstieg und Leitfragen für schwierige Themen (z. B. wenn Ziele klar verfehlt wurden)
  • Formulierungshilfen für kritisches Feedback, das konstruktiv bleibt

Wichtig zu verstehen: Der LLM kann nur synthetisieren, was du ihm gibst. Wer keine strukturierten Notizen hat, bekommt eine dünnere Vorbereitung. Das System hat kein geheimes Wissen über die Mitarbeitenden — es arbeitet mit dem, was du weißt und dokumentiert hast.

Ein verbreiteter Einstieg ohne spezialisiertes Tool: Alle verfügbaren Informationen (Zielvereinbarungen, Projektnotizen, E-Mail-Auszüge) in ein Word-Dokument kopieren, dieses als Anhang in Claude oder ChatGPT hochladen, und dann mit einem strukturierten Prompt die Gesprächsvorbereitung anfordern.

Konkrete Werkzeuge — was wann passt

Die Werkzeugwahl hängt davon ab, wie viel Infrastruktur ihr bereits habt und wie systematisch ihr das einführen wollt.

ChatGPT oder Claude — der pragmatische Einstieg Kein Setup, kein Vertrag, keine IT-Abteilung notwendig. Du lädst deine Notizen und Zieldokumente hoch, formulierst einen Prompt und bekommst eine strukturierte Gesprächsvorbereitung zurück. Für Personaldaten gilt: mindestens ChatGPT Team (ca. 25–30 USD/Person/Monat) oder Claude Team (ca. 25–30 USD/Person/Monat) — diese Pläne enthalten den AVV und schließen Training auf euren Daten aus. Plus- oder Pro-Tarife (je ca. 20 USD/Monat) und vor allem die kostenfreien Tarife sind für HR-Daten nicht geeignet, weil Eingaben dort für Modelltraining genutzt werden können (siehe Datenschutz-Abschnitt unten).

Microsoft 365 Copilot — wenn ihr schon M365 nutzt Wer Teams, SharePoint und Word bereits im Einsatz hat, kann M365 Copilot direkt auf bestehende Dokumente zugreifen lassen — Gesprächsnotizen aus Teams, Zieldokumente aus SharePoint, E-Mails. Copilot kann Zusammenfassungen und Gesprächsleitfäden direkt in Word erstellen. Kosten: ca. 30 Euro/Person/Monat zusätzlich zur M365-Lizenz. Lohnt sich besonders, wenn Führungskräfte das Gespräch und die Nachbereitung in Word führen.

Leapsome — wenn ihr einen strukturierten Review-Prozess wollt Leapsome (Berlin, EU-Datenhosting) ist eine spezialisierte Performance-Management-Plattform, die 360-Grad-Feedback, Zielmanagement und Mitarbeitergespräche in einer Oberfläche zusammenführt. Die integrierte KI fasst Feedback-Kommentare und Review-Daten pro Mitarbeitendem zusammen — Führungskräfte bekommen eine strukturierte Übersicht, kein leeres Formular. Preis: ca. 8–15 USD/Person/Monat je nach Modulauswahl. Sinnvoll ab ca. 20 Mitarbeitenden, wenn ihr konsistente Qualität über alle Führungskräfte hinweg sicherstellen wollt.

Personio mit Performance-Modul — wenn ihr Personio bereits habt Personio bietet ein optionales Performance & Entwicklung-Add-on, das Gesprächsdokumentation, Zielvereinbarungen und Feedback-Prozesse in die bestehende HR-Infrastruktur integriert. Wer Personio bereits für Zeiterfassung und Personalverwaltung nutzt, sollte prüfen, ob das Modul einen eigenständigen Tool-Wechsel erübrigt. KI-Unterstützung ist derzeit weniger ausgeprägt als bei Leapsome.

Zusammenfassung: Wann welcher Ansatz

  • Erste Gespräche diese Woche → ChatGPT oder Claude
  • Schon in M365 zuhause → M365 Copilot
  • Strukturierter Prozess für das ganze Unternehmen, DSGVO-sensibel → Leapsome
  • Bereits Personio-Kunde → Personio Performance-Modul prüfen

Datenschutz und Datenhaltung

Mitarbeitergespräche berühren besonders sensible Personaldaten — Leistungsbeurteilungen, Entwicklungsschwächen, persönliche Konflikte, Gehaltsverhandlungen. Das sind DSGVO-relevante Daten nach Art. 4 DSGVO, und die Verarbeitung durch ein KI-System erfordert eine sorgfältige Abwägung.

Was das konkret bedeutet:

Sobald du Informationen zu einer namentlich bekannten Person in ein KI-System eingibst — auch nur Notizen wie „Max hat im Q3 das Projekt X abgeliefert, aber die Kundenkommunikation war schwach” — verarbeitest du personenbezogene Daten im Sinne der DSGVO. Das System, das diese Daten verarbeitet, muss entweder per Auftragsverarbeitungsvertrag (AVV) nach Art. 28 DSGVO eingebunden sein, oder die Daten dürfen das Unternehmen nicht verlassen (lokale oder EU-gehostete Lösung).

Tool-Übersicht aus Datenschutzsicht:

  • ChatGPT Team / Business (OpenAI): US-Hosting, aber kein Training auf Kundendaten im Business-Plan. AVV erhältlich. Für den kostenfreien Plan oder Plus: kein AVV vorhanden — Personaldaten dort nicht eingeben.
  • Claude Team / Business (Anthropic): Ebenfalls US-Hosting, kein Training auf Eingaben im Team-Plan. AVV erhältlich. Gleiche Einschränkung für kostenfreie Pläne.
  • M365 Copilot (Microsoft): EU Data Boundary konfigurierbar — Daten bleiben dann in europäischen Rechenzentren. AVV standardmäßig enthalten. Für HR-Daten empfehlenswert.
  • Leapsome: EU-Datenhosting (AWS EEA), Berliner Unternehmen, DSGVO-konform, AVV im Standard-Vertrag enthalten. Für Personaldaten die datenschutzrechtlich sauberste Wahl unter den spezialisierten Tools.
  • Personio: Ebenfalls EU-Hosting (Frankfurt/AWS), ISO-zertifiziert, AVV inklusive.

Praktische Empfehlung: Für den LLM-basierten Einstieg (ChatGPT oder Claude): Personendaten pseudonymisieren oder minimieren — statt voller Name ein Kürzel verwenden, keine konkreten Gehaltsangaben, keine Krankheitsdaten. Das reduziert das DSGVO-Risiko erheblich und ist für die Qualität der Gesprächsvorbereitung meist ausreichend.

Betriebsrat und KI — was ihr rechtlich klären müsst

Dieser Aspekt wird in der Praxis häufig übersehen — und kann bei einem Betriebsrat teuer werden.

Wenn ihr ein KI-System einführt, das Mitarbeitende in irgendeiner Form bewertet oder beurteilt, greift § 87 Abs. 1 Nr. 6 BetrVG: Der Betriebsrat hat ein Mitbestimmungsrecht bei der Einführung und Anwendung technischer Einrichtungen, die dazu geeignet sind, Verhalten oder Leistung der Arbeitnehmer zu überwachen. Ein KI-System, das Leistungsdaten aggregiert und Gesprächsvorbereitungen erstellt, fällt genau darunter.

Das bedeutet konkret: Ohne Betriebsvereinbarung keine Einführung, wenn ein Betriebsrat vorhanden ist. Wer das übersieht, riskiert eine Einigungsstelle oder eine Unterlassungsklage.

Was ihr tun solltet:

  1. Frühzeitig (vor dem Pilotbetrieb) mit dem Betriebsrat sprechen — nicht als Pflichterfüllung, sondern weil die Akzeptanz im Team von dieser Einbindung abhängt
  2. Schriftlich klären: Welche Daten fließen in das System? Wer hat Zugriff auf die KI-Ausgabe? Wird das Ergebnis gespeichert?
  3. Im Zweifelsfall: eine kurze rechtliche Einschätzung einholen — die Kosten sind überschaubar, das Unterlassen kann teuer werden

Kein Betriebsrat? Auch dann gilt die DSGVO vollständig. Und wenn einer gegründet wird — was passiert, wenn ein nicht genehmigtes System bereits läuft? Besser vorher klären.

Was es kostet — realistisch gerechnet

Für den LLM-basierten Einstieg (ChatGPT oder Claude)

  • ChatGPT Team oder Claude Team: ca. 25–30 USD/Monat pro aktiver Führungskraft
  • Bei 5 Führungskräften: ca. 125–150 USD/Monat
  • Einrichtungsaufwand: 1–3 Stunden für Prompt-Entwicklung und Test
  • Lernkurve: 1–2 Gesprächszyklen, bis die Prompts wirklich gut sitzen

Für eine dedizierte Plattform (Leapsome)

  • ca. 8–15 USD/Person/Monat für das Unternehmen
  • Bei 30 Mitarbeitenden: ca. 240–450 USD/Monat
  • Implementierungsaufwand: 2–4 Wochen für Konfiguration und Einführung
  • Einmalige Setup-Kosten: je nach Aufwand intern oder mit externer Begleitung

Was du dagegenrechnen kannst: Laut SHRM (2015, ältere Erhebung — keine vergleichbar breite Studie seither) verbringen Führungskräfte über 210 Stunden pro Jahr mit Performance-Management. Wenn du 60 Minuten pro Gespräch Vorbereitung sparst und jede Führungskraft 8–10 Gespräche pro Jahr führt, sind das 8–10 Stunden eingesparte Führungszeit pro Person und Jahr. Bei einem internen Stundensatz von 50–87 Euro (entspricht einem Tagessatz von 400–700 Euro auf Vollkostenbasis): 400–870 Euro Zeitwert pro Führungskraft und Jahr.

Hochgerechnet auf eine Organisation mit 10 Führungskräften: 10 × 8–10 Stunden × 50–87 Euro = rund 4.000–8.700 Euro Zeitwert pro Jahr. Dem stehen Tool-Kosten gegenüber: bei 10 Führungskräften auf ChatGPT Team oder Claude Team ca. 250–300 USD/Monat = rund 2.800–3.400 Euro/Jahr.

Das ist keine scharfe ROI-Rechnung — zu viele Variablen sind zu weich. Bei einer einzelnen Führungskraft amortisieren sich die Tool-Kosten (rund 300 Euro/Jahr) durch die Zeitersparnis allein knapp; der eigentliche Hebel entsteht erst in der Skalierung über mehrere Führungskräfte hinweg. In der Praxis liegt der Effekt in den ersten Monaten oft bei 40–60 Prozent dieser theoretischen Zahl, weil sich die volle Zeitersparnis erst nach ein bis zwei Gesprächszyklen einstellt.

Was die Rechnung nicht erfasst: Den Wert besserer Gespräche. Wenn eine Führungskraft in 8 von 8 Gesprächen wirklich vorbereitet ist statt in 3 von 8, entstehen Gespräche, die Entwicklung anstoßen — das hat einen Wert, der sich nicht direkt buchen lässt.

Drei typische Einstiegsfehler

1. Zu viel auf einmal starten — ohne Datenlage. Der häufigste Fehler: Man führt ein Tool ein, gibt alle Mitarbeitenden-Namen ein, hofft auf nützliche Outputs — und bekommt generisches Nichts zurück. Der Grund: Die Datenlage ist nicht vorhanden. Keine dokumentierten Ziele, keine Gesprächsnotizen, keine Feedback-Aufzeichnungen. Das System kann nur aggregieren, was dokumentiert ist. Lösung: Erst ein bis zwei Gespräche manuell mit gut dokumentierten Mitarbeitenden durchführen. Die Erfahrung, wie viel besser eine datenbasierte Vorbereitung ist, motiviert zum Dokumentieren im nächsten Zyklus.

2. Den LLM-Output unverändert übernehmen. Automation Bias — der Reflex, einen maschinell generierten Text als neutral und korrekt zu akzeptieren — ist bei Mitarbeitergesprächen besonders gefährlich. Ein LLM formuliert eine Entwicklungsschwäche auf Basis von drei kurzen Notizen. Das klingt präzise. Aber die drei Notizen haben Kontext, den das Modell nicht kennt. Führungskräfte, die KI-Output unverändert ins Gespräch tragen, riskieren Ungerechtigkeit und Vertrauensverlust. Lösung: Der KI-Output ist ein erster Entwurf, kein Endprodukt. Lese jede Aussage durch und prüfe: Stimmt das wirklich? Ist das die ganze Geschichte?

3. Gesprächsnachbereitung vergessen. Viele starten mit der Vorbereitung und hören dort auf. Aber der Wert für den nächsten Zyklus entsteht in der Nachbereitung: Was wurde vereinbart? Welche Entwicklungsmaßnahmen wurden besprochen? Wenn diese Daten nicht strukturiert festgehalten werden, beginnt das Problem beim nächsten Jahresgespräch von vorne. Lösung: Den gleichen LLM oder das gleiche Tool direkt nach dem Gespräch nutzen, um aus den Notizen ein strukturiertes Protokoll zu erstellen — Agreed Actions, Entwicklungsziele, offene Punkte. Das dauert 10 Minuten und ist der wichtigste Investitionsschutz für alles, was davor war.

Was mit der Einführung wirklich passiert — und was nicht

Die Führungskräfte, die am schnellsten profitieren, sind die, die schon immer gerne gute Gespräche geführt haben, aber unter dem Aufwand gelitten haben. Für sie ist das Tool sofort wertvoll — es nimmt ihnen die Arbeit ab, die sie ohnehin lieber nicht machen: Daten zusammensuchen, Formulierungen feilen, Protokolle schreiben.

Schwieriger wird es mit zwei anderen Gruppen:

Führungskräfte, die Gespräche lieber kurz halten. Wer schon immer eher oberflächliche Gespräche geführt hat, wird das System möglicherweise nutzen, um schneller durch die Pflichtübung zu kommen — nicht um tiefere Gespräche zu führen. Das ist kein Problem des Tools; das ist ein Führungsproblem. KI kann Vorbereitung vereinfachen, aber keine Gesprächskultur erzwingen.

Mitarbeitende, die erfahren, dass KI bei der Vorbereitung eingesetzt wird. Manche werden das kritisch sehen — besonders wenn unklar ist, was das System über sie weiß und was es liefert. Transparenz ist hier entscheidend: Erkläre, was das System tut (Daten zusammenfassen) und was es nicht tut (urteilen, bewerten, speichern, was nicht abgesprochen ist). Wer das offen kommuniziert, baut Vertrauen auf. Wer es versteckt, riskiert genau das Gegenteil.

Was konkret hilft:

  • Zuerst das Tool bei einer Führungskraft testen, die offen dafür ist — und das Ergebnis dem Team zeigen
  • Klar kommunizieren, dass KI-Output immer durch die Führungskraft geprüft und angepasst wird, bevor das Gespräch stattfindet
  • Mitarbeitenden auf Nachfrage erläutern, welche Informationen in die KI-Vorbereitung fließen

Realistischer Zeitplan mit Risikohinweisen

PhaseDauerWas passiertTypisches Risiko
Erste Tests mit LLMTag 1–3Prompt entwickeln, mit 1–2 Pilotgesprächen ausprobierenDatenlage zu dünn — Ausgabe zu generisch
Datenbasis strukturierenWoche 1–2Zielvereinbarungen, Notizen, Feedback in strukturierten Dateien sammelnMehr Aufwand als erwartet — Daten lagen nirgends gesammelt vor
Prozess dokumentierenWoche 2–3Standard-Prompt und Dokumentationsformat für alle Führungskräfte anlegenFührungskräfte nutzen den Prompt unterschiedlich — Qualität inkonsistent
Erstes RolloutWoche 3–4Alle Führungskräfte nutzen das System für die nächste GesprächsrundeBetriebsrat nicht eingebunden — Stopp des Rollouts notwendig
Evaluation und Optimierungnach dem ersten ZyklusFeedback der Führungskräfte einsammeln, Prompt und Prozess anpassenAkzeptanz bleibt niedrig — System wird als Mehrarbeit empfunden, nicht als Entlastung

Wichtiger Hinweis zum Zeitplan: Wenn ein Betriebsrat vorhanden ist, muss der Schritt “Betriebsrat einbinden” vor Tag 1 kommen — nicht zwischen Woche 2 und 3.

Häufige Einwände — und was dahintersteckt

„Das wirkt unpersönlich — Mitarbeitergespräche müssen von Herz zu Herz geführt werden.” Der Einwand trifft auf einen wichtigen Punkt. KI-gestützte Gesprächsvorbereitung kann genau das verbessern: Wenn eine Führungskraft weiß, was sie besprechen will, weil die Daten gut aufbereitet sind, kann sie sich im Gespräch selbst auf das Persönliche konzentrieren — statt gleichzeitig zu recherchieren, zu strukturieren und empathisch zu sein. Der Fehler wäre, den LLM-Output direkt als Gesprächsleitfaden zu verwenden, statt ihn als Ausgangspunkt zu nehmen.

„Unsere Führungskräfte kennen ihre Mitarbeitenden — die brauchen keine KI dafür.” Stimmt für Führungskräfte mit 2–3 direkten Berichten, die täglich eng zusammenarbeiten. Aber viele Führungskräfte haben 6–12 direkte Berichte, führen Gespräche einmal im Jahr und arbeiten in Strukturen, wo täglicher Kontakt nicht selbstverständlich ist. Je größer die Führungsspanne, desto stärker der potenzielle Nutzen. Und selbst wer seine Mitarbeitenden gut kennt, kann von strukturierter Dokumentation profitieren — als Absicherung, nicht als Ersatz.

„Was ist, wenn die KI etwas Falsches generiert und das ins Gespräch einfließt?” Das ist ein reales Risiko — und das Hauptargument dafür, KI-Output immer zu prüfen, bevor er verwendet wird. Ein LLM kann auf Basis unvollständiger Notizen eine Einschätzung formulieren, die falsch gewichtet oder kontextlos ist. Die Lösung ist nicht, KI nicht zu nutzen — sondern klare Regeln: Der Output ist ein Entwurf, nicht ein Urteil. Jede Führungskraft prüft und korrigiert. Das gilt besonders für kritische Aussagen.

Woran du merkst, dass das zu dir passt

  • Du führst regelmäßig Jahres- oder Feedbackgespräche und findest die Vorbereitung zeitaufwändig, auch wenn du die Gespräche selbst gerne führst
  • Du hast mindestens 5 direkte Berichte — ab dieser Größenordnung lohnt sich der einmalige Aufwand für einen strukturierten Prompt deutlich
  • Informationen zu Mitarbeitenden liegen irgendwo dokumentiert — Zielvereinbarungen, Projektnotizen, frühere Gesprächsprotokolle — auch wenn sie verstreut sind
  • Du willst, dass alle Mitarbeitenden gleich gute Gespräche bekommen — nicht nur die, deren Fälle dir gerade besonders präsent sind
  • Ihr habt bereits einen strukturierten Feedback-Prozess oder wollt einen einführen — KI entfaltet hier den größten Nutzen, wenn die Ausgangsdaten vorhanden sind

Wann es sich (noch) nicht lohnt — drei harte Ausschlusskriterien:

  1. Weniger als 4–5 direkte Berichte pro Führungskraft. Bei kleinen Führungsspannen ist der Aufwand für Prompt-Entwicklung und Tool-Einführung größer als der Zeitgewinn. Hier ist eine gute handgeschriebene Vorbereitung in 30 Minuten effizienter.

  2. Keine strukturierten Leistungsdaten vorhanden. Wenn Ziele nicht dokumentiert, Feedback nicht festgehalten und unterjährige Gespräche nicht protokolliert wurden, hat der LLM nichts zum Aggregieren. Zuerst kommt die Dokumentationsdisziplin — dann das KI-Tool.

  3. Betriebsrat vorhanden, aber noch nicht eingebunden. Ohne Betriebsvereinbarung für KI-gestützte Mitarbeiterbeurteilung riskierst du eine rechtliche Blockade. Der Betriebsrat hat nach § 87 Abs. 1 Nr. 6 BetrVG echte Mitbestimmungsrechte. Das ist kein Hindernis — es ist ein Schritt, der frühzeitig gemacht werden muss.

Interaktive Kalkulation

Lohnt sich KI-Unterstützung für eure Gesprächsvorbereitung?

Gib eure Zahlen ein — du siehst sofort, welches Einsparpotenzial realistisch ist.

die regelmäßig Jahresgespräche führen

Gespräche pro Jahr und Führungskraft

inkl. Daten zusammensuchen und Bogen ausfüllen

Vollkosten inkl. Nebenkosten, ca. 40–100 €

Das kannst du heute noch tun

Nimm eine Führungskraft — am besten dich selbst — und teste den folgenden Prompt mit einem echten bevorstehenden Mitarbeitergespräch. Sammle alle verfügbaren Informationen zu dieser Person in einem Dokument: Zielvereinbarungen, Projektnotizen, frühere Gesprächsprotokoll-Fragmente, kurze Feedback-Kommentare. Lade das Dokument in Claude oder ChatGPT hoch (Business-Plan oder Team-Plan, nicht kostenlos) und verwende diesen Prompt:

Gesprächsvorbereitung für Mitarbeitergespräche
Du hilfst mir bei der Vorbereitung auf ein Mitarbeitergespräch mit [NAME / KÜRZEL]. Ich habe dir alle relevanten Informationen zu dieser Person im angehängten Dokument bereitgestellt: Zielvereinbarungen, Projektnotizen, frühere Gesprächsfragmente und Feedback-Kommentare. Erstelle auf dieser Basis eine strukturierte Gesprächsvorbereitung mit folgenden Abschnitten: 1. ZUSAMMENFASSUNG DES JAHRES (5–7 Sätze): Was hat die Person erreicht? Was blieb offen? Welche Muster fallen auf? 2. STÄRKEN MIT KONKRETEN BEISPIELEN (3–5 Punkte): Nur Stärken, die durch konkrete Beispiele aus den vorliegenden Unterlagen belegbar sind. Keine allgemeinen Aussagen ohne Grundlage. 3. ENTWICKLUNGSTHEMEN (2–3 Punkte): Was könnte besser werden? Formuliere konkret und entwicklungsorientiert, nicht als Kritik. 4. GESPRÄCHSSTRUKTUR (empfohlene Reihenfolge der Themen, 5–7 Punkte) 5. OFFENE FRAGEN AN DIE PERSON (3–5 Fragen): Was will ich im Gespräch von ihr/ihm wissen oder besprechen? 6. VORGESCHLAGENE ENTWICKLUNGSMASSNAHMEN (1–3 konkrete Vorschläge, basierend auf den Entwicklungsthemen) Wichtig: Wenn dir Informationen fehlen, schreib es explizit. Schätze nicht. Erfinde keine Beispiele. [HIER DATEI ANHÄNGEN ODER INFOS EINFÜGEN]
Funktioniert mit ChatGPT (Team), Claude (Team/Pro)
Beispiel-Ausgabe

Mitarbeiter:in

Mitarbeiter M. — Ziel Q1: Kundenprojekt A abschließen. Ergebnis: Abschluss Mai, 3 Wochen Verzögerung. Feedback aus Team: 'sehr strukturiert, manchmal zu langsam bei Entscheidungen'. Q3-Notiz: starke Präsentation beim Kunden, Lob von Herrn K. Q4: hat neues Mitglied eingearbeitet, gutes Feedback. Entwicklungswunsch: mehr Verantwortung im Projektmanagement.

KI-Assistent

ZUSAMMENFASSUNG DES JAHRES M. hat im Jahr ein Kundenprojekt abgeschlossen (3 Wochen Verzögerung), eine Kundenpräsentation erfolgreich gehalten und ein neues Teammitglied eingearbeitet. Stärken liegen in Struktur und Verlässlichkeit. Ein wiederkehrendes Thema: Entscheidungen werden manchmal zu langsam getroffen. Das Entwicklungsziel Projektmanagement-Verantwortung deckt sich mit dem geäußerten Wunsch. STÄRKEN MIT KONKRETEN BEISPIELEN • Strukturiertes Arbeiten: aus Team-Feedback als Kernstärke benannt • Kundenkommunikation: Präsentation Q3 erhielt externes Lob von Herrn K. • Einarbeitung neuer Kolleginnen/Kollegen: Q4, positives Feedback aus dem Team ENTWICKLUNGSTHEMEN • Entscheidungsgeschwindigkeit: Teammitglieder beschreiben M. als "manchmal zu langsam bei Entscheidungen" — Gesprächspunkt: In welchen Situationen passiert das? Was würde helfen? • Projektmanagement-Verantwortung: Wunsch ist geäußert, aber bisher wenig Praxis — Gespräch über konkrete nächste Schritte OFFENE FRAGEN AN M. • Wie bewertet M. selbst das Projektjahr — was hätte anders laufen sollen? • Was braucht M., um im Bereich Projektmanagement wachsen zu können? • Wie hat M. die Einarbeitung von [Name] erlebt? Hinweis: Informationen zu Gehaltsentwicklung, geplanten Verantwortungsbereichen und Q2-Aktivitäten fehlen in den Unterlagen — diese Punkte bitte separat einbringen.

Quellen & Methodik

  • SHRM-Statistik (210 Stunden Performance Management): Society for Human Resource Management (SHRM), Performance Management Survey, 2015. Vielfach zitiert in aktueller HR-Literatur; neuere Zahlen fehlen als breite Erhebung, aber die Größenordnung wird durch aktuelle Praxisberichte bestätigt.
  • Gallup-Daten zu Feedback und Engagement: Gallup, „State of the American Workplace” (fortlaufend aktualisiert); Mitarbeitende mit regelmäßigem Feedback dreimal häufiger engagiert.
  • § 87 Abs. 1 Nr. 6 BetrVG: Betriebsverfassungsgesetz in der aktuell gültigen Fassung; Mitbestimmungsrecht bei technischen Überwachungseinrichtungen.
  • Leapsome DSGVO & Datenhosting: Leapsome GmbH, Datenschutzerklärung und Data Processing Agreement (April 2026); AWS EEA-Rechenzentren, kein Drittland-Transfer ohne SCCs.
  • Automation Bias / Over-Reliance: Center for Security and Emerging Technology (CSET), Georgetown University, „AI Safety and Automation Bias” (November 2024); Humans accepting AI recommendations even when incorrect, especially under time pressure.
  • Preisangaben Tools: Veröffentlichte Tarife von OpenAI (ChatGPT Team/Business), Anthropic (Claude Team), Microsoft (M365 Copilot), Leapsome (OMR Reviews / leapsome.com, Stand April 2026). Preise können sich ändern.

Du willst wissen, welcher Ansatz für eure Führungsstruktur und Datenlage am besten passt? Meld dich — das klären wir gemeinsam in einem kurzen Gespräch.

Diesen Inhalt teilen:

🤝

Interesse an diesem Use Case?

Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.

Deine Daten werden ausschließlich zur Bearbeitung deiner Anfrage verwendet (Art. 6 Abs. 1 lit. b DSGVO). Mehr in unserer Datenschutzerklärung.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–3 Themen — du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar