KI-gestütztes Gehaltsstruktur-Benchmarking
KI vergleicht interne Gehaltsstrukturen mit aktuellen Marktdaten, identifiziert Unter- und Überzahlungscluster und bereitet jährliche Gehaltsrunden datenbasiert vor.
- Problem
- Gehaltsverhandlungen laufen in den meisten KMU reaktiv ab: Jemand droht zu kündigen, dann wird nachgebessert. Systematische Marktvergleiche fehlen — entweder weil teure Benchmark-Studien (5.000–20.000 €) nicht ins Budget passen oder weil die Daten veraltet sind.
- KI-Lösung
- KI aggregiert öffentlich zugängliche Gehaltsdaten (Glassdoor, Stepstone, LinkedIn Salary, Vergütungsreports) und vergleicht sie rollenbezogen mit der internen Gehaltsstruktur. Ausreißer werden automatisch geflaggt — als Fluktuationsrisiko oder als Budgetverschwendung.
- Typischer Nutzen
- Jährliche Gehaltsrunde von 2–4 Wochen manueller Recherche auf 2–3 Tage reduzieren. Retentionsrisiken durch Unterzahlung 6–12 Monate früher erkennen als durch Kündigungen.
- Setup-Zeit
- 6–10 Wochen — am langsamen Ende der Branche
- Kosteneinschätzung
- 0–3.500 € Einrichtung, 0–800 €/Monat je nach Tool-Ansatz
Es ist Mitte Oktober. Sandra Vogt, HR-Leiterin bei einem Maschinenbauer mit 140 Mitarbeitenden, sitzt vor einer Excel-Tabelle, in der alle Gehälter der Abteilung Softwareentwicklung stehen. Die Gehaltsrunde beginnt in sechs Wochen. Drei Entwickler haben in den letzten vier Monaten das Unternehmen verlassen — alle drei zu direkten Wettbewerbern. Ihr Bauchgefühl sagt ihr, dass die Gehälter nicht mehr marktgerecht sind. Aber ein Bauchgefühl lässt sich in der Geschäftsführerrunde schwer argumentieren.
Also kauft sie eine Kienbaum-Studie für 1.499 Euro, ergänzt mit Stepstone-Auswertungen, Glassdoor-Daten und LinkedIn Salary Insights — und verbringt drei Wochen damit, Zahlen zu sammeln, zu normalisieren und in Präsentationsform zu bringen. Erst die Daten passen nicht zur Unternehmensgröße, dann fehlen rollenspezifische Datenpunkte für Industrial Software in Süddeutschland.
In der dritten Woche, aus Frust, kopiert Sandra ihre interne Median-Tabelle und die Stepstone-Mediane in einen Claude-Chat und tippt: „Vergleich diese internen Mediane mit den Marktmedianen — wo liegen wir, wo nicht?” Antwort kommt in 90 Sekunden, mit klarer Spalte „Abweichung %”: Drei Senior-Entwickler-Rollen liegen 12 bis 18 Prozent unter Median. Sandra sitzt zwanzig Minuten an dem Befund — statt drei Wochen.
Die Geschäftsführung genehmigt am Ende trotzdem nur einen Gehaltspool von 3,2 Prozent. Im Februar kündigt der vierte Entwickler. Wäre Sandras strukturierte Abweichungsanalyse drei Wochen früher fertig gewesen, hätte das Argument für 4,5 Prozent gestanden — rund 8.000 Euro Differenz pro Person, die den Abgang vielleicht verhindert hätten. Stattdessen: vier Entwickler à 35.000 bis 52.500 Euro Wiederbeschaffung (6 bis 9 Monatsgehälter bei 70.000 € Jahresbasis), zusammen also zwischen 140.000 und 210.000 Euro. Die Kienbaum-Studie hatte 1.499 Euro gekostet — der Claude-Chat null.
Das echte Ausmaß des Problems
In deutschen KMU findet systematisches Gehalts-Benchmarking kaum statt. Die Alternativen sind teuer, arbeitsaufwändig oder beides: Eine Kienbaum-Vergütungsstudie für Führungskräfte kostet ab 1.499 Euro — für einen einzigen Funktionsbereich, einmal jährlich. Professionelle Vergütungssurveys, die auf das eigene Unternehmensprofil passen, liegen im Bereich von 5.000 bis 20.000 Euro. Das ist für einen Mittelständler mit drei oder vier HR-Verantwortlichen eine erhebliche Ausgabe, die in vielen Budgets gar nicht vorgesehen ist.
Das Ergebnis: Die meisten Gehaltsrunden laufen reaktiv. Wer kündigt, bekommt ein Gegenangebot. Wer bleibt, hat Glück — oder findet die Situation noch nicht schlimm genug.
Die Konsequenzen sind messbar:
- Eine ungeplante Fluktuation kostet im Schnitt 6 bis 9 Monatsgehälter — durch Recruiting, Onboarding und Produktivitätsverlust in der Einarbeitungszeit. Diese Spanne ist konsistent mit dem SHRM Human Capital Benchmarking Report 2024 (50–60 % des Jahresgehalts pro Cost-per-Hire) sowie dem Gallup State of the Workplace 2024; einzelne Anbieteranalysen (u.a. Personio) nennen ähnliche Größenordnungen, sind aber proprietär und sollten nicht als Primärquelle dienen
- Gehaltsgaps von 10 bis 20 Prozent unter Marktmedian erhöhen die Fluktuationswahrscheinlichkeit erfahrungsgemäß deutlich — besonders bei Fachkräften mit hoher Marktgängigkeit (Softwareentwicklung, Data Science, Vertrieb)
- Gleichzeitig gibt es in vielen Unternehmen einzelne Rollen, die historisch überbezahlt sind — oft aus Sonderkonditionen bei Neueinstellungen oder organisch gewachsenen Gehaltserhöhungen. Das komprimiert Bandbreiten und macht neue Vergütungsstufen schwer erklärbar
Das Problem hat außerdem eine neue regulatorische Dimension: Ab Juni 2026 gilt in Deutschland die EU-Entgelttransparenzrichtlinie — mit konkreten Auswirkungen auch für Unternehmen unter 250 Mitarbeitenden. Mehr dazu im Abschnitt zur Rechtslage weiter unten.
Woran das erkannt wird: Wenn der letzte strukturierte Marktvergleich mehr als 18 Monate zurückliegt — oder nie stattgefunden hat —, entscheidet das Unternehmen über Gehaltsrunden auf Basis von Vergangenheitswerten und Verhandlungsgeschick, nicht auf Basis von Marktdaten.
Mit vs. ohne KI — ein ehrlicher Vergleich
| Kennzahl | Ohne KI | Mit KI-gestütztem Benchmarking |
|---|---|---|
| Vorbereitungszeit für Gehaltsrunde | 3–4 Wochen manuell | 2–3 Tage strukturierte Analyse |
| Kosten externe Benchmark-Studien | 1.500–20.000 €/Jahr | 200–500 €/Monat Tool-Abo oder 0 € für Custom-Ansatz |
| Rollenabdeckung (Anzahl benchmarkter Positionen) | 5–15 (was Studie abdeckt) | 30–80+ (alle relevanten Rollen) |
| Frequenz des Marktvergleichs | Einmal jährlich (wenn Budget vorhanden) | Quartalsweise aktualisierbar |
| Lohngerechtigkeits-Analyse (Geschlecht, Region, Alter) | Selten oder nie | Automatisch auf Basis interner Daten |
| Auditierbarkeit für Entgelttransparenzgesetz | Manuell aufwändig | Daten bereits strukturiert vorhanden |
Die Qualitätsschwankungen sind real: Öffentliche Gehaltsquellen wie Glassdoor basieren auf selbst gemeldeten Daten, die nicht validiert sind. Ein einzelner Praxis-Test des Blogs PeopleNerd (2024, illustrativ — kein peer-reviewter Vergleich) zeigte exemplarisch, dass verschiedene KI-Tools für dieselbe Rolle Gehaltsempfehlungen mit bis zu 177 Prozent Varianz produzierten. Die Größenordnung deckt sich mit Branchenbeobachtungen aus McKinsey „The State of HR Technology 2024” und BCG „Compensation Tech Landscape 2023”. Kein Argument gegen KI-gestütztes Benchmarking — aber ein starkes Argument dafür, mehrere Quellen zu kombinieren und Ergebnisse von jemandem mit Marktkenntnis zu plausibilisieren.
Einschätzung auf einen Blick
Zeitersparnis — hoch (4/5) Hier braucht es eine ehrliche Einordnung. Der manuelle Prozess für eine Gehaltsrunde (Quellen sichten, Daten normalisieren, Rollen zuordnen, Präsentation bauen) dauert typischerweise zwei bis vier Wochen — KI-gestützt schrumpft das auf zwei bis drei Tage. Pro Gehaltsrunde sind das 80 bis 120 Stunden HR-Zeit, die wegfallen.
Wichtig ist aber die Periodizität: Anders als Kundenkorrespondenz (5/5) oder Berichterstellung (5/5), die täglich entlasten, greift dieser Hebel ein bis zwei Mal im Jahr. Aufs Jahr verteilt liegt die Größenordnung der Ersparnis trotzdem auf einem ähnlichen Niveau wie tägliche Routine-Hebel — sie ist aber konzentriert auf wenige Wochen statt verteilt. 4/5 bildet diese Konzentration ab: hoch, aber nicht so kontinuierlich wirksam wie die täglichen 5/5-Fälle in der Branche.
Kosteneinsparung — mittel (3/5) Teure Benchmark-Studien (1.500–20.000 Euro) können durch automatisierte Aggregation ersetzt oder deutlich ergänzt werden. Gleichzeitig entstehen neue Kosten durch Tool-Abos oder Entwickleraufwand. Netto ist die Einsparung real, aber die Hauptwirkung liegt in der Qualitätsverbesserung der Entscheidungsgrundlage — nicht in direkter Kostensenkung. Vergleichbar mit der Lieferanten-Risikoanalyse: indirekter finanzieller Nutzen, der sich über Retentionszahlen materialisiert, nicht über direkte Einsparposten.
Schnelle Umsetzung — niedrig (2/5) Sechs bis zehn Wochen bis zum ersten produktiven Durchlauf — das liegt am langsamen Ende der allgemein-Branche. Deutlich aufwändiger als einfache Meeting-Protokolle oder Kundenkorrespondenz, die in wenigen Tagen produktiv sind. Die Anlaufzeit entsteht durch das Job-Matching (interne Stellentitel gegen Standardtaxonomien abgleichen) und die Datenbereinigung der internen Gehaltsdaten — beides braucht menschliche Validierung und lässt sich nicht beschleunigen. Wer saubere Stellenbeschreibungen hat, ist eher am unteren Ende der Spanne, aber unter sechs Wochen bleibt unrealistisch.
ROI-Sicherheit — mittel (3/5) Der Nutzen ist real, aber nicht trivial zu messen: Wie viel Fluktuation wurde verhindert? Welche Retention-Kosten wurden vermieden? Diese Kausalkette ist schwerer zu belegen als etwa der Preis pro automatisch verarbeiteter Rechnung bei der Rechnungsverarbeitung. Hinzu kommt die Datenqualität: Öffentliche Gehaltsquellen sind selbst gemeldet und nicht immer repräsentativ, was die Konfidenz in einzelne Benchmarks begrenzt.
Skalierbarkeit — niedrig (2/5) Das ist eine ehrliche Einschränkung: Gehalts-Benchmarking ist kein kontinuierlicher Prozess, der mit jedem neuen Mitarbeitenden automatisch wächst. Es ist ein periodischer Prozess — einmal jährlich oder quartalsweise. Hat man das System einmal aufgebaut, ist die Aktualisierung wenig aufwändig; aber neue Rollen, Standorte oder Tarifbereiche erfordern jedes Mal manuelles Job-Matching. Geringer Skalierungseffekt im Vergleich zu Prozessen wie Predictive Analytics oder dem Website-Chatbot, die einmal konfiguriert täglich wachsenden Mehrwert liefern.
Richtwerte — stark abhängig von Unternehmensgröße, Qualität interner HR-Daten und gewähltem Tool-Ansatz.
Was das System konkret macht
Gehalts-Benchmarking mit KI besteht aus zwei Komponenten: Daten beschaffen und Daten vergleichen. Beide können durch KI erheblich beschleunigt werden.
Schritt 1: Externe Marktdaten aggregieren
Statt manuell Studien zu kaufen oder Gehaltsportale zu durchsuchen, kombiniert ein LLM-gestütztes System mehrere Quellen gleichzeitig: Stepstone-Gehaltsreport (öffentlich, jährlich aktualisiert), LinkedIn Salary Insights, Glassdoor, regionale IHK-Vergütungsberichte sowie spezialisierte Surveys (z.B. Kienbaum, Mercer, Willis Towers Watson für spezifische Funktionsbereiche). Die KI normalisiert die Daten: Vollzeit-Äquivalente, Branchenanpassungen, regionale Korrekturfaktoren für Bayern vs. Mecklenburg-Vorpommern.
Schritt 2: Job-Matching
Das ist der kritischste Schritt. Interne Stellentitel sind oft historisch gewachsen und decken sich nicht mit Marktbezeichnungen: Was intern “Senior Entwickler” heißt, kann am Markt “Principal Engineer” oder “Tech Lead” entsprechen — mit erheblichem Gehaltsunterschied. Die KI matcht interne Rollen gegen eine standardisierte Rollenstruktur und identifiziert Zuordnungsprobleme. Wichtig: Dieses Matching braucht menschliche Validierung — kein System der Welt matcht jeden Titel korrekt ohne Kontext.
Schritt 3: Abweichungsanalyse
Das System berechnet für jede Rolle die Abweichung vom Marktmedian (P50) und den marktüblichen Bandbreiten (P25–P75). Rollen, die mehr als 15 Prozent unter P50 liegen, werden als Fluktuationsrisiko markiert. Rollen, die deutlich über P75 liegen, werden als potenzielle Budgetineffizienz gemeldet. Optional: Wenn interne Daten Geschlecht, Betriebszugehörigkeit oder Region enthalten, kann eine Equity-Analyse automatisch erkennen, ob systematische Lohnunterschiede bestehen.
Was das System nicht macht: Es entscheidet nicht, welche Gehaltsanpassungen vorgenommen werden. Das bleibt Führungsaufgabe. Es liefert die Entscheidungsgrundlage — strukturiert, vergleichbar und dokumentiert.
Konkrete Werkzeuge — was wann passt
Für diesen Use Case gibt es drei grundlegend verschiedene Ansätze, je nach Budget, Unternehmensgröße und Datenanforderungen.
Ravio — wenn du europäische Echtzeit-Marktdaten brauchst
Ravio ist die stärkste Plattform für europäisches Benchmarking, speziell im Tech- und Scale-up-Bereich. Die Datenbank aggregiert anonymisierte Vergütungsdaten aus über 1.400 Unternehmen in 50+ Ländern — mit deutlich besserer Tiefe für den DACH-Markt als US-amerikanische Anbieter. Ravio integriert direkt in Personio, BambooHR und HiBob: Sobald die Verbindung steht, sind die internen Daten immer aktuell. Datenhosting in der EU. Preise auf Anfrage — primär für Unternehmen ab 50 Mitarbeitenden. Keine öffentliche Preisliste; Demo nötig.
Wann Ravio: Tech-Unternehmen, Scale-ups oder Mittelständler mit starkem Fokus auf europäische Märkte. Wenn die Datentiefe für die eigenen Rollen wichtiger ist als der Preis.
Payscale — wenn internationale Vergleiche nötig sind
Payscale ist einer der globalen Marktführer für Vergütungsdaten mit kontinuierlich aktualisierten Datenpunkten. Besonders stark für englischsprachige Märkte (USA, UK, Kanada). Für rein deutschsprachige KMU ist die Datentiefe im DACH-Raum begrenzt — häufig sinnvoller als Ergänzung zu deutschen Quellen denn als alleinige Basis. Laut Vendr-Schätzungen kostet Payscale Marketpay ca. 20.000–30.000 USD/Jahr im Enterprise-Segment — kein Tool für kleinere KMU ohne dediziertes Compensation-Budget. Datenhosting in den USA — AVV erforderlich, sorgfältige DSGVO-Prüfung nötig.
Wann Payscale: Unternehmen ab 200+ Mitarbeitenden mit internationalen Standorten oder hohem Anteil international rekrutierter Fachkräfte.
Custom-Ansatz mit ChatGPT oder Claude + öffentliche Datenquellen
Für KMU ohne Compensation-Budget ist ein strukturierter Custom-Ansatz die praktischste Einstiegsoption: Manuell aggregierte Daten aus dem Stepstone-Gehaltsreport, LinkedIn Salary, der Bundesagentur für Arbeit und dem Robert Half Salary Guide werden in ein strukturiertes Excel-Format gebracht. Ein LLM übernimmt dann das Normalisieren, Kategorisieren und Zusammenfassen. Die Qualität hängt stark von der Quellenauswahl ab — mindestens drei unabhängige Quellen kombinieren, nie eine Quelle allein verwenden. Julius AI eignet sich gut für die Datenanalyse und Visualisierung der Ergebnisse.
Einrichtungsaufwand: 3–5 Tage, kein monatlicher Fixkostenpunkt außer der LLM-Nutzung. Für 30–80 Rollen realistisch.
Wann Custom-Ansatz: Unternehmen unter 100 Mitarbeitenden oder mit begrenztem HR-Budget, die einen strukturierten ersten Marktvergleich ohne Tool-Investition machen wollen.
Personio + Ravio als integriertes Setup
Eigenständig ist Personio kein Benchmarking-Tool — der Mehrwert liegt erst in der Kombination mit Ravio über die direkte Integration. Konkret löst diese Verzahnung drei Probleme: Erstens fließen die Stellenprofile aus der Personio-Personalakte automatisch in das Ravio-Job-Matching, ohne dass Rollen doppelt gepflegt werden müssen. Zweitens läuft die Lohngerechtigkeits-Analyse (Equity-Analyse) direkt auf den Personio-Stammdaten, ohne CSV-Export — das ist datenschutzrechtlich sauberer und weniger fehleranfällig. Drittens dokumentiert das optionale Personio-Vergütungsmodul die Gehaltsrunde im selben System, in dem die Gehaltsänderungen anschließend operativ vollzogen werden — keine Bruchstelle zwischen Analyse und Ausführung. Datenhaltung in Frankfurt (Personio) bzw. EU (Ravio).
Wann diese Kombination: Wenn ihr Personio bereits nutzt UND ein eigenes Compensation-Budget habt, das Ravio rechtfertigt. Personio allein für diesen Use Case zu kaufen lohnt nicht — direkter Prompt-Workflow oder Ravio standalone sind dann besser.
Zusammenfassung: Wann welcher Ansatz
- Tech-Unternehmen, DACH-Fokus, 50+ Mitarbeitende → Ravio
- International, 200+ Mitarbeitende, Vergütungsbudget vorhanden → Payscale
- KMU unter 100 MA, kein Tool-Budget → Custom-Ansatz mit LLM + öffentliche Quellen
- Personio-Nutzer mit Vergütungsbudget → Personio + Ravio Kombination
Das Entgelttransparenzgesetz 2026 — ein weiterer Grund, jetzt anzufangen
Die EU-Entgelttransparenzrichtlinie muss bis zum 7. Juni 2026 in nationales Recht umgesetzt werden. Das verändert konkret, was Unternehmen in Deutschland gegenüber Mitarbeitenden und Bewerbenden offen legen müssen.
Was ab Juni 2026 gilt:
- Stellenausschreibungen: Für jede ausgeschriebene Stelle muss eine Gehaltsspanne oder ein Ausgangsentgelt angegeben werden — entweder in der Anzeige oder spätestens vor dem ersten Vorstellungsgespräch. Fragen nach dem bisherigen Gehalt von Bewerbenden sind unzulässig.
- Auskunftsrecht: Mitarbeitende haben ein Recht auf Information über das durchschnittliche Entgelt vergleichbarer Kolleginnen und Kollegen — aufgeschlüsselt nach Geschlecht. Das gilt unabhängig von der Unternehmensgröße.
- Berichtspflichten (ab 100+ Mitarbeitende): Unternehmen mit 150–249 Mitarbeitenden müssen alle drei Jahre einen Bericht über Entgeltunterschiede nach Geschlecht erstellen. Ab 250 Mitarbeitenden gilt eine jährliche Berichtspflicht.
Was das für HR bedeutet:
Um Gehaltsspannen in Stellenanzeigen korrekt anzugeben, müssen Gehaltsbänder existieren — strukturiert, nachvollziehbar und marktbasiert. Wer das nicht hat, improvisiert: entweder mit zu breiten Spannen, die keine Information liefern, oder mit zu engen Spannen, die die Verhandlungsfreiheit einschränken. Beides ist suboptimal.
KI-gestütztes Benchmarking ist der direkteste Weg, diese Gehaltsbänder aufzubauen: rollenbezogen, marktbasiert und mit einer dokumentierten Methodik. Wer das bis Mitte 2025 nicht angefangen hat, gerät bis zur Umsetzungsfrist unter Zeitdruck.
Wichtige Einschränkung: Das Entgelttransparenzgesetz verlangt keine perfekte KI-Lösung — es verlangt strukturierte, nachvollziehbare Gehaltsbänder. Auch ein manuell aufgebautes System aus Kienbaum-Daten und einem Excel-Modell erfüllt die Anforderung, wenn es gut dokumentiert ist. KI beschleunigt den Aufbau erheblich, ist aber keine Pflicht.
Datenschutz und Datenhaltung
Gehaltsdaten sind personenbezogene Daten nach Art. 4 Nr. 1 DSGVO. Eine Klarstellung, die wir oft falsch lesen sehen: Geschlecht ist nach Art. 9 DSGVO keine besondere Kategorie personenbezogener Daten (das sind ausschließlich ethnische Herkunft, religiöse oder weltanschauliche Überzeugungen, Gewerkschaftszugehörigkeit, Gesundheitsdaten, biometrische Daten zur Identifizierung sowie Daten zur sexuellen Orientierung). Im AGG-Kontext ist Geschlecht aber ein geschütztes Diskriminierungsmerkmal — und Lohngerechtigkeits-Analysen, die Gehälter mit Geschlecht oder Alter verknüpfen, fallen damit zwar nicht unter Art. 9, aber unter erhöhte Anforderungen an Zweckbindung (Art. 5 DSGVO) und Datenschutz-Folgenabschätzung (Art. 35 DSGVO).
Konkret für die Lohngerechtigkeits-Analyse: Solange die Marktdaten-Aggregation rollenbasiert und ohne Personenbezug läuft (z.B. „Software Engineer Stufe 3: Median 72.000 €, Bandbreite 65.000–82.000 €”), bleibt sie außerhalb der Hochrisiko-Zone. Sobald aber die Equity-Analyse einsetzt — also Gehälter mit Geschlecht oder Alter verknüpft werden, um Diskriminierungsmuster zu erkennen — müssen Daten personenbezogen vorliegen. Das ist ein eigenständiger Schritt, der eine Datenschutz-Folgenabschätzung und in der Regel die Einbindung des Betriebsrats erfordert. Diese Analyse gehört nicht in dieselbe Sitzung wie der Marktvergleich.
Sobald interne Gehaltsdaten in ein externes KI-System fließen, gelten zusätzliche Anforderungen.
Für die gängigen Werkzeuge gilt:
- Ravio: Datenhosting in der EU, DSGVO-konform, AVV standardmäßig im Vertrag. Für DACH-Unternehmen die datenschutzrechtlich unkomplizierteste Wahl unter den Speziallösungen.
- Payscale: US-amerikanischer Anbieter. AVV erhältlich, aber Datentransfer in die USA. Für Unternehmen mit Betriebsrat oder Datenschutzbeauftragtem erhöhter Abstimmungsaufwand. Standard Contractual Clauses (SCCs) nach Art. 46 DSGVO müssen vorhanden sein.
- Custom-Ansatz mit ChatGPT: Wenn interne Gehaltsdaten in ChatGPT eingegeben werden, verarbeitet OpenAI diese Daten standardmäßig auf US-Servern. Für produktiven Einsatz: OpenAI API mit deaktiviertem Daten-Training nutzen (opt-out möglich) oder auf EU-konforme Alternativen wie Claude über die API ausweichen. AVV ist erhältlich; die Verarbeitung bleibt aber US-seitig. Für besonders sensible Daten (z.B. Gehaltsdaten kombiniert mit Geschlecht und Alter) empfiehlt sich ein lokales Modell oder ein europäischer Anbieter.
- Personio: Datenhosting auf ISO-27001-zertifizierten AWS-Servern in Frankfurt, DSGVO-konform. AVV standardmäßig im Vertrag. Gute Wahl für die interne Datenhaltung.
Betriebsrat: Wenn ein Betriebsrat vorhanden ist, unterliegt die Einführung eines Systems zur Gehaltsanalyse dem Mitbestimmungsrecht nach § 87 Abs. 1 Nr. 10 BetrVG (Entlohnungsgrundsätze). Das gilt auch für KI-gestützte Systeme. Frühzeitige Einbindung des Betriebsrats ist keine Option, sondern Pflicht — und verhindert aufwändige Nachverhandlungen.
Was es kostet — realistisch gerechnet
Einmalige Einrichtungskosten (Custom-Ansatz)
- Interne Gehaltsdaten strukturieren und anonymisieren: 2–4 Tage HR-Aufwand
- Externe Quellen aggregieren und normalisieren: 3–5 Tage, intern oder mit Beraterunterstützung (500–1.500 Euro extern)
- Job-Matching und Validation: 1–2 Tage
- Gesamtaufwand Custom: 1.000–3.500 Euro einmalig (extern) + interne HR-Zeit
Einmalige Einrichtungskosten (Tool-Ansatz)
- Ravio oder Payscale: kein gesondertes Setup-Fee, aber Implementierung und HRIS-Konfiguration 1–3 Wochen
- Personio Compensation-Modul: Teil des bestehenden Personio-Onboardings
Laufende Kosten
- Ravio: Preise auf Anfrage; erfahrungsgemäß ab ca. 500–800 Euro/Monat für Unternehmen ab 50 MA
- Payscale: ca. 20.000–30.000 USD/Jahr (Vendr-Schätzung, 2025) — nur für größere Unternehmen wirtschaftlich
- Custom-Ansatz: nur LLM-API-Nutzung, typisch unter 50 Euro/Monat für periodischen Einsatz
Was du dagegenrechnen kannst Eine ungeplante Fluktuation kostet erfahrungsgemäß 6–9 Monatsgehälter (Recruiting, Onboarding, Produktivitätsverlust). Bei einem Softwareentwickler mit 70.000 Euro Jahresgehalt sind das 35.000–52.500 Euro je Abgang. Wenn strukturiertes Benchmarking auch nur einen einzigen Abgang pro Jahr verhindert — weil ein Retention-Problem frühzeitig erkannt und adressiert wird —, amortisieren sich selbst Tool-Kosten von 8.000 Euro/Jahr mehr als vierfach.
Diese Rechnung ist nicht garantiert, aber plausibel: Benchmarking macht Unterzahlungen sichtbar, bevor sie zur Kündigung führen. Ob die Geschäftsführung dann handelt, liegt nicht am Tool.
Fluktuation-ROI-Rechner
Wie viel kostet euch reaktive Fluktuation — und wann rechnet sich strukturiertes Benchmarking?
Richtwert: 60.000–90.000 € für Softwareentwicklung, 55.000–75.000 € für Vertrieb und Marketing
Nur ungewollte Abgänge zählen — keine Ruheständler oder einvernehmlichen Trennungen
Wechsel zu direkten Wettbewerbern sind das stärkste Signal für Gehalts-Unterzahlung
ROI messen: Der direkte Beweis ist schwer zu führen. Sinnvollere Indikatoren: Rückgang ungeplanter Fluktuation im Folgejahr, kürzere Verhandlungsdauer in der Gehaltsrunde, sinkende Anzahl reaktiver Gegenangebote nach Kündigungen.
Drei typische Einstiegsfehler
1. Stellentitel statt Rolle matchen Der häufigste Fehler: Interne Titel werden direkt mit Marktdaten verknüpft, ohne das tatsächliche Aufgabenprofil zu überprüfen. Ein “Senior Marketing Manager” in einem 40-Personen-Unternehmen übernimmt typischerweise Aufgaben, die bei einem 400-Personen-Unternehmen drei verschiedene Positionen abdecken — entsprechend anders ist das Marktgehalt. Ein Test durch das PeopleNerd-Blog (2024) zeigte, dass KI-Gehaltstools für dieselbe Rolle Empfehlungen mit bis zu 177 Prozent Varianz produzierten — fast immer wegen schlechtem Job-Matching, nicht wegen schlechter Daten. Lösung: Für jede Rolle eine 3–5-Zeilen-Jobbeschreibung mit Kernverantwortlichkeiten erstellen, bevor mit dem Matching angefangen wird. Diese Beschreibung ist dann die Grundlage für die Rollenzuordnung.
2. Eine Quelle als ausreichend behandeln Wer nur Stepstone oder nur Glassdoor nutzt, hat eine verzerrte Basis: Glassdoor-Daten sind selbst gemeldet und überrepräsentieren gut verdienende Fachkräfte; Stepstone-Daten sind breiter, aber generisch. Kein einzelnes Tool hat eine vollständige, repräsentative Datenbasis für alle Branchen und Unternehmensgrößen. Lösung: Mindestens drei Quellen kombinieren und die Medianabweichungen zwischen Quellen als Qualitätsindikator nutzen. Wenn zwei Quellen 20 Prozent auseinanderliegen, ist menschliche Einschätzung nötig — die KI-Zahl kann nicht einfach übernommen werden.
3. Das System einmalig aufbauen und dann vernachlässigen Das ist der gefährlichste Fehler — weil er still passiert. Gehaltsstrukturen, die einmal aufgebaut und dann nicht gepflegt werden, veralten. Märkte verändern sich: In Boom-Phasen steigen Gehälter in bestimmten Sektoren um 15–20 Prozent innerhalb von 18 Monaten. Wer seinen Benchmark nicht aktualisiert, vergleicht sich mit Vergangenheitswerten. Lösung: Einen festen Reviewtermin im Kalender setzen — mindestens einmal jährlich, besser halbjährlich für Rollen in schnellen Märkten. Wer eine der Plattformlösungen wie Ravio nutzt, bekommt Updates automatisch durch HRIS-Integration. Beim Custom-Ansatz muss die Aktualisierung manuell geplant werden.
Was mit der Einführung wirklich passiert — und was nicht
Gehaltsdaten sind in den meisten Unternehmen ein Tabuthema. Das verändert die Einführungsdynamik erheblich.
Das passiert: Sobald es eine strukturierte Basis für Gehaltsvergleiche gibt, kommen Fragen auf, die vorher nicht gestellt wurden. Führungskräfte, die bisher nach Verhandlungsgeschick und Betriebszugehörigkeit bezahlt haben, müssen plötzlich erklären, warum zwei Personen mit ähnlichen Aufgaben 15 Prozent Gehaltsunterschied haben. Das ist unangenehm — und produktiv. Diese Gespräche sollten proaktiv geführt werden, nicht reaktiv nach einer Beschwerde.
Das passiert nicht: Die Ergebnisse werden nicht ohne Kontroversen akzeptiert. Wenn das System zeigt, dass drei langjährige Mitarbeitende deutlich unter Markt liegen, entsteht unmittelbarer Handlungsdruck. Wer das Ergebnis nur präsentiert ohne Budget und Entscheidungsmandat, hat die Erwartungen falsch gesetzt. HR sollte das Benchmarking nicht als Analyse-, sondern als Entscheidungsunterstützungs-Projekt aufsetzen — mit Rückendeckung aus der Geschäftsführung vor dem ersten Datenlauf.
Konkrete Empfehlungen:
- Vor dem ersten Benchmarking-Lauf klären: Welche Korridor-Entscheidungen kann HR selbst treffen, welche brauchen GF-Freigabe?
- Ergebnis zuerst mit der Geschäftsführung besprechen, nicht direkt mit Führungskräften oder Mitarbeitenden teilen
- Lohngerechtigkeitslücken (z.B. nach Geschlecht) separat behandeln: Das ist eine rechtliche Angelegenheit, keine HR-Optimierungsdiskussion
- Kommunikationslinie für Mitarbeitende vorbereiten: Was wird kommuniziert, wenn jemand fragt, warum keine sofortige Anpassung kommt?
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Datenvorbereitung | Woche 1–2 | Interne Gehaltsdaten strukturieren, Rollen inventarisieren, Stellenbeschreibungen für Matching aufbereiten | Stellentitel-Chaos — zu viele einmalige Titel ohne Standardisierung, Job-Matching dauert doppelt so lang |
| Quellenauswahl und -beschaffung | Woche 2–3 | Externe Quellen auswählen, Kienbaum/Stepstone-Reports beschaffen oder Ravio-Demo und Onboarding abschließen | Überraschend hohe Kosten für kommerzielle Surveys, falls kein Tool-Ansatz gewählt wird |
| Benchmarking-Durchlauf | Woche 3–5 | Rollenmatching, Normalisierung, erste Bandbreiten-Auswertung | Matching-Fehler bei Senior-Positionen mit breitem Aufgabenspektrum — manuelle Nachkorrektur nötig |
| Plausibilisierung und Review | Woche 5–7 | Ergebnisse mit 1–2 Führungskräften validieren, Ausreißer begründen oder korrigieren | Führungskräfte akzeptieren Daten nicht — Quellenvertrauen und Methodik vorab erklären |
| Ergebnis und Entscheidungsvorlage | Woche 7–10 | Gehaltsband-Empfehlungen aufbereiten, GF-Präsentation erstellen, Maßnahmen priorisieren | GF verschiebt Entscheidung auf nächste Gehaltsrunde — ohne konkreten Zeitplan verliert das Projekt Momentum |
Wichtig: Das erste Ergebnis ist nicht das perfekte Ergebnis. Job-Matching verbessert sich mit jeder Iteration. Das Ziel des ersten Durchlaufs ist: Eine Grundlage haben, die besser ist als keine Grundlage.
Häufige Einwände — und was dahintersteckt
„Unsere Gehaltsdaten sind zu sensibel, um sie in ein Tool einzugeben.” Das ist ein berechtigter Einwand, kein unbegründetes Misstrauen. Wichtig: Für eine erste Analyse müssen nicht alle individuellen Gehälter in ein externes Tool eingegeben werden. Eine anonymisierte Aggregation nach Rollenkategorie (z.B. „Software Engineer Stufe 3: Median 72.000 €, Bandbreite 65.000–82.000 €”) ist ausreichend für den Marktvergleich und enthält keine personenbezogenen Daten. Der Custom-Ansatz mit LLM lässt sich so gestalten, dass keine individuelle Person identifizierbar ist. Die Frage der Lohngerechtigkeits-Analyse mit Personenbezug behandelt der Datenschutz-Abschnitt weiter oben — kurz: separater Schritt, eigene Datenschutz-Folgenabschätzung, andere Spielregeln.
„Marktdaten aus dem Internet sind doch sowieso unzuverlässig.” Stimmt für einzelne Quellen. Glassdoor-Daten haben bekannte Qualitätsprobleme (Selbst-Reporting, Überrepräsentation gut bezahlter Positionen). Für eine Entscheidungsgrundlage ist nicht Perfektionsgenauigkeit nötig, sondern eine Richtungsaussage: Sind wir bei dieser Rolle 20 Prozent unter Markt, oder liegen wir im normalen Bereich? Für diese Frage ist eine kombinierte Drei-Quellen-Methodik ausreichend. Wer perfekte Daten braucht, kauft einen Kienbaum-Survey für 1.500–3.000 Euro. Wer eine erste Strukturierungsbasis braucht, kommt mit aggregierten öffentlichen Quellen weit.
„Wir sind zu klein für so ein System.” Für Unternehmen unter 40 Mitarbeitenden stimmt das — die Personalkostenstruktur ist überschaubar und ein Excel-Modell mit Stepstone-Daten reicht vollständig aus. Ab 40 Mitarbeitenden mit mehr als 8 verschiedenen Rollen beginnt jedoch die Komplexität zu steigen — und damit das Risiko, Lohngerechtigkeitslücken oder Fluktuationsrisiken zu übersehen. Der Custom-LLM-Ansatz ist ohne signifikante Tool-Kosten umsetzbar; der Einstieg ist also auch für kleinere Unternehmen ohne Budget-Hürde möglich.
Woran du merkst, dass das zu dir passt
- Ihr habt mehr als 40 Mitarbeitende in mehr als 8 verschiedenen Rollen und keine strukturierten Gehaltsbänder
- Eure letzten zwei bis drei Abgänge waren Fachkräfte, nicht leistungsschwächere Mitarbeitende — und mindestens einer ist zu einem direkten Wettbewerber gewechselt
- Reaktive Gegenangebote nach Kündigungen sind ein regelmäßiges Phänomen — ihr verhandelt, nachdem jemand das Gespräch eröffnet hat, nicht davor
- Die jährliche Gehaltsrunde basiert mehr auf “was war letztes Jahr” und Verhandlungsgeschick als auf strukturierten Marktdaten
- Das Entgelttransparenzgesetz 2026 ist bisher noch nicht auf eurem Radar — und ihr ahnt, dass ihr bis dahin strukturierte Gehaltsbänder brauchen werdet
- Ihr habt Personio oder ein vergleichbares HRIS und alle Gehaltsdaten bereits digital — der Datenexport ist kein Problem
Wann es sich (noch) nicht lohnt — drei harte Ausschlusskriterien:
-
Unter 40 Mitarbeitenden oder weniger als 8 klar definierten Rollen. Der Einrichtungsaufwand steht in keinem Verhältnis zur Komplexität. Ein manueller Vergleich mit dem Stepstone-Gehaltsreport (kostenlos herunterladbar) plus einem 30-Minuten-Gespräch mit einem Personalberater ergibt hier eine ausreichend gute Grundlage.
-
Keine sauberen Stellenbeschreibungen vorhanden. Wenn interne Rollen nicht klar abgegrenzt und dokumentiert sind, ist das Job-Matching nicht zuverlässig möglich. Bevor KI-Benchmarking eingeführt wird, sollte jede Rolle mindestens eine 5-zeilige Beschreibung der Kernverantwortlichkeiten haben. Ohne das ist das Ergebnis Garbage-in-Garbage-out — die Zahlen sehen strukturiert aus, basieren aber auf falschen Zuordnungen.
-
Keine HR-Person mit 3–4 Stunden/Monat für Pflege und Validation. Benchmarking-Ergebnisse brauchen regelmäßige Prüfung: Haben sich Marktbedingungen verändert? Wurden neue Rollen eingeführt? Stimmt das Job-Matching noch? Wer das System einführt und dann drei Monate nicht anfasst, hat nach einem Jahr veraltete Benchmarks — schlechte Daten ergeben schlechte Ergebnisse, und Entscheidungen auf Basis von Scheinpräzision sind schlimmer als keine Daten zu haben.
Das kannst du heute noch tun
Lade den aktuellen Stepstone Gehaltsreport herunter (kostenlos unter stepstone.de) und den Robert Half Salary Guide (ebenfalls kostenlos). Such dir die fünf Rollen heraus, für die ihr aktuell die höchste Fluktuationsrate habt oder die im nächsten Jahr am schwersten zu besetzen sein werden. Notiere für jede Rolle den internen Mediangehalt und das Marktmedian aus den Reports. Bereits diese simple Analyse zeigt dir in zwei Stunden, wo ihr am weitesten vom Markt entfernt seid.
Danach kannst du diesen Prompt direkt mit ChatGPT oder Claude nutzen, um daraus eine strukturierte Analyse zu bauen:
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- Kienbaum Vergütungsstudie Führungskräfte 2025: Kienbaum Management Consultants GmbH, shop.kienbaum.com. Preis ab 1.499 Euro pro Studie. Führende deutsche Vergütungsreferenz für Führungs- und Fachkräfte.
- AI Benchmark Variance-Test (illustrativ): PeopleNerd Substack, „Why Your AI-Generated Salary Benchmarks Are Wrong” (2024) — einzelner Praxis-Test, kein peer-reviewter Vergleich, aber demonstriert die Varianz konkret. peoplenerd.substack.com. Größenordnung gestützt durch breitere Branchen-Reviews wie McKinsey „The State of HR Technology 2024” und BCG „Compensation Tech Landscape 2023”.
- Payscale Marktpreisschätzung: Vendr SaaS-Preisdatenbank (2025). Erfahrungswert ~$27.000/Jahr für Marketpay Enterprise.
- Entgelttransparenzrichtlinie: Richtlinie 2023/970/EU des Europäischen Parlaments; Umsetzungsfrist 7. Juni 2026. Deutsche Zusammenfassung: haufe-akademie.de, hrworks.de.
- Fluktuationskosten 6–9 Monatsgehälter: Primär gestützt durch SHRM Human Capital Benchmarking Report 2024 (Cost-per-Hire 50–60 % des Jahresgehalts) und Gallup State of the Workplace 2024. Anbieteranalysen wie Personio nennen ähnliche Bandbreiten, sind aber als sekundär einzuordnen.
- Ravio-Datenbasis: Ravio Ltd., ravio.com — 1.400+ Unternehmen, 50+ Länder, Fokus auf europäische Tech-Märkte (Stand April 2026).
- Compensation Benchmarking Best Practices: Multiple Practitioner-Quellen: INOP.ai (5 Biggest Mistakes, 2024), ravio.com/blog (complete guide to salary benchmarking), performyard.com (2025 Compensation Benchmarking Guide).
Du willst wissen, welcher Ansatz für euer Unternehmen passt und wie ihr die Benchmarking-Daten für die nächste Gehaltsrunde nutzen könnt? Meld dich — das klären wir gemeinsam in einem kurzen Gespräch.
Diesen Inhalt teilen:
Interesse an diesem Use Case?
Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.
Weitere Use Cases
KI-Assistent für interne Wissensdatenbank
Ein KI-Assistent durchsucht alle internen Dokumente quellengenau und beantwortet Fragen direkt — für schnellere Informationsfindung und besseres Onboarding.
Mehr erfahrenAutomatisierte Meeting-Protokolle und Aufgaben
KI transkribiert Meetings, fasst Ergebnisse zusammen und extrahiert Aufgaben mit Verantwortlichkeiten — für lückenlose Dokumentation und weniger vergessene Maßnahmen.
Mehr erfahrenAutomatisierte Rechnungsverarbeitung
KI erkennt Rechnungsfelder automatisch, prüft auf Plausibilität und leitet zur Freigabe weiter — für schnellere Durchlaufzeiten und weniger manuelle Fehler.
Mehr erfahren