Zeiterfassung-Auswertung und Anomalie-Erkennung
KI analysiert Zeiterfassungsdaten auf Unstimmigkeiten, Überstunden-Häufung und Abrechnungsfehler. Automatische Plausibilitätsprüfung vor der Lohnabrechnung.
- Problem
- Zeiterfassungsfehler kosten Zeitarbeitsfirmen durch falsche Abrechnungen und manuelle Korrekturen erheblich. Bei 500+ Mitarbeitenden ist manuelle Prüfung nicht möglich.
- KI-Lösung
- ML-gestützte Anomalie-Erkennung in Zeiterfassungsdaten: statistische Ausreißer, unplausible Stempelfolgen, fehlende Einträge automatisch erkannt und gemeldet.
- Typischer Nutzen
- Fehlerquote bei Abrechnungsbuchungen von 1–8 % auf unter 1 % reduzierbar. Korrekturaufwand um ~50 % gesenkt. Bei 500 Zeitarbeitnehmern und 2 % Ausgangs-Fehlerquote bis zu 63.000 € jährliche Einsparung erreichbar.
- Setup-Zeit
- 8–14 Wochen inkl. HRIS-Integration; API-Zugang nötig
- Kosteneinschätzung
- 6.000–18.000 € Einrichtung (ATOSS); 300–800 €/Monat laufend (Infrastruktur Custom-Pipeline)
Es ist Mittwoch, 22:14 Uhr.
Miriam Schäfer hat den Abrechnungslauf für die 620 Zeitarbeitnehmerinnen und -nehmer ihrer Firma gerade abgeschlossen — drei Stunden später als geplant, weil der Export aus dem Zeiterfassungssystem zweimal gehakt hat. Die Überweisungen sind raus. Morgen früh sind die Löhne auf den Konten.
Dann klingelt ihr Telefon. Es ist die Leiterin der Lohnbuchhaltung: „Miriam, wir haben ein Problem. Die Kollegin beim Kunden Metallwerk Hauschild hat heute Nacht mitgeteilt, dass ihre Schichtzulage für die letzten drei Wochen fehlt. Und bei Grohmann Logistik hat jemand angerufen — drei Leute haben zu viele Stunden bekommen. Ich schätze, da liegen noch mehr drin.”
Miriam öffnet die Rohdaten. 4.200 Zeitbuchungen. Keine Anomalie-Prüfung vorgeschaltet, kein Plausibilitäts-Check. Wer den Fehler gemacht hat und wann — unklar. Morgen früh beginnen die Anrufe auf der Kundenhotline.
Das ist kein Ausnahmetag. Das ist der Monat, in dem das Puffersystem aus manueller Sichtkontrolle und Erfahrungswerten endgültig überfordert ist.
Das echte Ausmaß des Problems
In der Zeitarbeit ist die Abrechnung nach Einschätzung von Branchenexperten in keiner anderen Branche auch nur annähernd so komplex: Branchenzuschläge, Equal-Pay-Regelungen, Schicht- und Feiertagszulagen, Höchstüberlassungsdauer, Überstundenkonten je Tarif und Einsatzbetrieb — das ist kein Standardfall für eine Lohnbuchhaltung. Es ist Spezialwissen, das sich in einer handvoll Mitarbeitenden konzentriert und dessen Ausfall sofort spürbar ist (Quelle: Arbeitsblog.de).
Die Konsequenzen von Fehlern sind weit über das Finanzielle hinaus wirksam:
- Falsche Lohnabrechnungen schädigen das Verhältnis zu Zeitarbeitnehmern und beschädigen die Reputation als Arbeitgeber auf einem engen Kandidatenmarkt
- Fehlerhafte Kundenrechnungen belasten Geschäftsbeziehungen und können zu Rückforderungen führen
- Wiederholte Verstöße gefährden im Extremfall die Erlaubnis zur Arbeitnehmerüberlassung nach AÜG — das wäre das Ende des Betriebs
Was kostet ein einzelner Abrechnungsfehler im Durchschnitt? Laut einer Analyse von EY (2022), ausgewertet durch Paycom, liegt der Korrektursaufwand je Einzelfehler bei rund 230–290 US-Dollar — noch ohne Folgekosten durch Mitarbeiterbeschwerden, Nachzahlungsläufe oder Bußgelder. Bei einem Unternehmen mit 1.000 Mitarbeitenden und klassischer manueller Prüfung können sich die jährlichen Korrekturkosten auf über 900.000 US-Dollar summieren. Für einen deutschen Personaldienstleister mit 500 Zeitarbeitnehmern ist eine konservative Schätzung von 80.000–150.000 Euro pro Jahr realistisch — direkte Korrekturen, Nachläufe, Zeitaufwand.
Erschwerend kommt hinzu: Zeiterfassungsdaten in der Zeitarbeit sind strukturell fehleranfälliger als in anderen Branchen. Einsatzbetrieb, Kostenstelle, Tarif und Zulagenregeln können sich monatlich ändern. Stempelfolgen entstehen oft beim Kunden, nicht im eigenen System. Manuelle Korrekturen durch Disponenten, Zeitarbeitnehmer und Kundenbetrieb fließen zeitversetzt ein. Das Ergebnis: Im Datenstrom vor dem Abrechnungslauf stecken systematisch mehr Ausreißer als in jeder stabilen Betriebsumgebung.
Was Machine Learning hier leistet: Ein statistisches Modell lernt aus historischen Stempeldaten, was für jeden Mitarbeitenden, jede Kostenstelle und jeden Einsatzbetrieb als normal gilt — und markiert automatisch Abweichungen, bevor sie in den Abrechnungslauf gehen. Das ist keine Magie, sondern Mustererkennung auf Basis von Daten, die ohnehin vorhanden sind.
Die Ausgestaltung der AÜG-Erlaubnispraxis und mögliche Sanktionen sind Einzelfallfragen — rechtliche Beurteilung gehört zur Fachanwaltschaft Arbeitsrecht oder zum Dialog mit der zuständigen Erlaubnisbehörde.
Mit vs. ohne KI — ein ehrlicher Vergleich
| Kennzahl | Ohne KI-Prüfung | Mit KI-gestützter Anomalie-Erkennung |
|---|---|---|
| Fehler im Abrechnungslauf entdeckt | Meist nach Überweisung (durch Beschwerden) | Vor dem Lauf (automatisch markiert) |
| Manuelle Prüfzeit je Monat | 15–40 Stunden (Schätzwert, variiert stark) | 3–8 Stunden (nur markierte Fälle prüfen) |
| Anteil nachkorrigierter Buchungen | 1–8 % (manuelle Systeme, laut Paycom/EY) | Unter 1 % in gut konfigurierten Systemen |
| Erkennungsgeschwindigkeit | Tage bis Wochen nach Abrechnungslauf | Stunden bis 1 Tag vor Abrechnungslauf |
| Compliance-Nachweise bei Prüfung | Manuell zusammengestellt | Automatisch protokolliert |
| Skalierung auf 500+ MA | Kaum möglich ohne wachsendes Team | Proportionaler Mehraufwand marginal |
Die 1–8 Prozent Fehlerquote bei manuellen Prozessen gilt laut EY-Studie (2022) für klassische Lohnverarbeitung — in der Zeitarbeit mit ihrer Tarifkomplexität kann dieser Wert höher liegen. Mit KI-gestützter Prüfung liegen gut kalibrierte Systeme unter einem Prozent nachkorrigierter Buchungen.
Einschätzung auf einen Blick
Zeitersparnis — mittel (3/5)
Die größte Entlastung entsteht beim Abrechnungslauf selbst: statt stundenlanger manueller Sichtkontrolle prüfst du nur noch die ca. 2–5 Prozent der Buchungen, die das System als auffällig markiert hat. Im Tagesgeschäft ändert sich wenig — der Nutzen konzentriert sich auf den Zeitraum unmittelbar vor dem Abrechnungsschluss. Im Branchenvergleich des Zeitarbeit-Portfolios ist das Mittelfeld: Kandidaten-Kommunikation oder Stellenanzeigen-Erstellung entlasten täglich, Zeiterfassungsprüfung entlastet monatlich.
Kosteneinsparung — hoch (4/5)
Pro verhindertem Fehler liegt die Einsparung erfahrungsgemäß zwischen 250 und 700 Euro (Direktkosten Korrektur, Nachlauf, ggf. Bußgeld-Risiko). Bei einer Zeitarbeitsfirma mit 500 Mitarbeitenden und einer Ausgangs-Fehlerquote von zwei bis drei Prozent der Buchungen summiert sich das. Nicht ganz ein 5-Punkt-Wert, weil die tatsächliche Einsparung stark vom Ausgangs-Fehlerniveau abhängt: Wer heute kaum Fehler hat, gewinnt weniger. Wer bereits ein strukturiertes ATOSS-Setup mit Regeln hat, gewinnt ebenfalls weniger als wer noch auf Excel-Exporte angewiesen ist.
Schnelle Umsetzung — gering (2/5)
Das ist der ehrlichste Score dieses Anwendungsfalls. Die Integration in das bestehende Zeiterfassungssystem (ATOSS, Interflex, Zeus oder ein anderes HRIS) braucht eine API-Anbindung oder mindestens einen strukturierten Datenexport. Das Modell muss auf historischen Daten trainiert werden — typisch sechs bis zwölf Monate Buchungshistorie. Realistisches Pilotdatum: 8–14 Wochen nach Projektstart. Das ist keine besonders aufwendige KI-Einführung, aber kein Werkzeug das morgen früh läuft.
ROI-Sicherheit — hoch (4/5)
Im Unterschied zu vielen anderen KI-Anwendungen ist der ROI hier direkt messbar: Du zählst die Fehler vor und nach der Einführung, rechnest den Korrekturaufwand durch und hast eine klare Zahl. Kein indirekter Nutzen, keine Schätzungen über Mitarbeiterzufriedenheit. Einen Punkt Abzug, weil das Ausgangs-Fehlerniveau stark variiert: Wer wenige Fehler hat, sieht wenig ROI; wer viele hat, sieht viel — und das lässt sich vor der Einführung schwer präzise vorhersagen.
Skalierbarkeit — mittel (3/5)
Das Modell skaliert gut auf mehr Mitarbeitende — mehr Daten, mehr Muster, mehr Erkennungsqualität. Aber: Mit mehr Einsatzbetrieben, mehr Tarifverträgen und mehr Sonderzulagenregeln wächst auch die Komplexität der Regeln, die das System kennen muss. Ein Unternehmen, das von 200 auf 800 Mitarbeitende wächst und dabei in zwei neue Tarifbereiche expandiert, muss das Modell nachkalibrieren. Das ist handhabbar — aber kein automatisches Wachstum wie bei reinen Textanalyse-Tools. Im Zeitarbeit-Portfolio liegt diese Kategorie bei 3 — besser als die langsam skalierenden Kandidaten-Matching-Prozesse, aber schwächer als Stellenanzeigen oder Kandidaten-Kommunikation.
Richtwerte — stark abhängig von aktuellem Fehlerniveau, Tarifvarianz und Integration in bestehende Systemlandschaft.
Was das System konkret macht
Das Ziel ist einfach: Fehler im Zeiterfassungsdatenstrom finden, bevor sie zur falschen Auszahlung werden. Technisch gibt es dafür drei Ansätze, die sich gegenseitig ergänzen.
Statistischer Ausreißer-Abgleich
Jede Mitarbeiterin und jeder Mitarbeiter hat ein persönliches Stundenprofil: typische Schichtlänge, häufigste Einsatzbetriebe, Muster bei Überstunden. Ein statistisches Modell (z.B. Isolation Forest oder ein einfaches Z-Score-Verfahren) vergleicht jede neue Buchung mit diesem Profil. Stempelt jemand 14 Stunden, der normalerweise acht macht — Auffälligkeit. Fehlt ein Einstempel bei jemand, der nie ohne Ausstempel endet — Auffälligkeit. Das ist kein Regelwerk, sondern ein Lernmodell, das sich über Zeit anpasst.
Sequenzprüfung
Zeiterfassungsdaten haben eine Logik: Einstempel kommt vor Ausstempel. Pausen haben Mindestdauern nach § 4 ArbZG. Ruhezeiten zwischen Schichten betragen mindestens elf Stunden. Wer nach 23 Stunden wieder eingestempelt ist — das ist entweder ein Fehler oder ein meldepflichtiger ArbZG-Verstoß. Regelbasierte Sequenzprüfung erkennt diese Muster zuverlässig, auch ohne Machine-Learning-Komponente. Ob ein konkreter Fall meldepflichtig ist, hängt von Tarif, Ausnahmegenehmigungen und Aufsichtsbehörden-Praxis ab — fachanwaltlich klären lassen.
Fehlende Einträge erkennen
Besonders in der Zeitarbeit passiert es häufig, dass Einsätze abgerechnet werden, zu denen keine Zeiterfassungsbuchung vorliegt — oder umgekehrt: Buchungen ohne korrespondierende Einsatzzuordnung. Ein Abgleich von Dispositionsdaten mit Zeiterfassungsdaten deckt diese Lücken auf. Das ist technisch unkompliziert, aber manuell bei 600 Mitarbeitenden schlicht nicht machbar.
Ergebnis: eine priorisierte Prüfliste
Das System gibt keine Weisung — es markiert. Der Output ist eine gerankte Liste auffälliger Buchungen mit dem Hinweis, welche Regel oder welches Muster die Auffälligkeit ausgelöst hat. Die Sachbearbeiterin entscheidet, ob es ein echter Fehler ist oder eine erklärbare Ausnahme. Das ist wichtig: Das Modell ersetzt kein menschliches Urteil, es fokussiert die menschliche Prüfkapazität auf die richtigen drei Prozent der Buchungen.
Wo Anomalie-Erkennung blind ist — Falsch-Negative verstehen
Das ist der Teil, den Anbieter gerne weglassen: Es gibt Fehlermuster, die ein statistisches Modell systematisch übersieht — nicht wegen schlechter Programmierung, sondern wegen inhärenter Blindstellen der Methode.
Koordinierte Muster, die als normal gelten
Wenn ein Disponent und ein Zeitarbeitnehmer systematisch zusammenarbeiten — z.B. Zeiten werden immer auf den nächsten Viertelstundenwert aufgerundet, oder Pausen werden konsequent nicht erfasst — dann lernt das Modell dieses Muster als “normal”. Es ist der individuelle Durchschnitt, gegen den neue Buchungen gemessen werden. Was der Einzelne immer so macht, fällt nicht auf, egal wie weit es vom Gesamtdurchschnitt abweicht.
Konsequent knappe Verstöße
Ein Mitarbeitender, der jede Schicht genau auf 9,9 Stunden stempelt (ArbZG §3 erlaubt bis zu zehn Stunden täglich, im Ausnahmefall bis zwölf), statt echte Achtstundenschichten zu leisten — das System sieht keinen Ausreißer, sondern einen Hochleister ohne Regelverstoß. Ob die Buchung der Realität entspricht, ist statistisch nicht prüfbar. Tarifabweichungen und behördliche Ausnahmen können andere Grenzen festsetzen — keine Rechtsauskunft.
Richtig falsche Stammdaten
Wenn der falsche Tarif, der falsche Einsatzbetrieb oder die falsche Kostenstelle in den Stammdaten hinterlegt ist, berechnet das System den Ausreißer gegen die falsche Basis. Ein Buchhalter, der nach Tarif A stempelt, aber nach Tarif B abgerechnet werden müsste — das ist kein Zeiterfassungsfehler, sondern ein Stammdatenfehler, der im Modell unsichtbar bleibt.
Saisonale Ausnahmen, die wie Fehler aussehen
Feiertagsmonate, Schul- oder Semesterferien, Erntezeiten in der Lebensmittelproduktion — wenn ein Zeitarbeitnehmer plötzlich 60 Stunden statt 40 Stunden stempelt, weil der Einsatzbetrieb Sonderschichten beauftragt hat, markiert das Modell einen Ausreißer. Der Abgleich mit dem Auftragsvolumen aus dem Dispositionssystem ist die Lösung — aber nur wenn die Integration sauber ist.
Was das bedeutet: Anomalie-Erkennung reduziert Fehler zuverlässig, eliminiert sie nicht. Für strukturierte Manipulationen, abgestimmte Muster und Stammdatenprobleme bleiben manuelle Stichproben und regelmäßige Audits weiterhin notwendig. Der Wert der KI liegt darin, die 95 Prozent zuverlässig abzufangen — die restlichen fünf Prozent brauchen menschliche Aufmerksamkeit, die das System freischaufelt.
Compliance-Konsequenzen: ArbZG, MiLoG und AÜG im Takt halten
Zeitarbeitsfirmen bewegen sich bei der Zeiterfassung gleichzeitig in drei Rechtsrahmen, die sich überschneiden und verstärken.
Arbeitszeitgesetz (ArbZG)
§§ 3–7 ArbZG setzen harte Grenzen: zehn Stunden Tageshöchstarbeitszeit, elf Stunden Mindestruhezeit, Mindestpausen. Für Zeitarbeitnehmer gelten diese Grenzen unabhängig davon, ob der Einsatzbetrieb eigene abweichende Regelungen hat. Verstöße können als Ordnungswidrigkeit verfolgt werden, in Wiederholungsfällen als Straftat (§ 22 ArbZG). Eine Anomalie-Erkennung, die konsequent Ruhezeiten und Tageshöchststunden prüft, ist damit nicht nur ein Qualitätswerkzeug — sie ist ein Compliance-Signal.
Mindestlohngesetz (MiLoG)
§ 17 MiLoG (in Verbindung mit der Mindestlohndokumentationspflichten-Verordnung) verpflichtet zur lückenlosen Aufzeichnung von Beginn, Ende und Dauer der Arbeitszeit für bestimmte Beschäftigungsgruppen — in der Zeitarbeit ist das praktisch durchgängig relevant. Die Aufzeichnung muss innerhalb von sieben Tagen nach der Arbeitsleistung vollständig sein, zwei Jahre aufbewahrt werden. Fehlerhafte oder lückenhafte Aufzeichnungen können Bußgelder bis zu 30.000 Euro je Verstoß auslösen. Zahlt ein Unternehmen in der Folge nachweislich unter dem Mindestlohn, sind Bußgelder bis zu 500.000 Euro möglich (§ 21 MiLoG).
Arbeitnehmerüberlassungsgesetz (AÜG)
§ 17c AÜG verankert für Zeitarbeitsfirmen eigene Aufzeichnungspflichten. Wichtig: Der Entleihbetrieb (das Kundenunternehmen) trägt hier eine Mitverantwortung. Fehlerhafte Zeiterfassung beim Kunden, die in die Abrechnung des Verleihers einfließt, ist kein internes Problem mehr — es ist ein gemeinsames Compliance-Risiko.
Diese Darstellung ist eine fachliche Orientierung, kein Rechts- oder Beratungsersatz. ArbZG-, MiLoG- und AÜG-Anforderungen sollten mit einer auf Arbeitsrecht spezialisierten Kanzlei abgestimmt werden.
Konkrete Werkzeuge — was wann passt
Es gibt keinen dedizierten “Zeitarbeit-Anomalie-Erkennungs-Service” von der Stange. In der Praxis gibt es drei Implementierungspfade:
Weg 1: ATOSS-native Plausibilitätsprüfung
ATOSS enthält bereits regelbasierte Prüfmechanismen: Ruhezeiten, Tageshöchststunden, fehlende Stempel. Wer ATOSS Time Control oder die Staff Efficiency Suite im Einsatz hat, kann diese Funktionen oft ohne Zusatzkauf aktivieren. Das ist kein Machine Learning — aber für viele Betriebe bis ca. 500 Mitarbeitende der sinnvollste erste Schritt. Kosten: in der bestehenden ATOSS-Lizenz enthalten, Einrichtung typisch 5–10 Beratertage.
Ähnlich: Personio bietet für kleinere Betriebe Arbeitszeitkonto-Auswertungen und Regelprüfungen — ohne ML, aber als niedrigschwelligen Einstieg in strukturierte Prüfprozesse. Sinnvoll bis ca. 200 Mitarbeitende.
Weg 2: Datenanalyse-Plattform mit Anomalie-Modul
Wer Zeiterfassungsdaten bereits aus ATOSS, Interflex, Zeus oder einem anderen System als CSV oder per API exportieren kann, kann diese mit Julius AI oder Microsoft Power BI (mit statistischen Anomalie-Funktionen) auswerten. Julius AI erkennt Ausreißer in tabellarischen Daten ohne Code — gut für erste Explorations-Analysen. Power BI ermöglicht mit der eingebauten Anomaly Detection-Funktion in Zeitreihendiagrammen automatische Auffälligkeitsmarkierung auf Dashboard-Ebene. Kosten: Julius AI ab 20 USD/Monat (Plus-Plan), Power BI Premium ab ca. 20 EUR/Nutzer/Monat.
Weg 3: Custom ML-Pipeline für Betriebe mit Datenkompetenz
Python (mit Bibliotheken wie scikit-learn, PyOD oder River) ermöglicht maßgeschneiderte Anomalie-Erkennung: Isolation Forest, Local Outlier Factor oder Autoencoder-Modelle auf den eigenen Zeiterfassungsdaten trainiert. Das liefert die höchste Erkennungsqualität — erfordert aber einen internen Data-Analyst oder externen Dienstleister. Für den produktiven Einsatz empfiehlt sich der Betrieb auf AWS SageMaker oder einer vergleichbaren Plattform. Einmalkosten für Aufbau: typisch 15.000–40.000 Euro. Laufend: 300–800 Euro/Monat Infrastruktur.
Zusammenfassung — wann welcher Weg
- Bereits ATOSS im Einsatz → ATOSS-native Regelprüfung aktivieren und konfigurieren
- Unter 200 Mitarbeitende, Personio-Nutzer → Personio-Auswertungen plus manuelle Stichproben
- Daten exportierbar, erste Analysen gewünscht → Julius AI oder Power BI als Einstieg
- 300+ Mitarbeitende, eigene IT, Datenbankzugriff → Custom ML-Pipeline lohnt sich
Datenschutz und Datenhaltung
Zeiterfassungsdaten sind personenbezogene Daten im Sinne der DSGVO — vollständig und ohne Ausnahme. Beginn, Ende und Dauer der Arbeitszeit einer namentlichen Person ist ein personenbezogenes Datum. Das hat konkrete Konsequenzen:
Auftragsverarbeitungsvertrag (AVV) ist Pflicht.
Sobald ein externer Dienstleister (auch eine Cloud-Plattform wie Julius AI oder AWS SageMaker) Zeiterfassungsdaten verarbeitet, muss ein AVV nach Art. 28 DSGVO vorliegen. Das gilt auch für scheinbar harmlose CSV-Uploads in SaaS-Analyse-Tools.
EU-Hosting vs. US-Hosting.
ATOSS und Personio betreiben ihre Dienste auf deutschen bzw. EU-europäischen Servern — DSGVO-konform ohne Sondermaßnahmen. Julius AI verarbeitet Daten in den USA — für produktiven Einsatz mit Mitarbeiterdaten nicht geeignet ohne weitere vertragliche Absicherung. AWS SageMaker ist EU-region-fähig (Frankfurt, eu-central-1) — wenn explizit konfiguriert, eine DSGVO-konforme Option.
Betriebsrat.
In Betrieben mit Betriebsrat unterliegt die Einführung eines Überwachungs- oder Auswertungssystems für Zeiterfassungsdaten der Mitbestimmung nach § 87 Abs. 1 Nr. 6 BetrVG. Das ist kein Hindernis — aber ein Schritt, der frühzeitig in die Projektplanung gehört, nicht als Nachgedanke.
Praktischer Ratschlag:
Bevor du Zeiterfassungsdaten in ein externes Analyse-Tool lädst, kläre mit eurem Datenschutzbeauftragten oder einer DSGVO-Beratung drei Fragen: Wird ein AVV benötigt? Wo werden die Daten verarbeitet? Muss eine Datenschutz-Folgenabschätzung nach Art. 35 DSGVO durchgeführt werden (bei systematischer Überwachung von Beschäftigten wahrscheinlich ja)?
Was es kostet — realistisch gerechnet
Variante 1: ATOSS-native Prüfung (günstigster Einstieg)
- Bereits im Lizenzpaket enthalten, falls ATOSS Time Control oder Staff Efficiency Suite vorhanden
- Einrichtung und Konfiguration durch ATOSS-Berater: ca. 5–10 Tage à 1.200–1.800 Euro = 6.000–18.000 Euro einmalig
- Laufende Kosten: keine zusätzlichen (Teil der bestehenden Lizenz)
Variante 2: Datenanalyse-Plattform (Power BI / Julius AI)
- Lizenz Power BI Premium: ca. 20 Euro/Nutzer/Monat; Julius AI Plus: 20 USD/Monat
- Einrichtung Dashboards und Anomalie-Logik: ca. 3–5 Tage intern oder extern = 2.000–8.000 Euro einmalig
- Laufende Kosten: 20–200 Euro/Monat je nach Nutzeranzahl und Plattform
Variante 3: Custom ML-Pipeline
- Aufbau: typisch 15.000–40.000 Euro (Data Scientist, Entwicklung, Testing)
- Infrastruktur AWS SageMaker (EU-Region): 300–800 Euro/Monat
- Lohnt sich ab ca. 400 Mitarbeitenden und dokumentierter Ausgangs-Fehlerquote über zwei Prozent
Was du dagegen rechnen kannst
Ein Unternehmen mit 500 Zeitarbeitnehmern, das monatlich 1.500 Buchungen erzeugt und eine Fehlerquote von zwei Prozent hat, kommt auf 30 fehlerhafte Buchungen pro Monat. Bei 250 Euro Korrekturaufwand je Fehler: 7.500 Euro monatlich, 90.000 Euro jährlich. Eine ML-Lösung, die 70 Prozent dieser Fehler abfängt (konservativer Wert), spart also rund 63.000 Euro pro Jahr. Das amortisiert auch eine Custom-Pipeline in weniger als einem Jahr.
Wie du an die Baseline kommst: Bitte deine Lohnbuchhaltung, rückwirkend für drei Monate die Zahl der Nachkorrekturen und Sondernachläufe zu zählen. Das ist die ehrlichste Vorbereitung für die ROI-Rechnung.
Typische Einstiegsfehler
1. Das Modell auf unbereinigten Rohdaten trainieren.
Wenn die letzten 12 Monate Zeiterfassungsdaten bereits Fehler, System-Umstellungen und manuelle Korrekturen enthalten, lernt das Modell, diese als “normal” zu betrachten. Bevor das Training beginnt, muss die Datenbasis gezielt aufbereitet werden: offensichtliche Systemfehler (endlose Einstempel ohne Ausstempel durch Serverausfall) markieren und ausschließen. Das klingt aufwendig — in der Praxis dauert es bei einem erfahrenen Data Analyst eine Woche, und es entscheidet über die Erkennungsqualität der nächsten zwei Jahre.
2. Nur technische Ausreißer suchen, keine fachlichen Regeln hinterlegen.
Ein statistisches Modell findet, was ungewöhnlich ist — aber nicht, was gesetzlich falsch ist. Die ArbZG-Ruhezeit-Verletzung bei 9 Stunden 45 Minuten Schicht nach 11 Stunden Pause sieht statistisch unauffällig aus, wenn alle anderen ähnlich stempeln. Regelbasierte Prüfung (Mindestpause, Maximalarbeitszeit, MiLoG-Dokumentationslücken) muss parallel laufen — nicht statt, sondern zusätzlich zur ML-Komponente. Die konkrete Regelausgestaltung — Schwellen, Ausnahmen, Tarif — gehört in eine arbeitsrechtliche Prüfung, nicht in das ML-Setup.
3. Das System einrichten und dann alleine lassen.
Das ist der gefährlichste Fehler — weil er still passiert. Wenn das Unternehmen in einen neuen Tarifbereich expandiert, mit einem neuen Einsatzbetrieb mit abweichenden Schichtzeiten kooperiert oder eine neue Zulagenart einführt, stimmt das gelernte “Normal” nicht mehr. Das System markiert plötzlich viele echte Ausnahmen (Alarm-Fatigue) oder übersieht neue echte Fehler. Wer das Modell betreibt, muss mindestens quartalsweise prüfen: Welche Markierungen waren echte Fehler, welche waren Fehlalarme? Das Feedback fließt zurück ins Modell.
4. Den Betriebsrat nicht rechtzeitig einbinden.
Wer das System produktiv einführt, ohne vorab mit dem Betriebsrat (sofern vorhanden) eine Betriebsvereinbarung abgeschlossen zu haben, riskiert eine Unterlassungsklage. Das stoppt das Projekt nicht dauerhaft, erzeugt aber unnötige Verzögerungen und Vertrauensverluste. Zwei bis drei Monate vor geplantem Pilotstart ist der richtige Zeitpunkt — nicht der Tag vor dem Start.
Was mit der Einführung wirklich passiert — und was nicht
Die Technik ist das Einfachste. Der schwierigere Teil: Disponenten und Sachbearbeiter müssen mit einem System arbeiten, das ihre bisherige Einschätzung systematisch in Frage stellt.
Das Akzeptanzproblem bei erfahrenen Disponenten
Wer seit Jahren ein mentales Modell der eigenen Mitarbeitenden hat — “die Kollegin stempelt immer etwas mehr, das ist bei ihr normal” — empfindet die automatische Markierung dieser Buchungen oft als Misstrauen. Das ist verständlich. Was hilft: Nicht als Kontrollsystem einführen, sondern als Entlastungsystem. Die Botschaft lautet: Du prüfst heute 4.000 Buchungen mental, das System nimmt dir 3.900 davon ab — und bei den 100 springen wir gemeinsam ran. Wer das System mitgestalten darf (welche Regeln, welche Schwellenwerte), verteidigt es.
Was sich tatsächlich ändert
Die Stimmung im Team unmittelbar vor dem Abrechnungslauf: weniger Druck, weil die meisten Probleme schon drei Tage vorher bekannt und in Bearbeitung sind — statt zwei Stunden vor der Überweisung aufzutauchen. Das ist kein kleiner Effekt für Menschen, die diesen Zyklus monatlich erleben.
Was sich nicht ändert
Kundenkommunikation, Nachjustierungen bei Sondervereinbarungen, Tarifinterpretation — das bleibt menschlich. Das System erkennt Ausreißer, aber es kann nicht entscheiden, ob der Ausreißer durch eine mündliche Sonderabsprache mit dem Einsatzbetrieb erklärt wird. Dieses Wissen sitzt weiterhin beim Disponenten.
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Daten-Inventur | Woche 1–2 | Zeiterfassungsexporte prüfen, API-Verfügbarkeit klären, Datenqualität beurteilen | API nicht vorhanden oder Exportformat inkonsistent — externe Dienstleisterpflicht entsteht |
| Datenvorbereitung & Modelltraining | Woche 3–6 | Historische Buchungen bereinigen, erstes Modell trainieren, Baseline-Fehlerquote messen | Zu wenig Buchungshistorie (unter 6 Monate) — Modell unzuverlässig |
| Regelkatalog und Integration | Woche 5–8 | ArbZG/MiLoG-Regelprüfungen hinterlegen, Integration in ATOSS oder HRIS-Export konfigurieren | Regelkatalog unvollständig — wichtige Fehlermuster werden nicht erfasst |
| Pilotbetrieb | Woche 8–12 | Parallelbetrieb: manuelle Prüfung und KI-Prüfung gleichzeitig, Feedback sammeln | Zu viele False Positives → Akzeptanzproblem; Schwellenwerte nachjustieren |
| Produktivbetrieb | Woche 12+ | KI-Prüfung als primärer Gate vor Abrechnungslauf; manuelle Stichproben weiter | Modell veraltet durch neue Tarife oder Einsatzbetriebe — quartalsweisen Prüftermin einplanen |
Hinweis: Der Regelkatalog (Schwellen, Ausnahmetatbestände, Tarifbezüge) muss arbeitsrechtlich validiert werden — die ML-Pipeline operationalisiert nur, sie ersetzt keine juristische Prüfung.
Wichtig: In der Pilotphase wirst du Fehlalarme haben — Buchungen, die das Modell markiert, aber korrekt sind. Das ist kein Zeichen für ein schlechtes System, sondern für ein System, das noch kalibriert wird. Jeder Fehlalarm ist Feedback: Dieser Mitarbeitende hat wirklich ein ungewöhnliches aber korrektes Muster. Das Modell lernt.
Häufige Einwände — und was dahintersteckt
„Unser ATOSS-System macht das doch schon.”
Regelbasierte Prüfungen in ATOSS (Ruhezeiten, Tageshöchststunden) sind keine Anomalie-Erkennung — sie prüfen gegen feste Schwellenwerte, nicht gegen individuelle Muster. Jemand, der chronisch 9:45 Stunden stempelt, fällt nicht auf. Jemand, der plötzlich von 8 auf 14 Stunden springt, fällt auf — aber nur wenn der Schwellenwert entsprechend gesetzt ist. Beide Ansätze ergänzen sich; das eine ersetzt das andere nicht.
„Das kostet mehr, als wir an Fehlern haben.”
Das ist eine legitime Frage — und die Antwort hängt von der Baseline ab. Lass deine Lohnbuchhaltung für drei Monate die Nachkorrekturen zählen. Wenn du unter 15 echte Fehler pro Monat hast, lohnt sich eine Custom-Pipeline nicht — dann reicht das ATOSS-Regelwerk und eine strukturierte manuelle Stichprobe. Wenn du regelmäßig mehr als 30 Korrekturen pro Monat hast, rechnet sich die Investition in aller Regel innerhalb eines Jahres.
„Unsere Mitarbeitenden vertrauen uns — wir brauchen keine Überwachung.”
Das ist kein Widerspruch. Anomalie-Erkennung richtet sich nicht primär gegen Betrug — die meisten Fehler entstehen ohne böse Absicht. Vergessene Ausstempel, falsche Kostenstellen, übersehene Schichtzulagen — das sind menschliche Fehler in einem komplexen System, keine Manipulation. Das Werkzeug schützt Mitarbeitende genauso wie das Unternehmen: Wer zu wenig Stunden bekommt, wird genauso markiert wie wer zu viele bekommt.
Woran du merkst, dass das zu dir passt
Du bist in der richtigen Position für diesen Anwendungsfall, wenn:
- Deine Zeitarbeitsfirma mehr als 200 aktive Zeitarbeitnehmerinnen und -nehmer hat — darunter lohnt sich die Integrationsarbeit kaum
- Ihr habt mehr als drei verschiedene Tarifverträge oder Branchenzuschlagsregelungen aktiv — das ist der Punkt, an dem manuelle Plausibilitätsprüfung systematisch unzuverlässig wird
- Eure Lohnbuchhaltung hat in den letzten sechs Monaten mindestens zwei Sondernachläufe wegen Zeiterfassungsfehler durchgeführt
- Euer Zeiterfassungssystem kann Buchungsdaten per API oder als strukturierten täglichen Export bereitstellen — ohne das ist kein ML-Ansatz möglich
- Ihr habt jemanden intern oder extern, der einen Datensatz aufbereiten und ein erstes Modell aufsetzen kann
Wann es sich (noch) nicht lohnt — drei harte Ausschlusskriterien:
-
Unter ca. 200 Zeitarbeitnehmern. Die Implementierungskosten für eine ML-Pipeline amortisieren sich erst ab einem bestimmten Fehlervolumen. Mit weniger als 200 Mitarbeitenden und einem sorgfältig konfigurierten ATOSS-Regelwerk plus gezielten manuellen Stichproben bist du besser bedient.
-
Kein digitales Zeiterfassungssystem oder nur Papier-/Excel-Erfassung. Anomalie-Erkennung setzt strukturierte, maschinenlesbare Daten voraus. Wer Buchungen noch per Hand eingibt oder auf Excel-Exporte mit inkonsistenten Formaten angewiesen ist, muss zuerst die Dateninfrastruktur aufbauen. Der KI-Schritt kommt danach.
-
Keine Möglichkeit, auf die Rohdaten des Zeiterfassungssystems zuzugreifen. Viele Zeiterfassungssysteme erlauben nur vorgefertigte Reports — keine API, kein strukturierter Buchungsexport. Ohne Zugriff auf Buchungsebene kann kein Modell trainiert werden. Kläre das vor jeder anderen Investition.
Das kannst du heute noch tun
Hol dir aus eurem Zeiterfassungssystem einen Export der letzten drei Monate — alle Buchungen, rohe Stempeldaten, möglichst unbearbeitet. Lade diesen in Julius AI (kostenloser Einstieg, kein technisches Setup nötig). Frag dann konkret:
Mitarbeiter:in
KI-Assistent
Der nächste Schritt: Konfiguriere diesen Prozess für automatischen Monatslauf, oder hol dir ein Gespräch mit deinem ATOSS-Berater darüber, welche Plausibilitätsregeln in deiner bestehenden Lizenz schon aktivierbar sind.
Die im Beispiel gezeigten ArbZG-Bewertungen sind technische Auffälligkeitshinweise, keine Rechtsauskunft — die Bewertung gehört in die Hand der Fachabteilung oder einer arbeitsrechtlichen Kanzlei.
Quellen & Methodik
- Komplexität der Zeitarbeit-Abrechnung: Arbeitsblog.de, „In keiner Branche ist die Rechnungsstellung so verzwickt wie in der Zeitarbeit” (arbeitsblog.de/themen/artikel) — Expertenzitat und Folgenanalyse bei Abwesenheit von Spezialisten-Wissen.
- Abrechnungsfehler-Kostenanalyse: Paycom Blog, „The Real Cost of Payroll Errors in 2026” (paycom.com/resources/blog) auf Basis einer EY-Studie (Dezember 2022): ca. 20 % Fehlerquote bei manuellen Prozessen, ca. 291 USD durchschnittlicher Einzelfehler, bis zu 922.000 USD Jahreskorrekturkosten bei 1.000 Mitarbeitenden.
- MiLoG-Bußgelder: § 21 Mindestlohngesetz (MiLoG) in der aktuell gültigen Fassung; bestätigt durch trialog-magazin.de (DATEV), papershift.com/blog.
- AÜG § 17c: Gesetze-im-Internet.de (BGBl I, aktuelle Fassung) — Aufzeichnungspflichten für Zeitarbeitsfirmen und Entleihbetriebe.
- Anomalie-Erkennungsquoten: Mercans.com, „Anomaly Detection in Payroll” (mercans.com/glossary): 30 % weniger Abrechnungsfehler durch KI-basierte Anomalie-Erkennung; lyzr.ai Blog, „AI Agents for Payroll Management”: Fehlerquote von 1–8 % in manuellen Systemen.
- ATOSS-Herstellerangaben: ATOSS-Unternehmensseite (atoss.com): bis zu 60 % weniger Verwaltungsaufwand. Herstellerangabe — nicht unabhängig geprüft; als Orientierungswert zu verstehen.
- Blinde Flecken der Anomalie-Erkennung: Everworker.ai, „How AI Detects and Prevents Payroll Fraud for Finance Teams” (everworker.ai/blog); mercans.com, „Anomaly & Fraud Detection” — Analyse zu Kollusions-Mustern und statistisch unsichtbaren Fehlern.
Du willst wissen, welcher Implementierungspfad für eure Situation am sinnvollsten ist und was die Zeiterfassungsdaten, die ihr heute schon habt, über eure Fehlerrate verraten? Meld dich — das klären wir gemeinsam in einem kurzen Gespräch.
Diesen Inhalt teilen:
Interesse an diesem Use Case?
Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.
Weitere Use Cases
KI-gestützte Kandidatenvorauswahl und Matching
KI durchsucht den gesamten Kandidatenpool und gleicht Profile automatisch mit offenen Kundenaufträgen ab — Disponenten finden passende Kandidaten in Minuten statt Stunden.
Mehr erfahrenKandidaten-Matching automatisieren
KI-Matching findet die besten Kandidaten für jeden Auftrag — in Minuten statt Stunden. Aber nur wenn das System auch AÜG-Fristen, Equal Pay und Branchenzuschläge kennt.
Mehr erfahrenLebenslauf-Screening mit KI
KI screent eingehende Bewerbungen auf Passung zur Zielposition, extrahiert relevante Qualifikationen und gibt eine strukturierte Bewerbungsübersicht mit Bewertung.
Mehr erfahren