Zum Inhalt springen
Entsorgung & Recycling kapazitaetsplanungprognoseabfallmengen

Kapazitätsplanung und Abfallmengenprognose mit KI

KI prognostiziert Abfallaufkommen nach Saison, Fraktion, Wochentag und Ereignissen — für optimierte Anlagenkapazität, Schichtplanung und Containerbeschaffung.

⚡ Auf einen Blick
Problem
Abfallmengen schwanken stark: Weihnachten, Frühjahrsputz, Gewerbeansiedlungen. Ohne verlässliche Prognosen werden Kapazitäten zu konservativ geplant — teure Leerläufe oder Überlastspitzen sind die Folge.
KI-Lösung
ML-Modell verarbeitet historische Wiegedaten, Kalender- und Wetterdaten sowie kommunale Ereignisse und liefert rollende 4-Wochen-Prognosen für Mengenströme je Fraktion und Standort.
Typischer Nutzen
Überkapazitäten um 15–25 % reduziert, Überlastspitzen frühzeitig erkannt, Personalplanung auf Basis belastbarer Vorhersagen statt Daumenregel.
Setup-Zeit
4–8 Monate: Datenvorbereitung, Modelltraining, Pilotbetrieb nötig
Kosteneinschätzung
15–25 % niedrigere Vorhaltekosten bei Fahrzeugen und Containern möglich
Predictive Analytics / Time-Series-Forecasting auf Betriebsdaten
Worum geht's?

Es ist Dienstag nach Neujahr, 6:47 Uhr. Betriebsleiterin Katharina Sommer steht auf dem Betriebshof und schaut auf ein Problem.

Nach Silvester stehen drei Fahrzeuge mit vollen Ladeflächen im Hof — Überlauf aus den vorweihnachtlichen Leerungen, die nicht mehr komplett abgearbeitet werden konnten. Gleichzeitig werden vier weitere Fahrzeuge in den nächsten drei Wochen wegen Wartung ausfallen. Die Disponenten hatten das Dezemberaufkommen wieder auf Basis des Vorjahresschnittwertes geplant — und wieder den Jahresendspike unterschätzt.

Katharina weiß, was jetzt kommt: Zwei Wochen Extraschichten, Überstundenzuschläge, ein aufgebrachter Landkreis wegen verspäteter Leerungen und eine Kapazitätsrechnung, die am Ende die Marge des Quartals frisst. Der Betrieb macht das seit sieben Jahren so. Jedes Jahr. Weil das irgendwie immer schon so war.

Das Gegenteil ist in den Sommermonaten ebenso teuer, nur leiser: Zwischen August und Mitte September stehen Schieberwagen rum, Bioabfall-Tonnagen fallen unter die Rentabilitätsschwelle einer Vollschicht, und die Schichtführer schieben Reste zusammen. Überkapazität zahlt niemand, aber der Betrieb zahlt sie trotzdem — durch Personal und Fahrzeuge, die nicht ausgelastet sind.

Das ist kein Planungsversagen von Katharina Sommer. Das ist ein Strukturproblem: Abfallmengen haben komplexe, fraktionsspezifische Muster, die ein Mensch nicht vollständig im Kopf halten kann — und Excel-Tabellen auch nicht.

Das echte Ausmaß des Problems

In der deutschen Entsorgungsbranche bewegt sich das Haushaltsabfallaufkommen bei rund 433 Kilogramm pro Einwohner und Jahr — insgesamt 36,7 Millionen Tonnen bundesweit (laut Statistischem Bundesamt 2023). Hinter dieser jährlichen Durchschnittszahl verbirgt sich ein hochgradig volatiles operatives Profil, das Entsorgungsbetrieben echte Planungsprobleme bereitet.

Die saisonalen Ausschläge sind erheblich und gut dokumentiert: Zum Jahreswechsel steigen Verpackungsabfälle aus Privathaushalten um 6–8 % gegenüber dem Vormonat (Verband BDE). Frühjahrsputz und Herbstgartenzeit treiben Sperrmüll und Bioabfall in die Höhe. Hitzesommer beschleunigen Bioabfallzerfall und erfordern häufigere Leerungen.

Das COVID-19-Szenario 2020/2021 hat gezeigt, wie dramatisch sich Mengenströme verschieben können: Als Restaurants und Gastronomie schließen mussten, brach gewerblicher Abfall um teils 30–40 % ein, während Haushaltsmüll aus Verpackungen um bis zu 20 % stieg — mit einem Nachlauf von 2–3 Wochen nach Politikwechseln (laut BDE-Lagebericht und DGAW-Update Januar 2021). Prognosemodelle, die auf Vorjahreswerten basierten, lagen teils um mehr als 15 % daneben.

Für Entsorgungsbetriebe bedeutet schlechte Mengenplanung direkte Kosten auf zwei Seiten:

  • Überkapazität: Fahrzeuge, Containerstände und Schichtpläne, die mehr vorhalten als nötig. Branchenberichte schätzen, dass unoptimierte Disponierung einer 20-Fahrzeug-Flotte jährlich 80.000–150.000 Euro an vermeidbaren Kosten verursacht (basierend auf FleetRabbit-Analyse industrieller Fuhrparkdaten).
  • Unterschätzte Spitzen: Aufwändige Nachsteuerung mit Überstunden, Leihe-Fahrzeugen, Beschwerdemanagement und vertragsrechtlichen Folgen bei öffentlichen Ausschreibungen mit Service-Level-Verpflichtungen.

Der Planungshorizont, den ein Machine Learning-Modell auf Basis von Wiegedaten, Kalender, Wetterdaten und kommunalen Ereignissen erzeugen kann, schließt genau diese Lücke: nicht durch Hellseherei, sondern durch statistisch belastbare Saisonmuster, die einem menschlichen Planer nicht vollständig zugänglich sind.

Mit vs. ohne KI — ein ehrlicher Vergleich

KennzahlOhne KIMit KI-Mengenprognose
PlanungsgrundlageVorjahresschnitt + ErfahrungRollende 4-Wochen-Prognose je Fraktion und Standort
Reaktionszeit auf MengenspitzenReaktiv — erst wenn Überlauf erkennbar2–4 Wochen Vorlauf für Personalplanung
Genauigkeit Wochenprognose±20–30 % bei Saisonspitzen±8–15 % bei gut kalibrierten Modellen (laut Studien zu MSW-Forecasting)
Überkapazität Fahrzeuge/Container15–25 % strukturell zu viel vorgehaltenReduktion auf 5–12 % Puffer möglich
Überstunden in SpitzenphasenHäufig ungeplant, hohe KostenDeutlich reduziert durch Vorausplanung
Planeraufwand pro Woche4–8 Stunden Disposition + Anpassungen1–2 Stunden Überprüfung und Freigabe

Die Genauigkeitswerte stammen aus wissenschaftlichen Studien zum maschinellen Lernen für kommunale Abfallprognosen. Xu et al. (Scientific Reports, 2025) berichten für Random-Forest-Modelle auf malaysischen Haushaltsdaten R²-Werte von 0,85 — in gut dokumentierten deutschen Betrieben mit sauberen Wiegedaten sind ähnliche Größenordnungen plausibel, wobei die Qualität der historischen Daten der dominierende Faktor ist.

Einschätzung auf einen Blick

Zeitersparnis — niedrig (2/5) Der größte Gewinn liegt nicht in eingesparter Planungszeit, sondern in frühzeitiger Information. Der Planungsaufwand selbst — wer wann wie viele Touren fährt — bleibt, wird aber auf besserer Datengrundlage erledigt. Im Vergleich zur KI-Tourenoptimierung in der Abfalllogistik, die täglich 1–2 Stunden Dispositionszeit einspart, ist der unmittelbare Zeitgewinn hier gering. Wertvoller ist das Frühwarnsignal — der Betriebsleiter sieht vier Wochen vor Weihnachten, dass die Kapazität nicht reicht, und kann handeln.

Kosteneinsparung — hoch (4/5) Reduzierte Überkapazität bei Fahrzeugen (Leasing, Wartung) und Containern ist direkt messbar. Verringerte Überstundenkosten in Spitzenphasen ebenfalls. Branchennahe Schätzungen gehen von 15–25 % geringeren Vorhaltekosten aus, wenn die Planung statt auf Pauschalpuffer auf belastbaren Prognosen basiert. Das ist niedriger als der direkte Kraftstoffhebel der Tourenoptimierung (5/5), aber klar messbar. Behälterstandsüberwachung per IoT (4/5) liegt auf ähnlichem Niveau, weil auch dort der Einspareffekt konkret ist, aber zunächst Investitionen erfordert.

Schnelle Umsetzung — niedrig (2/5) Vier bis acht Monate sind realistisch: Datenexport aus ERP und Waagen, Datenbereinigung, Modelltraining, Pilotbetrieb auf einer Fraktion, schrittweiter Rollout auf alle Fraktionen und Standorte. Keine Branchenlösung verkürzt diesen Weg wesentlich, weil die Datenqualität den Engpass setzt, nicht das Modell. Wer hofft, in vier Wochen loszulegen, wird enttäuscht werden.

ROI-Sicherheit — mittel (3/5) Der ROI tritt ein — aber er hängt stark davon ab, wie volatil die Mengen im Betrieb wirklich sind. Ein Betrieb mit stabilen Großgewerbeverträgen und wenig kommunalem Haushaltsabfall profitiert weniger als einer mit hoher saisonaler Volatilität. Außerdem: Wenn die historischen Daten lückenhaft oder unvollständig sind (fehlende Wochen, nicht nach Fraktion getrennt), kann das Modell die Muster nicht zuverlässig lernen. ROI-Sicherheit ist daher bedingt — was die mittlere Bewertung erklärt.

Skalierbarkeit — sehr hoch (5/5) Hier liegt die klare Stärke: Jeder neue Standort, jede neue Fraktion, jede weitere Saison verbessert das Modell und erweitert seinen Nutzen, ohne proportional mehr Aufwand zu erzeugen. Ein Betrieb, der heute mit 15 Routen startet, kann mit 50 Routen dasselbe Modell nutzen — und das Modell wird dabei besser statt schlechter. Das ist der fundamentale Unterschied zu manueller Kapazitätsplanung, bei der jeder neue Standort linearen Mehraufwand bedeutet.

Richtwerte — stark abhängig von Betriebsgröße, Datenqualität und regionaler Mengenvolatilität.

Was das Prognosesystem konkret macht

Das Herzstück ist ein Zeitreihen-Prognosemodell — eine Klasse von Machine-Learning-Methoden, die historische Muster in Zeitdaten lernen und daraus Vorhersagen ableiten. Im Unterschied zu einem einfachen Saisonindex aus der Statistiksoftware kann ein ML-Modell gleichzeitig Dutzende von Einflussgrößen berücksichtigen:

  • Historische Wiegedaten nach Fraktion, Route und Standort (Tages- oder Wochengranularität)
  • Kalendermerkmale: Wochentag, Monat, Jahreswoche, Feiertage (Deutschland-weit und regional)
  • Witterungsdaten: Temperatur, Niederschlag (relevant für Bioabfall-Zerfall und Gartenabfall)
  • Kommunale Ereignisse: Veranstaltungen, Großbauprojekte, Wohngebietserweiterungen
  • Strukturdaten: Gewerbliche vs. private Abholung, Kundenklassen

Das Modell rechnet diese Inputs zu einer rollenden Prognose zusammen: typisch 4 Wochen im Voraus, aufgegliedert nach Fraktion und Standort. Das Ergebnis ist kein einzelner Schätzwert, sondern ein Wertebereich — mit einem Erwartungswert und Konfidenzintervallen, die zeigen, wie sicher die Schätzung ist.

Was das operativ bedeutet:

Der Betriebsleiter öffnet montags ein Dashboard und sieht: In Woche 3 ist das Bioabfallaufkommen in Gebiet Nord voraussichtlich 18 % über dem Normalwert — Konfidenz: hoch. Der Schichtleiter kann jetzt drei Wochen vorher entscheiden: Gibt es eine Zusatztour, werden Schichten verstärkt, oder reicht die reguläre Planung mit kleinem Puffer?

Das ist fundamental anders als das Anschauen des Vorjahreswertes im November und Hoffen, dass Weihnachten dieses Jahr ähnlich ausfällt wie letztes.

Fraktion für Fraktion: Was das Modell wirklich lernen muss

Wer Abfallmengen prognostizieren will, muss verstehen, dass die fünf Hauptfraktionen komplett unterschiedliche Saisonalitätsmuster zeigen. Ein Modell, das alle Fraktionen über einen Kamm schert, ist gefährlich schlecht.

Bioabfall (Bio- und Grünabfall) Höchste saisonale Volatilität aller Fraktionen. Bioabfall aus Privathaushalten steigt von April bis Oktober deutlich an — Rasen mähen, Gartenabschnitte, Küchenkompost in der Erntezeit. Im Hochsommer beschleunigt Hitze zudem den Zerfallsprozess, was kürzere Leerungsintervalle nötig macht. Viele Betriebe wechseln die Leerungsfrequenz saisonal: wöchentlich von April bis Oktober, zweiwöchentlich im Winter. Das Modell muss lernen, dass die Sommerspitze nicht gleichförmig über drei Monate verteilt ist, sondern mit Hitzewellen und Regenereignissen (Gartenarbeitspausen) variiert.

Restmüll (Haus- und Sperrmüll) Deutlich stabiler als Bioabfall, aber mit einem markanten Winterspike: In der Woche nach Weihnachten und um Silvester steigt das Volumen in Privathaushalten um 10–20 % (laut BDE). Der Jahreswechsel ist eine der vorhersagbarsten Spitzen im Kalender — und trotzdem wird sie operativ regelmäßig unterschätzt, weil der Planungshorizont im November zu kurz ist. Das Modell muss zudem auf Feiertage reagieren: Wenn der normale Dienstagstermin auf einen Feiertag fällt und nachgeholt wird, kommen zwei Wochen im selben Zeitfenster zusammen.

Papier und Pappe Hat zwei Jahreshöhepunkte: Weihnachten/Januar (Geschenkverpackungen, Pakete aus Online-Shopping) und das Frühjahr (Aussortieren, frühlingshafte Kauflust). Im Sommer und Herbst ist Papieraufkommen aus Privathaushalten vergleichsweise niedrig. Gewerblicher Papierabfall zeigt hingegen ein anderes Muster: Abhängig von der Branche des Gewerbekunden (Handel vs. Produktion) ist das Muster monatlich eher gleichförmig oder eben saisonal. Das Modell muss private und gewerbliche Kundensegmente trennen.

Sperrmüll Stark korreliert mit Wohnungsumzügen und dem Frühjahrsputz-Effekt (März bis Mai). Ein zweites kleineres Hoch im Herbst (September/Oktober). In Jahren mit hoher Wohnungsfluktuation (Stadtentwicklung, Studentenzuzug im September) steigen Sperrmüllmengen überproportional. Das Modell braucht hier kommunale Strukturdaten als Kovariante: Neubaugebiete, Wohnungsbestand, geplante Abrisse.

Gewerbeabfall Höchste Volatilität, aber aus anderen Gründen: Gewerbliche Mengen hängen an der Wirtschaftsaktivität der Kunden. Ein Industriebetrieb mit saisonaler Produktion (Landmaschinen, Saisonware) erzeugt im Q4 das Dreifache von Q2. Für diese Fraktion ist ein globales Mengenmodell wenig hilfreich — nützlicher ist ein kundengruppenspezifisches Modell, das nach Branche und Vertragsgröße segmentiert.

Konsequenz für das Modelldesign: Wer einen einzelnen Forecast-Lauf für alle Fraktionen zusammen aufbaut, lernt gemittelte Muster, die in der Praxis keiner Fraktion gut helfen. Die beste Praxis ist eine getrennte Modellierung je Fraktion — mit anschließender Aggregation zu Gesamtprognosen für Standort- und Flottenplanung.

Integrations-Realität: Wenn die Daten in drei verschiedenen Systemen stecken

Das Kernproblem bei der Einführung von KI-Kapazitätsplanung in der Entsorgungsbranche ist selten das Modell. Es ist die Datenbeschaffung.

Ein typischer mittelgroßer Entsorgungsbetrieb hat seine Betriebsdaten auf folgende Systeme verteilt:

  • Wiegedaten: In der Fahrzeugwaage oder Umschlaganlage, oft als CSV-Export oder proprietäre Datenbank des Waageherstellers
  • Tourenbuch und Disposition: Im Branchenprogramm — AMCS, SULO CITYDATA, Müllmax oder einer selbst entwickelten Access-Datenbank
  • Abrechnungsdaten: Im ERP-System — SAP S/4HANA mit Waste-&-Recycling-Modul (implementiert etwa beim Abfallwirtschaftsbetrieb München, AWM), Microsoft Dynamics oder einer Branchenlösung
  • Kalender- und Feiertagsdaten: Extern (Bundeslandspezifisch)

Die Herausforderung: Diese Systeme sprechen keine gemeinsame Sprache. Wiegedaten haben Zeitstempel und Fahrzeugkennzeichen, aber keine Fraktionsbezeichnung im Format des ERP. Tourenbuch-Einträge sind nach Tourencode strukturiert, nicht nach Kundengruppe oder Gebiet in der Waagenlogik.

Was in der Praxis nötig ist:

  1. Datenmapping: Tourencodes aus dem Dispositionssystem mit Fraktionsschlüsseln aus der Wiegelog verknüpfen. Das kostet Zeit — oft 4–6 Wochen, bevor auch nur eine Prognose rechnen kann.

  2. Datenqualitätsbereinigung: Lücken (fehlende Wochendaten wegen Betriebsferien), Ausreißer (Fahrzeugwaage wurde kalibriert), doppelte Einträge (Tour manuell nochmal eingegeben). In jedem deutschen Entsorgungsbetrieb, den wir kennen, gibt es diese Lücken — das ist keine Ausnahme, sondern der Regelfall.

  3. ERP-Integration für den Echtbetrieb: Die Prognose soll nicht als Einmalprojekt funktionieren, sondern täglich neue Daten aufnehmen und neue Forecasts liefern. Das bedeutet: entweder eine API-Verbindung vom Prognose-System zum Branchenprogramm, oder ein täglicher automatisierter Datenexport. SAP-Implementierungen (mit Prologa-Add-on oder nativem SAP Waste & Recycling) bieten dafür strukturierte Datenschnittstellen. AMCS hat eine offene API-Dokumentation. SULO CITYDATA bietet CSV-Export, was zwar weniger elegant ist, aber funktioniert.

  4. Dashboard-Integration: Die Prognose muss dort ankommen, wo Entscheidungen getroffen werden. Das ist selten der gleiche Ort, wo Daten gesammelt werden. Microsoft Power BI ist die häufigste Lösung für diesen letzten Schritt — weil es in den meisten Betrieben bereits vorhanden ist und mit SAP, Excel-Exporten und CSV-Quellen gleichermaßen umgehen kann.

Die wichtigste Erkenntnis aus der Praxis: Plane für die Datenmapping-Phase mindestens doppelt so viel Zeit ein, wie du für technisch realistisch hältst. Und hol jemanden dazu, der das Branchenprogramm kennt — nicht nur jemanden, der Machine Learning kann.

Konkrete Werkzeuge — was wann passt

Die richtige Werkzeugwahl hängt davon ab, ob ihr primär einen Datenanalysten im Haus habt oder eine schlüsselfertige Lösung braucht.

Nixtla TimeGPT — wenn ihr schnell belastbare Prognosen ohne eigenes Modelltraining wollt Ein Foundation-Modell für Zeitreihen, trainiert auf über 100 Milliarden Datenpunkten. TimeGPT braucht keine monatelange Trainingsphase — ihr ladet historische Wiegedaten hoch und bekommt Forecasts zurück. Besonders nützlich für Betriebe, die noch keine eigene Data-Science-Kapazität aufgebaut haben. Einschränkung: US-Hosting, kein Dashboard, reine Developer-API. Kosten: ab ca. 500 USD/Monat Business-Tarif.

Azure Machine Learning — wenn ihr die Kontrolle über das Modell behalten wollt Für Betriebe mit einer eigenen IT oder einem externen Data-Engineering-Partner: Azure Machine Learning bietet die vollständige Kontrolle über das Zeitreihenmodell — welcher Algorithmus, welche Kovariaten, wie oft neu trainiert, wie in die bestehende Infrastruktur eingebettet. Region Germany West Central verfügbar, DSGVO-konform. Der Preis ist variabel (Compute-Stunden + Speicher + Endpoint), in der Praxis 300–1.500 Euro/Monat für einen produktiven Prognose-Endpunkt.

Dataiku — wenn ihr eine ganzheitliche ML-Plattform sucht Dataiku bietet eine visuelle Pipeline von der Datenbereinigung bis zum Modell-Deployment. Besonders sinnvoll, wenn der Betrieb mehrere analytische Use Cases hat (Prognose + Tourenoptimierung + Reporting) und die Schritte transparent und nachvollziehbar halten will. Enterprise-Pricing (ab ca. 60.000 USD/Jahr) macht es zu einer Entscheidung für größere Betriebe. EU-Hosting verfügbar.

AMCS Platform — wenn ein integriertes Branchensystem her soll AMCS ist kein reines Forecast-Tool, sondern eine vollständige ERP- und Logistikplattform für die Entsorgungsbranche — mit Tourenoptimierung, Abrechnung, ESG-Reporting und Analytics-Modulen. Wenn ihr ohnehin über eine Systemmodernisierung nachdenkt, ist AMCS als Gesamtlösung interessant. Die Prognose-Fähigkeiten sind Bestandteil der Plattform, nicht deren Herzstück. Braucht 3–9 Monate Einführungszeit. Ab 15 Fahrzeugen sinnvoll.

Microsoft Power BI — für das Dashboard Unabhängig davon, welches Prognose-Tool ihr nutzt: Power BI ist der häufigste Weg, Forecast-Ergebnisse für Betriebsleitung und Schichtplanung sichtbar zu machen. Läuft in fast jedem Betrieb bereits. Der Prognose-Output (CSV oder API) wird als Datenquelle eingebunden, fertig.

Zusammenfassung — wann welcher Ansatz:

  • Schneller Einstieg ohne Modelltraining → Nixtla TimeGPT
  • Volle Kontrolle, DSGVO-konformes EU-Hosting, IT-Team vorhanden → Azure Machine Learning
  • Mehrere Analytics-Use-Cases, größerer Betrieb, visuelle Pipeline → Dataiku
  • Systemmodernisierung, vollständiges Branchenpaket ab 15 Fahrzeugen → AMCS
  • Dashboard und Reporting in jedem Fall → Power BI

Datenschutz und Datenhaltung

Abfallmengen-Wiegedaten enthalten in der Regel keine personenbezogenen Daten im Sinne der DSGVO — sie beschreiben Mengen, Fraktionen und Standorte, nicht Personen. Das vereinfacht die rechtliche Lage erheblich.

Personenbezogen werden Daten erst dann, wenn Kundenverträge oder Adressen mit Wiegedaten verknüpft werden — etwa wenn das Modell kundensegmentspezifische Prognosen macht oder Abholhistorien einzelner Gewerbekunden verarbeitet. In diesem Fall gilt DSGVO Art. 28 (Auftragsverarbeitungsvertrag mit dem Cloud-Anbieter), und die Datenhaltung sollte in der EU erfolgen.

Für die genannten Werkzeuge:

  • Azure Machine Learning (Region Germany West Central): EU-konform, keine weiteren Fragen
  • Nixtla TimeGPT: US-Hosting — Wiegedaten ohne Kundenbezug sind hier DSGVO-unkritisch; sobald Kundendaten in die Prognose einfließen, AVV prüfen und ggf. Standardvertragsklauseln nutzen
  • Dataiku: EU-Hosting verfügbar — explizit bei der Konfiguration auswählen
  • AMCS: EU-Hosting, ISO 27001 zertifiziert, AVV standardmäßig verfügbar

Praxishinweis: Wer ausschließlich mit aggregierten Wiegedaten je Fraktion und Route arbeitet (ohne Kundenzuordnung), kann für das Modelltraining auch US-Dienste nutzen, ohne Datenschutzprobleme zu erzeugen. Erst wenn du Prognosezwecke mit Kundendaten verbindest (z. B. Rechnungsstellung nach prognostizierter Menge), greift der volle DSGVO-Rahmen.

Was es kostet — realistisch gerechnet

Einmalige Aufbaukosten

Die größten Kosten entstehen in der Datenvorbereitung, nicht im Modell:

  • Datenexport, Bereinigung, Mapping: 15–25 Tage interner oder externer Data-Engineering-Aufwand. Bei externem Dienstleister typisch 5.000–15.000 Euro, je nach Komplexität der Quellsysteme
  • Modellentwicklung und Pilotrunde: Bei einem spezialisierten Dienstleister 8.000–20.000 Euro; mit eigener IT 3–6 Monate Kapazität intern
  • Dashboard-Integration (Power BI): 2.000–5.000 Euro einmalig

Laufende Kosten (monatlich)

  • Nixtla TimeGPT: ca. 500 USD/Monat
  • Azure Machine Learning Endpunkt: 300–1.500 Euro/Monat (je nach Compute-Nutzung)
  • Dataiku Enterprise: ab 5.000 USD/Monat (erst bei großem Betrieb sinnvoll)
  • AMCS als Gesamtplattform: 1.500–5.000 Euro/Monat

Was du dagegenrechnen kannst

Ein mittlerer Entsorgungsbetrieb mit 20 Fahrzeugen und 15 Routen hat bei angenommener Überkapazität von 20 % jährlich gebundene Kosten in Fahrzeughaltung, Containerdepot und Mehrschichten von erfahrungsgemäß 150.000–300.000 Euro. Wenn eine bessere Prognose auch nur die Hälfte davon vermeidet — durch frühere Umplanung, weniger Extraschichten, bessere Fahrzeugauslastung — ist der ROI gegenüber laufenden Software- und Dienstleistungskosten von 15.000–25.000 Euro/Jahr klar positiv.

So misst du den ROI tatsächlich

Nicht durch theoretische Rechnung, sondern durch einen kontrollierten A/B-Vergleich: In der ersten Saison läuft die Prognose parallel zur bisherigen Planung, ohne sie zu ersetzen. Du misst, in welchen Wochen die Prognose besser oder schlechter lag. Erst wenn die Abweichungen der Prognose systematisch kleiner sind als die der manuellen Planung, verlässt du den Parallelbetrieb.

Drei typische Einstiegsfehler

1. Mit einem Einheitsmodell für alle Fraktionen beginnen. Der Reflex: Ein Modell trainieren, das alle Abfallmengen gemeinsam prognostiziert — weniger Arbeit, schnellere Ergebnisse. In der Praxis lernt das Modell gemittelte Muster, die für Bioabfall im Sommer genauso falsch sind wie für Papier im Dezember. Lösung: Mit der volatilsten Fraktion beginnen — meistens Bioabfall oder Restmüll nach Weihnachten — und dort ein Einzelmodell bauen. Dann schrittweise ausweiten.

2. Historische Lücken im Datensatz ignorieren. Wegen Betriebsferien fehlt August 2020. Wegen Systemumstellung fehlen Q1 2022. Das Modell lernt aus diesen Lücken keine Muster, sondern Artefakte — und gibt an diesen Zeiträumen zuverlässig falsche Prognosen zurück. Lösung: Lücken vor dem Training entweder interpolieren (für kurze Fehlstellen) oder explizit ausschließen und das Modell darin trainieren, diese Zeiträume zu ignorieren. Ein Data Engineer, der die Daten kennt, muss diese Entscheidungen treffen — nicht automatisch.

3. Das Modell einmal trainieren und dann vergessen. Das ist der gefährlichste Fehler — weil er zeitverzögert und lautlos wirkt. Ein Zeitreihenmodell, das auf Daten bis 2022 trainiert wurde, lernt die Muster bis 2022 — einschließlich COVID-Verzerrungen. Wenn sich die Betriebsstruktur ändert (neue Gewerbekundenbasis, neue Fraktion, Bevölkerungswachstum im Einzugsgebiet), verschlechtern sich die Prognosen still. Das Modell gibt weiterhin Zahlen aus — nur immer unzuverlässigere. Lösung: Quartalsweises Neutraining festlegen, Genauigkeitsmonitoring einrichten (tatsächliche Mengen vs. Prognose pro Woche), und eine namentlich verantwortliche Person für die Modellpflege benennen.

Was mit der Einführung wirklich passiert — und was nicht

Die typischen Widerstands-Muster in Entsorgungsbetrieben sind: erfahrene Disponenten, die ihren Jahrzehnten-Erfahrungsschatz angegriffen sehen, und Betriebsleiter, die zu Recht misstrauisch sind, wenn ein Algorithmus ihre Kapazitätsplanung übernehmen soll.

Der erfahrene Disponent. In vielen Betrieben gibt es eine Person, die “den Bezirk kennt wie ihre Westentasche” — weiß, dass der Gewerbepark in KW 48 immer mehr schmeißt, weil Inventur ist, und dass die Altpapierstelle an der Hauptstraße nach dem Weihnachtsmarkt übervoll ist. Diese intuitive Mustererkennung ist wertvoll. Das Modell macht dasselbe — nur auf allen Routen gleichzeitig und mit historischen Daten, die kein Mensch vollständig im Kopf hat. Die Botschaft muss sein: Das Modell ersetzt nicht das Urteilsvermögen des Disponenten, es gibt ihm einen datenbasierten Ausgangspunkt.

Was konkret hilft:

  • Den Disponenten früh in die Datenvalidierung einbinden — “Stimmt das Muster, das das Modell gelernt hat?” Wenn der erfahrene Disponent das Modellverhalten erklärt, hat er es angenommen.
  • Die erste Prognose gemeinsam anschauen und kommentieren lassen — “Hier liegt das Modell falsch, weil…” — diese Korrekturen fließen als Kovariaten ein (z. B. lokale Veranstaltungen, die das Modell nicht kannte).
  • Die Entscheidungshoheit bleibt beim Menschen. Die Prognose ist eine Empfehlung, keine Automatisierung.

Was nicht passiert: Das System übernimmt nicht autonom die Planung. Es ersetzt nicht die Schichtführer und Disponenten. Es löst keine Überkapazität mit einem Klick. Was es tut: Es gibt dem Betriebsleiter vier Wochen früher bessere Informationen — und macht damit bessere menschliche Entscheidungen möglich.

Realistischer Zeitplan mit Risikohinweisen

PhaseDauerWas passiertTypisches Risiko
DatenbestandsaufnahmeWoche 1–3Wiegedaten, Tourenbuch, ERP-Exports sichten; Lücken und Qualitätsprobleme katalogisierenMehr Lücken als erwartet — Datenmapping dauert doppelt so lang
Datenbereinigung und -integrationWoche 4–8Tourencodes mit Fraktionsschlüsseln verknüpfen; Lücken interpolieren oder ausschließen; erste Datenquelle stabil angebundenERP-Export-Format ändert sich; fehlende Dokumentation des Branchenprogramms
Modellbau und KalibrierungWoche 8–14Prognosemodell je Hauptfraktion trainieren; Genauigkeit gegen historische Holdout-Daten prüfen; Kalender und Wetterdaten integrierenModell lernt COVID-Artefakte als “normal” — manuelle Korrektur der Trainingsperiode nötig
Pilotbetrieb (Fraktion Bioabfall)Woche 14–20Parallelbetrieb: Prognose läuft neben klassischer Planung; tatsächliche Mengen vs. Forecast wöchentlich verglichenDisponent akzeptiert Prognose nicht — Einbindung zu spät gestartet
Rollout auf alle FraktionenWoche 20–28Weitere Fraktionen schrittweise aufgenommen; Dashboard produktiv; Neutrainingsrhythmus festgelegtKapazitätsengpass beim Datenteam — Rollout verzögert sich

Häufige Einwände — und was dahintersteckt

„Wir haben doch schon Excel-Tabellen mit Jahresschnitt und saisonalem Faktor.” Das funktioniert für grobe Planung. Es funktioniert nicht, wenn sich das Muster Jahr für Jahr leicht verschiebt (was es tut — durch Bevölkerungsveränderungen, Gewerbeentwicklung, Recyclingquoten). Ein statischer saisonaler Faktor wird nicht nachgezogen; ein Modell schon. Der Unterschied wird in normalen Jahren klein bleiben — in einem Jahr wie 2020 oder nach einer Gewerbeansiedlung macht er den vollen Unterschied.

„Wir haben nicht genug Daten für Machine Learning.” Wie viele digitale Wiegedaten habt ihr? Wenn ihr seit drei Jahren digitale Wiegebelege habt — je nach Granularität 150–200 Datenpunkte je Fraktion und Route — reicht das für erste belastbare Modelle. Foundation-Modelle wie Nixtla TimeGPT brauchen noch weniger eigene Daten, weil sie auf einem umfangreichen vortrainierten Muster-Repertoire aufbauen. Natürlich gilt: mehr Daten = bessere Prognosen. Aber “zu wenig Daten” ist in der Praxis seltener das echte Problem als “zu unstrukturierte Daten”.

„Das ist doch nur für große Betriebe.” Für Betriebe mit unter zehn Fahrzeugen stimmt das. Für Betriebe ab zehn bis zwölf Fahrzeugen und mehr als drei Fraktionen nicht mehr — dort sind die Mengenunterschiede zwischen guter und schlechter Planung groß genug, um die Systemkosten zu rechtfertigen. Die Implementierungshürde liegt eher in der Datenqualität als in der Betriebsgröße.

Woran du merkst, dass das zu dir passt

  • Du betreibst mehr als zehn Fahrzeuge und planst auf mindestens drei verschiedene Fraktionen
  • Du hast in mindestens einem der letzten drei Jahre ungeplante Überstunden oder Sonder-Touren wegen Mengenschwankungen gebraucht
  • Deine Disposition basiert heute auf Jahresschnitt plus Erfahrungswert — und es gibt keinen systematischen Weg, drei oder vier Wochen voraus zu planen
  • Du hast mindestens zwei Jahre digitale Wiegedaten nach Fraktion und Route — Papier-Wiegebelege allein reichen nicht
  • Dein Betrieb hat feste Standorte und definierte Gebiete — wandernde Aufträge oder rein projektbezogene Entsorgung profitieren weniger als regelmäßige kommunale oder gewerbliche Sammelrouten

Wann es sich (noch) nicht lohnt — drei harte Ausschlusskriterien:

  1. Unter acht bis zehn Sammelfahrzeugen und weniger als fünf Routen. Bei dieser Betriebsgröße ist die Datenmenge je Fraktion so begrenzt, dass ein ML-Modell keine belastbaren Muster findet, die über einfache saisonale Indexwerte hinausgehen. Ein gut gepflegter Excel-Kalender mit historischen Faktoren leistet hier denselben Dienst — ohne die Implementierungskosten.

  2. Keine digitalen Wiegedaten nach Fraktion und Route für mindestens 24 Monate. Wenn eure Wiegebelege noch auf Papier vorliegen oder nur eine Gesamtmenge pro Tag auswerfen (ohne Fraktions- und Routenaufteilung), fehlt die Grundvoraussetzung. Schritt eins wäre dann: digitale Wiegedatenerfassung einführen — und erst danach, nach zwei Jahren Datenhistorie, über Prognosemodelle nachdenken.

  3. Betrieb mit rein projektbasiertem Aufkommen oder stark wechselnder Gebietsstruktur. Wenn eure Auftragsstruktur sich jährlich stark ändert — neue Ausschreibungen, neue Gebiete, neue Kundenbasis — sind historische Muster wenig wert. Das Modell prognostiziert vergangene Strukturen, nicht zukünftige.

Das kannst du heute noch tun

Bevor du in ein Prognose-Tool investierst, validiere in einer Stunde, ob deine Daten überhaupt die Grundvoraussetzung erfüllen: Öffne deinen besten verfügbaren Wiegedaten-Export der letzten 24 Monate (CSV aus dem Branchensystem reicht) und prüfe drei Dinge: Gibt es wöchentliche Daten? Sind Fraktionen getrennt? Gibt es mehr als zehn Lücken im Datensatz?

Wenn alle drei Fragen mit Ja beantwortet sind, hast du eine realistische Grundlage. Den Rest klärst du mit folgendem Prompt:

Prompt: Datengrundlage für Abfallmengenprognose prüfen lassen
Du bist ein erfahrener Data Scientist mit Kenntnissen in der Entsorgungsbranche. Ich betreibe einen Entsorgungsbetrieb mit [ANZAHL] Fahrzeugen, [ANZAHL] Sammelrouten und folgenden Hauptfraktionen: [FRAKTIONEN, z. B. Restmüll, Bioabfall, Altpapier, Gewerbeabfall]. Meine historischen Wiegedaten liegen vor als [DATENQUELLE: CSV-Export aus AMCS / Excel-Export aus SULO / SAP-Bericht / manuell gepflegtes Excel] für den Zeitraum [VON] bis [BIS]. Die Daten sind nach [GRANULARITÄT: tagesweise / wochenweise] und [NACH FRAKTION JA/NEIN] aufgegliedert. Bekannte Lücken oder Besonderheiten im Datensatz: [BESCHREIBEN — z. B. August 2022 fehlt wegen Betriebsferien, Q1 2020 durch COVID nicht repräsentativ]. Mein Hauptproblem bei der aktuellen Kapazitätsplanung ist: [BESCHREIBEN — z. B. Weihnachtsspitze unterschätzt, Sommer-Bioabfall überkapazitiert]. Bitte antworte mit: 1. Realistischer Einschätzung, ob meine Datenbasis für ein ML-Prognosemodell ausreicht 2. Den zwei bis drei dringlichsten Datenqualitätsproblemen, die ich zuerst angehen muss 3. Einem konkreten Vorschlag, mit welcher Fraktion und welchem Zeitraum ich ein erstes Pilotmodell aufbauen sollte 4. Was ich für eine erste Prognosevalidierung gegen historische Daten brauche (Trainingszeitraum, Test-Holdout)
Funktioniert mit ChatGPT, Claude
Beispiel-Ausgabe

Mitarbeiter:in

Ich habe Wiegedaten seit 2021, wöchentlich, nach Fraktion getrennt (Restmüll, Bioabfall, Altpapier, Gewerbeabfall), für 18 Sammelrouten. Lücke: 6 Wochen in 2022 fehlen. Hauptproblem: Weihnachts-Restmüll-Spitze immer unterschätzt.

KI-Assistent

Deine Datenbasis ist für ein erstes Prognosemodell gut geeignet. Hier meine Einschätzung: **Datenqualitäts-Prioritäten:** 1. Die 6-Wochen-Lücke in 2022 muss behandelt werden: Für Bioabfall empfehle ich lineare Interpolation (saisonales Muster gut bekannt). Für Restmüll würde ich die Wochen aus dem Trainingsdatensatz ausschließen, weil Restmüll weniger vorhersagbar ist. 2. Prüfe, ob Gewerbeabfall nach Branchen-Segmenten trennbar ist — Produktionsbetriebe vs. Handelsunternehmen haben grundlegend unterschiedliche Saisonalität. Wenn nicht, macht ein aggregiertes Gewerbemodell wenig Sinn. 3. Schau nach, ob Feiertage im Datensatz erkennbar sind: Wenn eine Tour wegen Feiertag um 3 Tage verschoben wurde, sieht das Modell sonst zwei Wochen im Abstand statt einer. **Pilotempfehlung:** Beginne mit Restmüll nach Weihnachten (Dezember bis Mitte Januar). Das ist dein genanntes Hauptproblem, und die Muster sind ausreichend strukturiert für ein erstes Modell. Trainiere auf 2021 und 2023, halte 2024 als Test-Holdout. Das zeigt dir, wie gut das Modell eine echte Prognose machen kann. **Für die erste Validierung:** Teile den Datensatz: Training = KW1/2021 bis KW52/2023, Test = KW1/2024 bis KW52/2024. Berechne für jede Woche im Testjahr die tatsächliche Abweichung (MAPE) zwischen Modell-Forecast und tatsächlicher Menge. Wenn der MAPE unter 15% liegt, hast du ein brauchbares Modell. Über 25%: zurück zur Datenvorbereitung. Quelle: Eigene Einschätzung basierend auf Xu et al. (2025) und DGAW-Praxisdaten.

Quellen & Methodik

  • Haushaltsabfallaufkommen 433 kg/Kopf (2023): Statistisches Bundesamt Destatis, Pressemitteilung Dezember 2023 zu Abfallwirtschaftsstatistik.
  • COVID-19 Mengenverschiebungen 2020 — BDE-Lagebericht: Bundesverband der Deutschen Entsorgungs-, Wasser- und Rohstoffwirtschaft (BDE), Pressemeldung „Abfall in Zeiten von Corona” (2020); Haushaltsverpackungsabfall +5,9 % Glas, +5,7 % Leichtverpackungen; regionale Spitzen bis +20 % in ersten Lockdown-Wochen.
  • DGAW Corona-Update Januar 2021: Deutsche Gesellschaft für Abfallwirtschaft (DGAW), „Update Prognose zu den Auswirkungen der Coronakrise auf die Abfallwirtschaft in Deutschland” (Januar 2021); zeigt, wie Prognosemodelle mehrfach angepasst werden mussten.
  • Random Forest R² = 0,85 für MSW-Prognose: Xu et al., „Advanced predictive modeling of municipal solid waste management using robust machine learning”, Scientific Reports, 2025. Staatsrangige R²-Werte mit Random Forest auf Haushaltsdaten Malaysia (2010–2022). Methodische Parallelen zu deutschen kommunalen Daten plausibel.
  • Flottenkostenverlust 20-Fahrzeug-Betrieb 80.000–150.000 USD/Jahr: FleetRabbit Industry Analysis, „How Inefficient Garbage Collection Routes Are Costing You Thousands Every Month”, 2024; Schätzung auf Basis industrieller Fuhrparkauswertungen.
  • Saisonale Leerungsfrequenz Bioabfall (wöchentlich/zweiwöchentlich): Öffentliche Abfuhrkalender-Dokumentation mehrerer kommunaler Entsorgungsbetriebe (u. a. AVL Ludwigsburg, WZV); Saisonumstellung April/Oktober ist branchenweite Standardpraxis.
  • AWM München SAP Waste & Recycling Implementierung: Müll und Abfall Fachmagazin, Meldung zum Abfallwirtschaftsbetrieb München (AWM), SAP-Implementierung inkl. Gebührenabrechnung (2023/2024).
  • Preisinformationen Tools: Anbieter-Websites (Stand Mai 2026): Nixtla.io (TimeGPT), Azure Pricing Calculator, Dataiku Vendr-Analyse 2025, AMCS Preise auf Anfrage.

Du willst einschätzen, ob eure Datenbasis reif für eine KI-Mengenprognose ist — und wie der erste Schritt konkret aussieht? Schreib uns, wir schauen uns das gemeinsam an.

Diesen Inhalt teilen:

🤝

Interesse an diesem Use Case?

Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.

Deine Daten werden ausschließlich zur Bearbeitung deiner Anfrage verwendet (Art. 6 Abs. 1 lit. b DSGVO). Mehr in unserer Datenschutzerklärung.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–3 Themen — du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar