Wolkenentfernung aus Satellitenbildern: KI rekonstruiert verdeckte Bodenziele
Optische Satelliten liefern bei 60–70% aller Aufnahmen global wolkenbedeckte Bilder — Analysepipelines stocken, SLA-Zusagen geraten unter Druck. KI-gestützte Wolkenerkennung und SAR-optische Datenfusion machen kontinuierliches Monitoring unabhängig vom Wetter möglich.
- Problem
- Im Bereich Erdbeobachtung — Infrastrukturmonitoring, Präzisionslandwirtschaft, Umwelt- und Versicherungsanalytik — sind Sentinel-2-Revisitzeiten bereits knapp. Wenn 60–70% der optischen Aufnahmen durch Bewölkung unbrauchbar sind, sinkt die effektive Beobachtungsfrequenz auf kritisch niedrige Werte. Auf wolkenfreies Wetter warten kostet Tage bis Wochen — und gefährdet Lieferzusagen gegenüber Kunden.
- KI-Lösung
- Zweistufig: Erstens präzise Wolkenerkennung per Deep Learning (Klassifikation jedes Pixels als wolkenfrei / Dünnwolke / Dickwolke / Wolkenschatten). Zweitens Wolkenrekonstruktion via SAR-optischer Datenfusion (Sentinel-1-Radardaten + historische Referenzbilder) oder temporalem Compositing. Ausgabe: plausibles optisches Bild mit Konfidenzmaske je Pixel.
- Typischer Nutzen
- Effektiv nutzbare Bildrate steigt von ~35% auf 70–90%. Analysepipelines laufen durch, SLA-Berichte an Kunden werden pünktlich geliefert. Für Infrastrukturmonitoring, Präzisionslandwirtschaft und Versicherungsanalytik ist das der Unterschied zwischen einem zuverlässigen Produkt und einem wetterfühligen Lieferdienst.
- Setup-Zeit
- 5–6 Monate bis Produktionsbetrieb — SAR-Fusion braucht Fernerkundungs-Know-how
- Kosteneinschätzung
- Managed Service ab ~10.400 €/Jahr (5.000 km², wöchentlich); Custom-Ansatz 20.000–60.000 € Einrichtung + 500–2.000 €/Monat laufend
Es ist der 14. November. Jonas Krafft, Analyst bei einem Münchener Infrastrukturmonitoring-Dienstleister, öffnet die Sentinel-2-Abfrage für das 4.000-Quadratkilometer-Gebiet entlang einer Hochspannungstrasse in Norddeutschland. Sein Auftrag: monatliche Vegetationsdurchdringungs-Karte für den Netzbetreiber, Lieferdatum in vier Tagen.
Der EO Browser zeigt: 94% der Fläche bedeckt. Nebelfelder von Nordsee bis Lüneburger Heide. Die letzte verwertbare Aufnahme war vom 8. Oktober — sechs Wochen alt.
Er wechselt auf die Archivansicht. Sucht nach Szenen mit unter 30% Wolkenbedeckung. Findet in den letzten zwei Monaten drei Teile des Gebiets — nie den gleichen Ausschnitt, nie zur gleichen Zeit. Der Bericht an den Netzbetreiber wird zum Mosaikspiel aus veralteten Kacheln. Irgendwas ist immer aus einem anderen Monat.
Das ist kein Einzelfall. In Mitteleuropa zwischen Oktober und März ist es strukturell so.
Das echte Ausmaß des Problems
Laut einer 12-jährigen MODIS-Auswertung bedecken Wolken im globalen Durchschnitt 67% der Erdoberfläche zu jedem beliebigen Zeitpunkt. Über Landflächen sinkt dieser Wert auf rund 55% — aber mit extremen regionalen Unterschieden: Nordwesteuropa, die tropischen Regenwälder und weite Teile Ostasiens liegen deutlich höher.
Sentinel-2 hat eine Revisitzeit von fünf Tagen über Deutschland — theoretisch. Praktisch sind in Mitteleuropa im Winter häufig vier oder fünf aufeinanderfolgende Überflüge wolkenbedeckt. Das ergibt effektive Datenlücken von 20 bis 60 Tagen — in einer Jahreszeit, in der Infrastrukturbetreiber, Versicherungsunternehmen und Landwirtschaftsbehörden ihre Saisonabschlussberichte erstellen.
Die Konsequenzen:
- Analysepipelines stocken. Automatisierte NDVI-Zeitreihen für Vegetationsmonitoring benötigen gleichmäßige Zeitschritte. Mehrwöchige Lücken erzwingen entweder grobe Interpolation oder ungültige Perioden im Datensatz.
- SLA-Zusagen geraten unter Druck. Wer einem Netzbetreiber oder Versicherer monatliche Monitoring-Berichte zugesagt hat, liefert im Winter entweder verspätet oder mit veralteten Daten.
- Konkurrenz durch Datenquellen mit höherer Revisitzeit. Planet Labs (PlanetScope: täglich, 3–5 m Auflösung) oder kommerzielle SAR-Satelliten wie ICEYE (stündliche Revisitzeiten) lösen das Problem — aber zu deutlich höheren Kosten.
Das Problem hat einen offiziellen Namen: “cloud cover gap” — und es ist seit Jahrzehnten bekannt. Die Satelliten wurden nie für lückenlose Abdeckung gebaut. KI ist der erste Ansatz, der es ohne zusätzliche Satellitenhardware löst.
Mit vs. ohne KI — ein ehrlicher Vergleich
| Kennzahl | Ohne KI | Mit KI-gestützter Wolkenentfernung |
|---|---|---|
| Effektive Bildverfügbarkeit in Mitteleuropa | ~35–40% der Aufnahmen wolkenfrei | 75–90% nutzbare Ausgabebilder |
| Datenlücke bei Dauerbewölkung (30 Tage) | 30 Tage ohne verwertbares Bild | 7-Tages-Kadenz möglich (1-, 3- oder 7-täglich) |
| Zeitaufwand Mosaikierung | 2–4 Stunden manuell je Berichtszeitraum | Automatisierte Pipeline, kein manueller Eingriff |
| NDVI-Zeitreihen-Qualität | Lücken → Interpolationsfehler | Durchgängige Zeitreihe mit Konfidenzmaske |
| SLA-Zuverlässigkeit für Monatsbericht | Abhängig vom Wetter — 3–4 Monate/Jahr riskant | Planbar unabhängig von Wetterlage |
Die Ausgabebilder sind synthetisiert — kein echter optischer Scan. Deshalb ist die Konfidenzmaske kein optionaler Anhang, sondern ein Pflichtbestandteil jeder Auswertung. Mehr dazu im Abschnitt zur Genauigkeit.
Einschätzung auf einen Blick
Zeitersparnis — mittel (3/5)
Das Warten auf klare Aufnahmen entfällt — Datenlücken von vier bis acht Wochen werden auf sieben Tage verkürzt. Für viele Analysepipelines ist das strukturell bedeutsam. Keine tägliche Arbeitszeitersparnis für Einzelpersonen, aber messbare Beschleunigung des Produktzyklus. Vergleichbar stark wie Orbitaler Luftwiderstand, das ähnlich auf Datenverfügbarkeit statt manuelle Arbeit zielt.
Kosteneinsparung — niedrig (2/5)
Cloud Removal selbst kostet Geld — entweder als API-Kosten bei kommerziellen Diensten oder als Infrastruktur- und Entwicklungsaufwand im Self-Build-Ansatz. Der Nutzen liegt in der Datenverfügbarkeit, nicht in direkten Einsparungen. In der Branche gibt es stärkere Kosten-ROI-Hebel wie Treibstoffoptimierung (2–5% Kerosin) oder Triebwerk-TBO-Prognose mit direkt messbaren Shop-Visit-Kosten.
Schnelle Umsetzung — niedrig (2/5)
Sentinel-1- und Sentinel-2-Daten sind über Copernicus Data Space kostenlos verfügbar, Modellarchitekturen wie das U-Net/ResNet-Hybridmodell aus der Meraner-et-al.-Studie (2020) sind open-source verfügbar. Trotzdem: Der erste Pilotbetrieb dauert realistisch 7–14 Wochen, bis zum Produktionsbetrieb 5–6 Monate — weil SAR-optische Fusion Fachkenntnisse in Fernerkundung und rasterbasierter Datenverarbeitung voraussetzt. ClearSKY Vision als Managed Service verkürzt die Entwicklungszeit, macht die Integration und Qualitätsbewertung aber nicht trivial. Einer der langsameren Einstiege in dieser Branche.
ROI-Sicherheit — niedrig (2/5)
Der Nutzen ist real, aber schwer in Euro auszudrücken: Bessere Datenverfügbarkeit führt zu besseren Berichten, die zu zufriedeneren Kunden führen — die Kette ist lang und indirekt. Im Vergleich zu anderen Use Cases in dieser Branche ist das der schwächste Hebel für direkt messbare Einsparungen. Nur im Kontext von konkreten SLA-Strafen oder vertraglich vereinbarten Lieferverpflichtungen lässt sich ein klares ROI-Bild zeichnen.
Skalierbarkeit — sehr hoch (5/5)
Das ist der klare Stärkebereich: Eine einmal aufgebaute Cloud-Removal-Pipeline skaliert von 100 km² auf 100.000 km² ohne proportionalen Mehraufwand. Die Satellitendaten selbst sind global und kostenlos verfügbar, die Verarbeitungskapazität ist via Cloud-API nahezu beliebig skalierbar. Kein anderer Use Case in dieser Branche skaliert ähnlich linear — dieser ist für globale Erdbeobachtungsprodukte konzipiert.
Richtwerte — stark abhängig von Anwendungsfall, Flächengröße und Qualitätsanforderungen an die synthetisierten Pixel.
Wolkenerkennung vs. Wolkenrekonstruktion: zwei unterschiedliche Probleme
Diese Unterscheidung ist nicht akademisch — sie bestimmt, welche Tools du brauchst, welches Budget realistisch ist, und welche Genauigkeitsgarantien du geben kannst.
Wolkenerkennung (Cloud Masking): Das System klassifiziert jeden Pixel: wolkenfrei, Dünnwolke, Dickwolke, Wolkenschatten. Ausgabe ist eine Maske, keine rekonstruierten Pixel. Standard-Tool: ESAs Sen2Cor mit dem SCL (Scene Classification Layer), kostenlos, in der Level-2A-Verarbeitung automatisch enthalten. Genauigkeit: gut auf freiem Terrain, schwächer bei topografischen Schatten und dunklen Böden (dazu mehr im Abschnitt zu Einstiegsfehlern). Für eine bessere Wolkenmaske: CloudSEN12-Modelle (open source, trainiert auf 49.400 Sentinel-2-Patches, publiziert in Nature Scientific Data 2022).
Wolkenrekonstruktion (Cloud Inpainting): Das System füllt die maskierten Pixel mit plausiblen Werten — auf Basis von SAR-Strukturdaten und/oder historischen Referenzbildern. Ausgabe ist ein synthetisiertes optisches Bild. Aufwand: deutlich höher. Genauigkeit: pixelweise SSIM-Werte von 0,85–0,93 in Papers — aber Pixelgenauigkeit ist nicht gleich Analysegenauigkeit (mehr dazu unten). Ansätze: SAR-optische Fusion (z. B. Meraner et al. 2020 für Sentinel-1/2), temporales Compositing (einfacher, aber anfälliger bei strukturellen Veränderungen), diffusionsbasierte Modelle (aktuellster Stand, höchste Rechenkosten).
Faustregel: Wenn deine Pipeline mit vorhandenen wolkenfreien Pixeln auskommt und nur die Maske korrekt sein muss — invest in bessere Cloud Detection. Wenn du lückenlose Zeitreihen für Monitoring-SLAs brauchst — invest in Cloud Reconstruction.
Was das System konkret macht
Das technische Herzstück ist Deep Learning-gestützte Pixel-Klassifikation kombiniert mit einer Generativen Rekonstruktion. Vereinfacht:
Schritt 1 — Wolkenmaske erstellen. Ein neuronales Netz — typischerweise ein U-Net mit ResNet-Backbone — analysiert alle Spektralbänder des Sentinel-2-Bildes gleichzeitig. Es lernt aus annotierten Beispielen (CloudSEN12: 49.400 Patches mit Experten-Labels), welche Pixelkombinationen Dickwolken, Dünnwolken, Schatten oder klaren Himmel darstellen. Ausgabe: Binärmaske mit Konfidenzwert je Pixel.
Schritt 2 — Rekonstruktion der verdeckten Pixel. Hier gibt es drei Varianten mit unterschiedlichem Aufwand-Nutzen-Profil:
- Temporales Compositing: Das System sucht im Archiv (z. B. letzte 30 Tage) nach wolkenfreien Pixeln an derselben Position und median-kompositiert sie. Schnell und einfach — funktioniert gut in Gebieten mit geringer Dynamik (Wald, Gewässer), versagt bei aktuellen Bodenveränderungen.
- SAR-optische Fusion: Sentinel-1-Radardaten (wolkenunabhängig, 10–40 m Auflösung) liefern Struktur- und Oberflächenrauheitsinformationen. Ein generatives Modell nutzt diese als Gerüst, um fehlende optische Pixel zu synthetisieren. Ergebnis sind realistische RGB- und NIR-Werte, die reale Strukturen widerspiegeln. Modell: ClearSKY Vision nutzt diesen Ansatz produktionsfertig.
- Diffusionsmodell: Neueste Architekturklasse (2024–2025). Höchste visuelle Qualität, aber auch höchster Rechenaufwand und längere Latenz. Aktuell vorwiegend in der Forschung; Produktionsdienste nutzen noch mehrheitlich SAR-Fusion.
Was rauskommt: Ein Sentinel-2-kompatibles GeoTIFF mit den üblichen Spektralbändern (B02–B12) plus einer Konfidenzmaske. Die Konfidenzmaske sagt für jeden Pixel, wie verlässlich die Rekonstruktion ist — ein Pflichtbestandteil für jede quantitative Auswertung.
Wenn SAR allein genügt — und wann nicht
SAR-Daten (Sentinel-1 kostenlos, ICEYE/Capella kommerziell) penetrieren Wolken vollständig. Warum dann noch Cloud Removal?
SAR genügt für:
- Strukturelle Änderungsdetektionen (neues Gebäude, Erdbewegung, Überschwemmungsausdehnung)
- Deformationsanalysen (InSAR für Bodensenkung, Brückenmonitoring)
- Schiffsdetektion und Meeresüberwachung
- Roughness-basierte Bodenfeuchteschätzung
SAR ist nicht ausreichend für:
- NDVI, EVI und alle anderen auf Reflexionsspektren basierenden Vegetationsindizes — SAR misst Rückstreuung, nicht optische Reflexion
- Truecolor-Visualisierungen und RGB-Produkte für Schadensdokumentation
- Schadensklassifikation, die auf Farbinformationen angewiesen ist (z. B. Brand vs. Überschwemmung)
- Photovoltaik-Inspektionen (Verschmutzung, Zellausfall erkennbar nur optisch/infrarot)
- Ernteklassifikation in der Landwirtschaft: SAR kann Biomasse schätzen, aber keine Kulturartenklassifikation auf der Feldebene leisten
Kombination ist besser als entweder/oder: Forschungsstudien zeigen, dass SAR + Sentinel-2 kombiniert Klassifikationsgenauigkeiten von 91,5% erreicht — 5,7 Prozentpunkte über reinem Sentinel-2 allein. Das ist kein Ersatz, sondern Fusion.
Konkrete Werkzeuge — was wann passt
Copernicus Data Space Ecosystem — Datenquelle für Sentinel-1 (SAR) und Sentinel-2 (optisch) kostenlos. Grundlage für jeden eigenen Ansatz. Direkt im EO Browser visualisierbar, automatische Wolkenabdeckungsangabe je Szene. Einschränkung: Kostenlose API hat tägliche Processing-Units-Limits; für großflächige automatisierte Downloads ist ein kommerzielles Abonnement oder Batch-Processing-API nötig.
ClearSKY Vision — Kommerzieller Managed Service für SAR-optische Cloud Removal. Kein eigenes ML-Training, kein GPU-Setup. Ausgabe: Sentinel-2-kompatible GeoTIFFs mit Konfidenzmaske, 1–7-tägig lieferbar. Preise: ab €0,10/km² (Nimbus-Modell), Volumenrabatte ab €1.000/Monat. Sinnvoll, wenn du schnell produktionsfähig sein musst und keine Fernerkundungs-Expertise im Team hast. CASSINI-Challenge-Gewinner 2023.
AWS SageMaker — Für eigene Modellentwicklung und -hosting. Training von SAR-optischen Fusionsmodellen auf SageMaker Notebooks, Deployment als API. Erforderlich, wenn du maximale Kontrolle über Modell und Ausgabe brauchst oder proprietäre Datenquellen integrieren willst. Aufwand: 3–6 Monate Entwicklung + Fernerkundungsspezialist im Team. Kosten: stark nutzungsabhängig, typisch 500–2.000 €/Monat für mittlere Verarbeitungsvolumen.
Hugging Face — Repository für open-source Modelle. Die CloudSEN12-Modelle (U-Net-basiert, auf 49.400 Sentinel-2-Patches trainiert) sind dort verfügbar. Auch vortrainierte SAR-optische Fusionsmodelle (z. B. auf Basis des Meraner-et-al.-Ansatzes) finden sich auf der Plattform. Einstiegspunkt für alle, die den Self-Build-Weg gehen.
Wann welcher Ansatz:
- Kleines Pilotprojekt, schnell Ergebnisse brauchen → ClearSKY Vision
- Langfristig, eigene Datenquellen, maximale Flexibilität → Custom-Modell auf SageMaker
- Open-Source-Evaluation, Vorprojekt → Hugging Face + Copernicus Data Space
- Nur Wolkenmaske ohne Rekonstruktion → ESA Sen2Cor Level-2A (kostenlos, automatisch)
Datenschutz und Datenhaltung
Erdbeobachtungsdaten stellen datenschutzrechtlich eine Besonderheit dar: Sentinel-2-Bilder mit 10 m Auflösung erlauben keine Identifikation einzelner Personen — insofern greift die DSGVO in der Regel nicht für das Bildmaterial selbst. Relevanter wird das Thema, wenn hochauflösende kommerzielle Bilder (Auflösung ≤ 50 cm, z. B. Airbus Pléiades, Maxar WorldView) eingesetzt werden oder wenn die Analyse Rückschlüsse auf identifizierbare Personen oder Fahrzeuge ermöglicht.
Für die Datenverarbeitung gilt:
- Copernicus-Daten (Sentinel-1, -2): EU-gehostet, offene Lizenz (Copernicus Open Licence), kommerzielle Nutzung erlaubt. Kein AVV erforderlich, solange du keine personenbezogenen Daten einfließen lässt.
- ClearSKY Vision: EU-gehostet. AVV auf Anfrage erhältlich. Ausgabedaten verbleiben beim Kunden; ClearSKY nutzt keine Kundendaten für Modell-Retraining ohne explizite Vereinbarung.
- AWS SageMaker (EU-Region Frankfurt): Verarbeitung in der EU möglich, AVV über AWS-Datenschutzvertrag. Empfohlen, wenn Kunden aus regulierten Branchen (Verteidigung, Behörden) bedient werden.
- ITAR-Hinweis: Wer US-amerikanische Satellitendaten mit militärischer Anwendung verarbeitet (z. B. Maxar-Daten für Verteidigungskunden), sollte ITAR-Exportkontrollanforderungen prüfen. Für rein zivile Erdbeobachtung mit Sentinel-Daten ist das kein Thema.
Newsletter
Solche Praxis-Analysen, regelmäßig in deinem Postfach
Neue KI-Use-Cases, ehrliche Tool-Tests und DSGVO-Updates, verständlich aufbereitet. Kein Spam, jederzeit abbestellbar.
Was es kostet — realistisch gerechnet
Managed Service (ClearSKY Vision)
Für ein 5.000-km²-Monitoringgebiet mit wöchentlicher Lieferung:
- Kosten je Lieferung: 5.000 km² × €0,04/km² (Staffelpreis ab €3k/Monat) = €200 pro Woche
- Jahreskosten: ca. €10.400 (Verarbeitung) + ggf. Sentinel-Hub-API-Kosten für eigene Abfragen
- Setup-Aufwand: 4–8 Wochen für Pilot und Pipeline-Integration, typisch 15–40 Tage Entwickleraufwand
Custom-Modell-Ansatz (SageMaker + open-source Modell)
- Einrichtung: 3–6 Monate, 1 Fernerkundungsspezialist + 1 ML-Engineer, externe Kosten ca. 20.000–60.000 €
- Laufend: 500–2.000 €/Monat je nach Volumen (SageMaker Endpoint, S3, API Gateway)
- Break-even gegenüber ClearSKY: ab ca. 50.000 km² monatlich oder bei sehr spezifischen Qualitätsanforderungen
Wie du den Nutzen tatsächlich misst
Der direkteste Beweis ist nicht die Pixelgenauigkeit im SSIM-Benchmark — es ist die SLA-Erfüllungsrate. Miss, wie viele deiner Berichte früher verspätet oder datenlückenbehaftet waren und wie viele es nach Einführung noch sind. Das ist die Zahl, die du einem Kunden oder einem CFO zeigen kannst.
Für Landwirtschafts- und Umweltanalysen: Miss die Zeitreihenqualität deiner NDVI-Daten vor und nach der Einführung — Anzahl der Lücken, Interpolationsintervalle, mittlere Abweichung der interpolierten von den echten Werten.
Was du nicht gegenrechnen kannst
Cloud Removal löst keine Probleme, die durch schlechte Bodenauflösung entstehen. 10 m Sentinel-2-Pixel sind 10 m — auch nach der Rekonstruktion. Wer Einzelbaum- oder Fahrzeugerkennung braucht, muss in höher auflösende kommerzielle Satelliten investieren, nicht in bessere Wolkenentfernung.
Drei typische Einstiegsfehler
1. Die Wolkenmaske des Datenproviders blind vertrauen.
ESAs Sen2Cor produziert automatisch eine SCL (Scene Classification Layer) mit Wolken- und Wolkenschatten-Klassen. Klingt bequem — und ist es bis zu einem gewissen Grad. Das Problem: Sen2Cor unterscheidet topografische Schatten nicht von echten Wolkenschatten. In Mittelgebirgen und Alpentälern werden Hangschatten regelmäßig als Wolkenschatten klassifiziert und damit als “verdeckt” markiert — obwohl das Bild dort vollständig klar ist. Die Ausgabe: Analysepipelines “sehen” Vegetation in Nordhängen strukturell als lückenbehaftet — nicht weil die Wolken dort häufiger sind, sondern weil der Algorithmus den Schatten nicht korrekt zuordnet. Für diese Gebiete lohnt CloudSEN12-Modelle als präzisere Alternative zu evaluieren.
2. Pixelgenauigkeit mit Analysegenauigkeit gleichsetzen.
Ein Cloud-Removal-Modell, das SSIM-Werte von 0,90 erreicht, hat gut aussehende Bilder erzeugt. Das bedeutet nicht, dass alle darauf basierenden Analysen 90% genau sind. Vegetation-Stress-Klassifikation hängt von NIR- und Red-Edge-Bändern ab — und genau diese werden bei SAR-optischer Fusion schlechter rekonstruiert als RGB-Bänder, weil SAR keine äquivalenten Spektralinformationen in diesen Kanälen liefert. Prüfe vor dem produktiven Einsatz immer die Rekonstruktionsqualität in den Bändern, die für deinen Anwendungsfall kritisch sind — nicht in denen, die auf Demo-Screenshots gut aussehen.
3. Cloud Removal als Vollersatz für echte optische Daten positionieren.
Kein synthetisiertes Bild ist ein echter optischer Scan. Für qualitative Visualisierungen (Schadensdokumentation nach Katastrophen, Medienberichte) sind rekonstruierte Bilder nicht geeignet — der Disclaimer “synthetisiert” muss immer sichtbar sein. Für regulierte Verwendungen (Versicherungsschadensnachweis, staatliche Flächensubventionskontrolle) sind ausschließlich verifizierte Echtzeitaufnahmen zulässig. Cloud Removal ist ein analytisches Hilfsmittel, kein Beweismittel.
Was mit der Einführung wirklich passiert — und was nicht
Die Technik ist handhabbar. Das eigentliche Reibungspotenzial liegt im Erwartungsmanagement gegenüber Kunden und internen Stakeholdern.
Typisches Einführungsmuster: In den ersten Monaten nach der Einführung ist die Begeisterung groß — endlich keine langen Datenlücken mehr im Winter. Dann, bei den ersten quantitativen Analysen, tauchen Fragen auf: “Warum sieht der Wald in dieser Kachel anders aus als im Dezember, obwohl sich nichts geändert hat?” Das ist keine Fehlfunktion — es ist der Unterschied zwischen synthetisierten Pixeln und echten. Teams, die das nicht antizipieren, verlieren Zeit mit interner Qualitätsdebatte statt mit dem Monitoring selbst.
Was konkret hilft:
- Konfidenzmasken von Anfang an fest in die Visualisierungs- und Berichtspipeline integrieren — nicht als separates Produkt, sondern als Pflichtlayer bei jeder Ausgabe
- Für jede Analyse klar trennen: “Echte Pixel”, “Compositing-Pixel” (gleicher Zeitraum, anderer Tag), “SAR-fusionierte Pixel” — drei verschiedene Vertrauensgrade, drei verschiedene analytische Schlussfolgerungsebenen
- Kunden früh über die Methodik informieren: “Unser Monitoring nutzt KI-gestützte Rekonstruktion für Perioden mit starker Bewölkung.” Das klingt modern, nicht wie eine Einschränkung — wenn du es als solches kommunizierst.
Widerstandsmuster bei internen Teams: Fernerkundungsexperten mit Erfahrung aus der Ära der klassischen Mosaikierung reagieren manchmal skeptisch auf generative Modelle. Berechtigter Kern: Sie wissen, wie leicht synthetisierte Pixel Analysen verzerren können. Lösung: nicht argumentieren, sondern einen A/B-Vergleich auf einem bekannten Testgebiet durchführen — echte wolkenfreie Bilder gegen rekonstruierte, mit Qualitätsmetriken in den genutzten Analysebändern.
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Anforderungsanalyse & Datenquellenauswahl | Woche 1–2 | AOI definieren, Analysebänder festlegen, Managed Service vs. Custom-Build entscheiden | Scope-Creep: zu viele Anwendungsgebiete auf einmal, zu großes AOI für Pilotphase |
| Datenpipeline einrichten | Woche 3–6 | Copernicus-API konfigurieren, Sentinel-1/2-Downloads automatisieren, Qualitätsfilter einrichten | API-Limits erschöpft, fehlende GIS-Expertise im Team bremst Integration |
| Pilotbetrieb & Qualitätsbewertung | Woche 7–14 | Cloud-Removal-Modell auf Pilotfläche testen, Rekonstruktionsqualität in Analyse-Bändern prüfen, mit Ground-Truth vergleichen | SSIM hoch, Analyse-Accuracy niedrig — iterative Modellauswahl oder Parameterjustierung nötig |
| Validierung mit Downstream-Analysen | Woche 14–20 | Echte Monitoringberichte mit rekonstruierten Daten erstellen, Kundenfreigabe für Methodik einholen | Kunden lehnen synthetisierte Daten für regulierte Anwendungen ab — Use Case einschränken |
| Produktionsbetrieb | Ab Monat 5–6 | Automatisierte Pipeline läuft, regelmäßige Qualitätschecks, Modell-Updates bei schlechter Saisonperformance | Modell degradiert bei ungewöhnlichen atmosphärischen Bedingungen — Monitoring-Mechanismus fehlt |
Häufige Einwände — und was dahintersteckt
„Wir nutzen einfach Sentinel-1-SAR — das braucht keine Wolkenentfernung.”
SAR ist unverzichtbar und gehört zur Toolbox jedes ernsthaften Erdbeobachtungssystems. Aber SAR allein reicht nicht für Anwendungen, die optische Spektralbänder benötigen: NDVI, Kulturartenklassifikation, Farbschadensdokumentation. Die Frage ist nicht entweder/oder, sondern wofür. Wenn dein Anwendungsfall rein strukturell ist (Deformation, Überschwemmungsausdehnung) — dann stimmt der Einwand. Wenn optische Bänder erforderlich sind — nicht.
„Die rekonstruierten Bilder sind doch fake.”
Technisch korrekt: Es sind synthetisierte Pixel, keine echten Messungen. Aber “fake” ist kein analytischer Begriff. Synthetisierte Pixel, die auf echten SAR-Rückstreuungswerten und statistisch validierten Modellen basieren, liefern unter bekannten Randbedingungen verlässliche analytische Eingaben — mit dokumentierter Unsicherheit. Das ist methodisch seriöser als eine stille Lücke in der Zeitreihe, die niemand bemerkt.
„Unsere Kunden wollen echte Bilder.”
Das ist ein wichtiges Signal, das du ernst nehmen solltest — es bedeutet nicht, dass Cloud Removal falsch ist, sondern dass du Erwartungsmanagement und Transparenz brauchst. Kunden, die eine klare Methodikbeschreibung und Konfidenzmasken als Teil des Produkts sehen, akzeptieren synthetisierte Daten häufig ohne Einwände, solange der Anwendungsfall nicht reguliert ist.
Woran du merkst, dass das zu dir passt
Diese Anzeichen sprechen dafür:
- Ihr liefert monatliche Monitoring-Berichte an Kunden und hattet in den letzten 12 Monaten mindestens zweimal Schwierigkeiten, die Zeitreihe vollständig zu befüllen
- Eure Analysepipeline basiert auf Sentinel-2-Zeitreihen und zeigt in Herbst/Winter-Perioden systematische Lücken
- Ihr arbeitet mit NDVI, EVI oder anderen spektralbasierten Vegetationsindizes und braucht regelmäßige Werte, keine Monatscomposite
- Das überwachte Gebiet liegt in Mitteleuropa, Südostasien oder einer anderen Region mit strukturell hoher Bewölkung
Drei harte Ausschlusskriterien — wann Cloud Removal die falsche Investition ist:
-
Unter 1.000 km² Monitoringfläche mit vierteljährlichem oder jährlichem Berichtszyklus. Temporales Compositing über frei verfügbare Sentinel-2-Archive reicht — das ist kostenlos und ohne Modellaufwand mit EO Browser oder QGIS machbar. Der Aufwand für Cloud Removal lohnt sich erst ab häufigeren Lieferverpflichtungen.
-
Kein Geodaten-Spezialist oder Python-Entwickler im Team. SAR-optische Fusion ist kein Plug-and-play — auch Managed Services wie ClearSKY Vision erfordern GeoTIFF-Handling, Koordinatensysteme und rasterbasierte Datenverarbeitung. Ohne diese Grundkompetenz endet das Projekt in der Datenintegrationsphase.
-
Der Anwendungsfall lässt sich mit SAR-Daten allein lösen. Deformationsanalyse, Überschwemmungsausdehnung, Schiffsdetektion — alles SAR-native Aufgaben, die von Sentinel-1 (kostenlos) oder kommerziellen SAR-Anbietern zuverlässig und ohne Rekonstruktionsrisiko gelöst werden. Wer für diese Use Cases Cloud Removal evaluiert, löst das falsche Problem.
Das kannst du heute noch tun
Öffne Copernicus Data Space und schau dir den EO Browser für dein Monitoring-Gebiet an. Wähle einen Zeitraum der letzten 12 Monate, zeige alle Sentinel-2-L2A-Aufnahmen an und zähle, wie viele davon du tatsächlich verwenden könntest (Wolkenbedeckung < 20%). Das dauert zehn Minuten. Das Ergebnis ist die ehrlichste Einschätzung, wie groß dein Cloud-Cover-Problem tatsächlich ist — und ob sich eine Investition in Cloud Removal lohnt.
Für einen ersten konkreten Test: Lade auf Hugging Face das CloudSEN12-Modell herunter und wende es auf eine Sentinel-2-Szene deines AOI an. Vergleiche die Ergebnismaske mit dem SCL-Layer aus der Level-2A-Verarbeitung — du wirst in Hanggebieten sofort den Unterschied in der Wolkenschatten-Klassifikation sehen.
Für das erste Kundengespräch über Cloud-Removal-Methodik hier ein strukturierter Ansatz:
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- CloudSEN12-Datensatz: Aybar et al. (2022), „CloudSEN12, a global dataset for semantic understanding of cloud and cloud shadow in Sentinel-2”, Nature Scientific Data, Dezember 2022. Datensatz: 49.400 Sentinel-2-Patches, acht aktuelle Cloud-Detection-Modelle evaluiert. doi:10.1038/s41597-022-01878-2
- SAR-optische Fusion Sentinel-1/2: Meraner et al. (2020), „Cloud removal in Sentinel-2 imagery using a deep residual neural network and SAR-optical data fusion”, ISPRS Journal of Photogrammetry and Remote Sensing. Kernbefund: Deep Residual Network mit SAR-Strukturinformationen rekonstruiert optische Sentinel-2-Bänder bei vollständiger Bewölkung. PMC-Volltext
- Globale Wolkenbedeckungsstatistik: 12-Jahres-MODIS-Auswertung: 67% globale Bedeckung, ~55% über Landflächen. Zusammenfassung u. a. bei IIETA, Transactions on Systems (2024), doi:10.18280/ts.410226.
- Sen2Cor-SCL Bekannte Limitierungen: ESA Sentinel-2 Level-2A ATBD (Algorithm Theoretical Basis Document), Version 2.10, November 2021: „Topographic shadows are not differentiated from dark pixels.” ATBD-Dokument ESA
- ClearSKY Vision Preise: Öffentlich zugänglicher Pricing Calculator, clearsky.vision/pricing (Stand: Mai 2026).
- SAR vs. Optical Accuracy: Kombinierte Sentinel-1/2-Klassifikationsgenauigkeit 91,53% vs. Sentinel-2 allein 85,85%. Quelle: mehrere Studien, zusammengefasst bei Capella Space, „SAR vs InSAR For Agricultural Monitoring” (2024).
- Downstream-Accuracy vs. Pixelgenauigkeit: Befund aus ICANN 2019 / NeurIPS-adjacent-Forschung: höhere Inpainting-Qualität führt nicht zwingend zu besserer Downstream-Task-Genauigkeit. ResearchGate
Du willst wissen, ob Cloud Removal für euer Monitoringgebiet und eure SLA-Anforderungen wirtschaftlich ist — oder ob SAR allein ausreicht? Meld dich für ein kurzes Erstgespräch.
Diesen Inhalt teilen:
Wissen ist der erste Schritt. Der zweite kostet Zeit.
Du kannst diesen Use Case selbst umsetzen. Realistisch sind das ein paar Wochen Einarbeitung, einige Fehlversuche bei Datenschutz und Toolauswahl und das Risiko, dass es im Alltag doch nicht greift. Oder wir gehen es gemeinsam an: kostenlos und unverbindlich im Erstgespräch.
Weitere Use Cases
Triebwerksborescope: KI erkennt Beschichtungsschäden die Augen übersehen
Thermische Schutzschichten an Turbinenschaufeln spallen mikroskopisch ab — für menschliche Inspektoren kaum erkennbar, bis es zu spät ist. KI-Bildanalyse auf Borescope-Aufnahmen macht frühe Degradation sichtbar.
Mehr erfahrenKI-Wartungsdokumentation: Weniger Papierarbeit, mehr Werkzeugzeit
MRO-Techniker verbringen bis zu 30 % ihrer Schicht mit Dokumentation. KI-gestützte Spracherkennung und automatische Formularausfüllung geben diese Zeit zurück — EASA-konform und ohne Medienbruch.
Mehr erfahrenCFK-Delaminierung nach Vogelschlag: KI kartiert Schäden im Ultraschall
Nach Vogelschlag oder Impakt an CFK-Strukturen muss die Tiefe einer Delaminierung präzise kartiert werden — ein Prozess, der heute stundenlang dauert und stark von Erfahrung abhängt. KI beschleunigt die Auswertung von Ultraschall-Scans um 70–80%.
Mehr erfahren