Amazon SageMaker
Amazon Web Services (AWS)
Managed Machine-Learning-Plattform von AWS. Jupyter-Notebooks, AutoML, Built-in-Algorithmen, Model Registry, Endpoints und seit dem Rebrand 2024 als SageMaker AI auch ein Hub für Foundation Models. Tiefe Integration mit S3, Glue, Redshift und dem AWS-IAM-Stack.
Kosten: Pay-as-you-go für Compute, Storage und Endpoints; typisch 100–500 EUR/Monat für kleinere Trainings- und Inference-Setups, schnell vierstellig bei produktiven Endpoints
Kategorien
Stärken
- Tiefe Integration mit dem gesamten AWS-Stack (S3, Glue, IAM, CloudWatch)
- Vollständiger ML-Lebenszyklus: Notebook, Training, Tuning, Registry, Deployment
- EU-Datenhosting in Frankfurt (eu-central-1) und Irland (eu-west-1) verfügbar
- JumpStart-Hub mit vortrainierten Modellen und Foundation Models
- Auto-Scaling-Endpoints und Multi-Model-Endpoints für Produktivlasten
Einschränkungen
- Komplexe Preisgestaltung, Compute, Storage, Endpoint-Stunden und Data-Processing addieren sich schnell
- Tiefer AWS-Lock-in: Modelle und Pipelines lassen sich kaum portabel halten
- Steile Lernkurve, ohne AWS-Erfahrung mehrere Wochen Einarbeitung
- Endpoints laufen 24/7 weiter, auch wenn niemand sie benutzt, Kostenfalle
- Klassisches SageMaker und SageMaker AI nebeneinander, Dokumentation ist fragmentiert
Passt gut zu
Wann ja, wann nein
Wann ja
- Du bist bereits auf AWS und deine Daten liegen in S3, Glue oder Redshift
- Du brauchst skalierbares Modell-Hosting mit Auto-Scaling und Versionierung
- Du willst EU-Datenhosting (Frankfurt) für ML-Workloads
- Dein Team hat AWS-Kompetenz und kann mit IAM, VPC und CloudWatch umgehen
Wann nein
- Du bist Cloud-agnostisch oder primär auf Azure/GCP
- Du willst eine niedrige Einstiegshürde für ML-Einsteiger
- Du brauchst nur einen LLM-API-Zugang, dafür ist Bedrock einfacher
- Du arbeitest On-Premise oder hast strikte Anti-Cloud-Vorgaben
Kurzfazit
SageMaker ist die naheliegende Wahl, wenn dein Unternehmen ohnehin auf AWS läuft. Die Plattform deckt den kompletten ML-Lebenszyklus ab, vom Jupyter-Notebook über Training und Hyperparameter-Tuning bis zum Auto-Scaling-Endpoint in Produktion. Mit dem Rebrand zu SageMaker AI (2024) ist auch ein Foundation-Model-Hub (JumpStart) integriert. Was du dafür akzeptieren musst: tiefen AWS-Lock-in, eine Preisgestaltung, die sich aus Dutzenden Komponenten zusammensetzt, und eine Lernkurve, die ohne AWS-Vorerfahrung mehrere Wochen kostet. Für reine LLM-Anwendungen ist Bedrock der einfachere Weg, SageMaker ist die Plattform für Teams, die selbst trainieren, fine-tunen und produktiv ausliefern wollen.
Für wen ist Amazon SageMaker?
ML-Engineering-Teams in AWS-Shops: Wenn deine Daten ohnehin in S3 oder Redshift liegen und dein Team mit IAM, VPC und CloudWatch arbeitet, ist SageMaker die kostengünstigste Variante, ML-Workloads zu industrialisieren. Datenpfade sind kurz, Authentifizierung ist gelöst, Monitoring ist eingebaut.
Data-Science-Teams mit Produktivanspruch: Notebooks gibt es überall, aber die Brücke vom Experiment zum produktiven, versionierten, monitorten Modell ist genau das, was SageMaker liefert. Pipelines, Model Registry und Endpoints sind kein Bastelprojekt, sondern dokumentierte Bausteine.
Enterprises mit EU-Hosting-Pflicht: SageMaker ist in Frankfurt (eu-central-1) und Irland (eu-west-1) verfügbar, inklusive der meisten Foundation Models in JumpStart. Für regulierte Branchen (Banken, Versicherungen, Health) ein wichtiges Argument gegen US-Only-Anbieter.
Unternehmen mit hohem Compute-Bedarf: GPU-Cluster für Training, HyperPod für verteiltes Training auf hunderten Knoten, Spot-Instances für Kostenoptimierung, SageMaker skaliert auf Workloads, die du lokal nicht stemmen kannst.
Weniger geeignet für: Einsteiger ohne AWS-Erfahrung (Lernkurve mehrere Wochen), kleine Projekte mit unter 1000 Inference-Calls pro Tag (Endpoints sind dauerhafte Kosten), Cloud-agnostische Teams (Lock-in macht Wechsel teuer) und Anwendungsfälle, die mit einer reinen LLM-API auskommen, dafür ist Bedrock direkter.
Preise im Detail
| Komponente | Preisbasis | Realistische Range |
|---|---|---|
| Notebook Instances | pro Stunde | ml.t3.medium ca. 0,06 USD/h, ml.m5.xlarge ca. 0,27 USD/h |
| Training Jobs | pro Sekunde, pro Instance | ml.m5.xlarge ca. 0,27 USD/h, GPU-Instances (ml.g5.xlarge) ca. 1,52 USD/h |
| Real-Time Endpoints | pro Stunde, dauerhaft laufend | Kleiner CPU-Endpoint ca. 80–150 EUR/Monat, GPU-Endpoint schnell 500+ EUR/Monat |
| Serverless Inference | pro Anfrage + GB-Sekunden | Pay-per-use, gut für sporadische Lasten |
| Storage (EBS, S3) | pro GB | EBS ca. 0,10 USD/GB-Monat, S3 ca. 0,023 USD/GB-Monat |
| Data Wrangler / Pipelines | pro Job-Stunde | Variabel je nach Instance-Typ |
| JumpStart Foundation Models | pro Endpoint-Stunde | Llama 3 70B ca. mehrere USD/h auf passender GPU |
Einordnung: Die Pay-as-you-go-Logik klingt fair, ist in der Praxis aber die größte Falle. Ein einzelner produktiver Endpoint, der 24/7 läuft, kostet je nach Instance schnell 100–500 EUR pro Monat, selbst wenn ihn niemand nutzt. Für POCs und kleine Setups bist du mit 100–300 EUR/Monat dabei, sobald mehrere Endpoints, GPU-Training und Data-Wrangler-Jobs zusammenkommen, wird es schnell vierstellig. Spot-Instances für Training und Serverless Inference für sporadische Lasten sind die wichtigsten Hebel, um die Rechnung im Griff zu behalten. AWS-Cost-Explorer und Budgets-Alarme sind Pflicht, nicht optional.
Stärken im Detail
Vollständiger ML-Lebenszyklus. SageMaker bildet den ganzen Weg ab: Daten laden (Data Wrangler), Notebook-Entwicklung (Studio), Training (Jobs), Tuning (Automatic Model Tuning), Versionierung (Model Registry), Deployment (Endpoints) und Monitoring (Model Monitor). Du musst keine drei Tools verheiraten, das spart Wochen Setup-Arbeit gegenüber einer Eigenbau-Pipeline mit MLflow, Kubernetes und Eigenmanagement.
Tiefe AWS-Integration. Die Stärke ist gleichzeitig die Schwäche: Wer auf AWS ist, bekommt Datenpfade, Identity, Logging und Netzwerke geschenkt. S3-Bucket einbinden ist eine Zeile Code, IAM-Rollen statt API-Keys sind Standard, CloudWatch-Logs entstehen automatisch. Das ist schwer zu schlagen, wenn deine Stammdaten ohnehin in AWS liegen.
JumpStart bringt Foundation Models direkt in den Stack. Llama, Mistral, Stable Diffusion, deutsche Modelle wie LeoLM, du kannst sie mit wenigen Klicks in einer EU-Region deployen, ohne Modelle selbst herunterzuladen oder zu hosten. Das ist die Antwort auf Bedrock für Teams, die mehr Kontrolle wollen (eigenes Fine-Tuning, eigene Hardware-Wahl).
EU-Hosting ist real, nicht nur Marketing. Frankfurt und Irland sind echte Regionen mit fast vollem Feature-Umfang. AVV gibt es als AWS-DPA. Für DSGVO-relevante Workloads ist das einer der wenigen Großanbieter, die das ernst nehmen.
HyperPod für Großtraining. Wer wirklich Foundation Models trainiert oder fine-tunt, bekommt mit HyperPod verteiltes Training auf hunderten Knoten mit automatischem Recovery bei Hardware-Ausfällen. Das ist eine Liga, in der die meisten Konkurrenten nicht spielen.
Schwächen ehrlich betrachtet
Die Preisgestaltung ist ein Minenfeld. Es gibt keine Pauschale, keine Flatrate, keinen Tarif, den du ausrechnen kannst, ohne mehrere Komponenten zu kombinieren: Compute-Stunden, Endpoint-Stunden, EBS-Storage, S3-Egress, Data-Processing, JumpStart-Modelle. Selbst AWS-Profis sind regelmäßig überrascht, was am Monatsende auf der Rechnung steht. Workaround: AWS-Budgets mit Alerts auf jedem Account und tags-basierte Cost-Allocation von Tag eins.
Endpoints kosten dauerhaft, auch wenn sie idle sind. Ein Real-Time-Endpoint läuft 24/7, auch wenn um 3 Uhr morgens niemand etwas anfragt. Wer das nicht weiß, zahlt 200 EUR/Monat für einen Endpoint, der zehn Anfragen pro Tag bearbeitet. Workaround: Serverless Inference für sporadische Lasten, oder Multi-Model-Endpoints, die mehrere Modelle teilen.
Lock-in ist tief und teuer aufzubrechen. Pipelines verwenden SageMaker-spezifische SDKs, Endpoints sind in AWS-IAM und VPC eingebettet, Foundation Models in JumpStart sind nur dort deploybar. Ein Wechsel zu Vertex AI oder Azure ML bedeutet faktisch Neubau. Workaround: MLflow als plattformneutrales Tracking-Layer einziehen, Modelle in standardisierten Formaten (ONNX, BentoML) ablegen.
Steile Lernkurve. Ohne solide AWS-Vorkenntnisse (IAM, VPC, S3, CloudWatch) wird SageMaker frustrierend. Die Dokumentation ist umfangreich, aber gleichzeitig fragmentiert: klassisches SageMaker, SageMaker AI, Studio, Studio Classic, vier UI-Welten, die teils dieselben Funktionen mit unterschiedlichen Pfaden anbieten. Workaround: gezielter Einstieg über AWS-Workshops oder einen Solution Architect aus dem AWS-Vertrieb.
SageMaker AI vs. Bedrock, Verwirrung um Foundation Models. Bedrock ist der einfachere API-Zugang zu Foundation Models, SageMaker JumpStart bietet sie als Endpoint im eigenen Account. Die beiden Produkte überlappen, AWS-Marketing trennt sie nicht klar. In der Praxis: Wer nur LLM-Calls braucht, nimmt Bedrock; wer fine-tunen oder eigene Hardware steuern will, nimmt SageMaker.
Alternativen im Vergleich
| Wenn du… | …nimm stattdessen |
|---|---|
| Auf Azure-Stack arbeitest und vergleichbare Managed-ML-Tiefe willst | Azure Machine Learning |
| Cloud-agnostisch bleiben und visuelle Workflows für nicht-technische Teams brauchst | Dataiku |
| ML-Tracking, Registry und Reproducibility ohne Vendor-Lock-in willst | MLflow |
| Nur LLM-Calls über API brauchst, kein eigenes Training | Azure OpenAI Service oder AWS Bedrock |
Auf der Cross-Cloud-Seite konkurrieren Databricks (Lakehouse + ML) und Vertex AI (GCP-Pendant zu SageMaker) ebenfalls direkt, beide ohne eigenes Review hier verlinkt, aber als Wahl ernsthaft zu prüfen, wenn dein Datenstack ohnehin außerhalb von AWS liegt. SageMaker ist die richtige Antwort, sobald die Frage „Wir sind auf AWS, was ist unser ML-Stack?” lautet, selten die richtige, wenn die Cloud-Wahl noch offen ist.
So steigst du ein
Schritt 1: Lege ein dediziertes AWS-Konto (oder eine eigene Organisation Unit) für ML-Workloads an, nicht in den Produktionsaccount mischen. Setze Budget-Alerts auf 100, 500 und 1000 EUR/Monat und aktiviere Cost-Allocation-Tags. Wähle Frankfurt (eu-central-1) als Region, wenn DSGVO-Themen relevant sind.
Schritt 2: Starte mit SageMaker Studio statt klassischen Notebook-Instances, das ist die aktuelle UI und integriert Jobs, Pipelines und Endpoints in einer Oberfläche. Probiere zunächst ein vortrainiertes JumpStart-Modell auf einem kleinen Endpoint aus, bevor du eigenes Training aufsetzt. Stoppe Endpoints konsequent, wenn du sie nicht brauchst, eine vergessene GPU-Instance kostet schnell 50 EUR pro Tag.
Schritt 3: Sobald ein Modell produktiv geht, baue Pipelines (SageMaker Pipelines oder AWS Step Functions) statt manueller Trainings-Jobs. Aktiviere Model Monitor für Drift-Detection und richte CloudWatch-Alarme auf Endpoint-Latenz und Fehlerquoten ein. Für Production-Endpoints: Auto-Scaling-Policies definieren, Multi-AZ aktivieren und Spot-Instances für Trainings-Jobs nutzen, um Kosten um bis zu 70 % zu drücken.
Ein konkretes Beispiel
Ein mittelständischer Maschinenbauer aus Stuttgart mit ca. 800 Mitarbeitern hat seine Service-Daten (Sensorlogs, Reparaturhistorie, Kundenmails) in einem AWS-Data-Lake (S3 + Glue) konsolidiert. Das Data-Science-Team (drei Personen) baut auf SageMaker ein Vorhersagemodell für Komponenten-Ausfälle: Datenvorbereitung in Data Wrangler, Training mit XGBoost als Built-in-Algorithm, Hyperparameter-Tuning über Automatic Model Tuning. Das fertige Modell wird als Real-Time-Endpoint in Frankfurt deployed; die Service-Techniker-App fragt es bei jeder Wartung ab und bekommt eine Ausfallwahrscheinlichkeit pro Komponente in unter 200 ms zurück. Monatliche Kosten: ca. 380 EUR für Endpoint, Storage und gelegentliche Re-Trainings. Vorher dauerte die Datenanalyse pro Wartungsfall 20 Minuten manuell, jetzt ist sie in Sekunden da, und die ungeplanten Ausfälle sind im ersten Jahr um 23 % zurückgegangen.
DSGVO & Datenschutz
- Datenhosting: Region frei wählbar, für DSGVO-Compliance Frankfurt (eu-central-1) oder Irland (eu-west-1) wählen. Daten verlassen die Region nicht, wenn keine cross-region-Services aktiv sind.
- Auftragsverarbeitung: AWS bietet ein standardisiertes Data Processing Addendum (DPA), das den Anforderungen der DSGVO entspricht. Auf aws.amazon.com/compliance abrufbar.
- Datennutzung: AWS verwendet Kundendaten und Modelle nicht zum Training eigener Foundation Models, vertraglich zugesichert. JumpStart-Modelle laufen im eigenen Account und teilen keine Daten mit AWS.
- Verschlüsselung: Standardmäßig at-rest und in-transit. Eigene KMS-Keys (BYOK) möglich für strenge Anforderungen.
- US-Cloud-Act-Risiko: AWS ist US-Konzern. Trotz EU-Region bleibt theoretisches Zugriffsrisiko durch US-Behörden, wie bei allen US-Hyperscalern. Für hochsensible Branchen (Behörden, Verteidigung) Sovereign-Cloud-Optionen (z.B. AWS European Sovereign Cloud, geplant 2025/26) prüfen.
- Empfehlung für Unternehmen: AVV/DPA vor Produktivnutzung unterschreiben, Region in Code-Templates fest verdrahten, IAM-Policies nach Least-Privilege gestalten, CloudTrail aktivieren.
Gut kombiniert mit
- AWS S3 & Glue, Data Lake und Datenkatalog als Quellsystem für Trainingsdaten. SageMaker liest direkt aus S3, ohne Daten umkopieren zu müssen.
- MLflow, als plattformunabhängiges Tracking- und Registry-Layer parallel zu SageMaker. Reduziert Lock-in und macht Modelle portabel.
- AWS Lambda + API Gateway, für Event-driven oder asynchrone Inference vor SageMaker-Endpoints. Spart Kosten gegenüber direkten Endpoint-Aufrufen bei sporadischen Lasten.
Unser Testurteil
3 von 5 Sternen. SageMaker ist eine der vollständigsten ML-Plattformen am Markt, wenn du auf AWS bist. Die EU-Region, der Foundation-Model-Hub, die Pipeline-Tools und HyperPod für Großtraining sind ernsthafte Argumente. Was den vierten Stern kostet: die brutale Preiskomplexität, der tiefe Vendor-Lock-in und die Lernkurve, die ohne AWS-Erfahrung Wochen verschlingt. Für AWS-Shops ist SageMaker oft alternativlos und verdient dort eher 4 Sterne. Für alle anderen ist es eine teure Wette auf einen Hyperscaler, die selten besser ist als die jeweils naheliegende Alternative im eigenen Cloud-Stack.
Was wir bemerkt haben
- 2024, AWS hat SageMaker zu „SageMaker AI” umbenannt und als Teil einer übergeordneten „next generation”-Plattform mit Lakehouse-Architektur (S3 + Redshift) positioniert. In der Praxis laufen klassisches SageMaker und SageMaker AI parallel, die Konsolen und Doku-Pfade sind teils noch fragmentiert.
- 2024, HyperPod als Service für verteiltes Training großer Modelle wurde general available. Für Teams, die Foundation Models selbst trainieren oder fine-tunen, ist das die ernsthafte Antwort auf die Konkurrenz aus Databricks und GCP.
- 2024–2025, JumpStart hat das Angebot an deployment-fertigen Foundation Models stark ausgebaut (Llama 3, Mistral, Stable Diffusion 3, deutsche Modelle). In den meisten Fällen verwischt das die Grenze zu Bedrock, AWS positioniert die beiden Produkte aber unterschiedlich (Bedrock = API, SageMaker = volle Kontrolle).
- 2025, Die European Sovereign Cloud wurde angekündigt: ein vollständig in Europa betriebener und betreuter AWS-Stack. Soll bis Ende 2025 / Anfang 2026 verfügbar werden, für Behörden und stark regulierte Branchen relevant, sobald SageMaker dort verfügbar ist.
Diesen Inhalt teilen:
Empfohlen in 6 Use Cases
Telekommunikation
Finanzwesen & Versicherung
Luft- & Raumfahrt
Metallindustrie
Empfohlen für diese Branchen
Arthur Atlas
KI-Analyst
So entsteht diese Bewertung
Diese Seite bewerten wir redaktionell, mit kräftiger Unterstützung von Arthur Atlas, unserem KI-Analysten. Er prüft Bewertungen nach und markiert veraltete Angaben, sobald sich der Markt dreht. Unsere Angaben stammen überwiegend aus öffentlich zugänglichen Quellen wie Anbieter-Website, Doku und Preislisten. Preise und Funktionen können sich ändern.
Hinweis: Diese Angaben können veraltet oder fehlerhaft sein. Prüfe im Zweifel immer direkt auf der Website des Anbieters.
Preise geändert, Feature veraltet oder etwas fehlt?
Wir freuen uns über Hinweise und Ergänzungen.
Du arbeitest bei Amazon Web Services (AWS)?
Gib uns einen Testzugang, dann schauen wir tiefer rein und ergänzen die Bewertung aus erster Hand.
Nicht sicher, ob Amazon SageMaker zu euch passt?
Wir helfen bei der Tool-Auswahl und begleiten die Einführung in euren Arbeitsalltag, unverbindlich und kostenlos im Erstgespräch.