Zum Inhalt springen
Freemium 🇪🇺 EU-Server Geprüft: Mai 2026

Soda Core

Soda Data

3/5
Tool öffnen

Soda Core ist ein Open-Source-Framework für Datenqualitätsprüfungen, das Qualitätsregeln als YAML-Dateien definiert — einfacher lesbar als Python-Code. Es unterstützt über 50 built-in Checks und direkte Reconciliation-Tests zwischen zwei Datenquellen, was es besonders für Migrationsprojekte geeignet macht.

Kosten: Soda Core (Open Source, Apache 2.0) kostenlos. Soda Cloud (verwalteter Dienst mit UI, Benachrichtigungen, Team-Features) ab ca. 700 USD/Monat; Preise abhängig von Datenquellen und Nutzeranzahl

Stärken

  • YAML-basierte Checks: zugänglicher als Python-Code für Teams ohne Programmiererfahrung
  • 50+ eingebaute Prüfungen: Nullquoten, Duplikate, Werteverteilungen, referentielle Integrität
  • Reconciliation Checks: direkte Gegenüberstellung zweier Datenquellen (Quelle vs. Ziel) out-of-the-box
  • Unterstützt alle wichtigen Warehouses: Snowflake, BigQuery, Databricks, PostgreSQL, SQL Server, Redshift
  • Soda Core vollständig open-source unter Apache 2.0

Einschränkungen

  • Kein deutschsprachiger Support
  • Soda Core 4.0 hat die Syntax auf Data Contracts umgestellt — ältere Checks müssen migriert werden
  • Keine grafische UI in der kostenlosen Version — ausschließlich CLI und YAML
  • Für komplexe statistische Anomalieerkennung weniger geeignet als Great Expectations

Passt gut zu

Teams, die Migrationsprojekte mit automatisierten Reconciliation-Checks absichern wollen Data-Engineering-Teams, die einfacher lesbare Qualitätsregeln als YAML bevorzugen Projekte, die zwischen zwei Datenbanken Wertegleichheit sicherstellen müssen

So steigst du ein

Schritt 1: Installiere Soda Core per pip für deine Datenquelle: pip install -i https://pypi.cloud.soda.io soda-postgres (oder soda-snowflake, soda-bigquery etc.). Richte eine configuration.yml mit den Verbindungsparametern ein.

Schritt 2: Erstelle eine checks.yml mit deinen ersten Qualitätsregeln — zum Beispiel missing_count(email) = 0 oder duplicate_count(order_id) = 0. Für Migrationsprojekte: definiere Reconciliation-Checks, die Quell- und Zieldatenbank direkt vergleichen.

Schritt 3: Führe soda scan -d your_datasource -c configuration.yml checks.yml aus. Soda Core zeigt pro Prüfung PASS/FAIL mit konkreten Abweichungswerten. Plane regelmäßige Scans in deiner CI/CD-Pipeline oder deinem Scheduler ein.

Ein konkretes Beispiel

Ein Versicherungsunternehmen migriert seine Kundendatenbank von SQL Server zu PostgreSQL. Das Data-Engineering-Team definiert 45 Soda-Checks für die 12 wichtigsten Tabellen: Kundennummern eindeutig und vollständig, Vertragsbeträge im gleichen Wertebereich, Policennummern referentiell integer. Beim ersten Test schlagen 8 Checks fehl — darunter ein systematischer Encoding-Fehler bei Umlauten in Kundennamen, der manuell unentdeckt geblieben wäre. Behebung dauert einen Tag; ohne automatisierte Tests wäre der Fehler erst in der Produktion aufgefallen.

Diesen Inhalt teilen:

Empfohlen in 1 Use Cases

Redaktionell bewertet · Preise und Funktionen können sich ändern.

Stimmt etwas nicht?

Preise geändert, Feature veraltet oder etwas fehlt? Wir freuen uns über Hinweise und Ergänzungen.

Feedback geben

Nicht sicher, ob Soda Core zu euch passt?

Wir helfen bei der Tool-Auswahl und begleiten die Einführung in euren Arbeitsalltag — unverbindlich und kostenlos im Erstgespräch.

Erstgespräch anfragen
Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–3 Themen — du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar