PagerDuty ist die führende Plattform für IT-Incident-Management und On-Call-Alerting. DevOps- und SRE-Teams nutzen PagerDuty für automatisches Alerting, On-Call-Rotationen, Incident-Eskalation und Post-Mortem-Analysen. Die KI-gestützte AIOps-Funktion korreliert Alarme automatisch und reduziert Alert-Fatigue in komplexen Systemlandschaften erheblich.
Kosten: Free (bis 5 Nutzer, 0 USD), Professional ab 21 USD/Nutzer/Monat, Business ab 41 USD/Nutzer/Monat, Enterprise auf Anfrage
Stärken
- Branchenstandard für On-Call-Management — flexible Rotationen, Eskalationsregeln, Schedules mit Überschreibungslogik
- Über 750 native Integrationen mit Monitoring-, Deployment- und Collaboration-Tools (Datadog, AWS CloudWatch, Jira, Slack)
- KI-gestützte AIOps-Alert-Gruppierung reduziert Alert-Noise nachweislich um bis zu 91%
- Detaillierte Incident-Timelines, Post-Mortem-Templates und Metrik-Dashboards für kontinuierliche Verbesserung
- Schnelle Einrichtung — erster produktiver Alert in unter 30 Minuten möglich
Einschränkungen
- Kein Deutsch — ausschließlich englischsprachige Oberfläche und Support
- Datenhaltung in den USA — kein EU-Rechenzentrum verfügbar, DSGVO-Prüfung erforderlich
- Teuer bei skalierenden Teams — 41 USD/Nutzer/Monat im Business-Plan summiert sich bei 20 Personen auf 820 USD monatlich
- Hohe Konfigurationskomplexität bei Enterprise-Setups — On-Call-Schedules, Routing-Regeln und Event Intelligence erfordern Zeit
- Kein nativer Ticketing-Workflow für Nutzeranfragen — PagerDuty ist kein Helpdesk-Ersatz
Passt gut zu
Wann ja, wann nein
Wann ja
- Du betreibst kritische digitale Services und brauchst strukturiertes On-Call-Management mit Eskalationsstufen
- Dein DevOps- oder SRE-Team ertrinkt in Alert-Noise aus mehreren Monitoring-Systemen
- Du benötigst nachvollziehbare Incident-Timelines und Post-Mortem-Dokumentation
- Dein Unternehmen hat hohe Uptime-Anforderungen (SLAs, Enterprise-Kunden, regulierter Betrieb)
Wann nein
- Du suchst ein klassisches IT-Helpdesk-Tool für Nutzer-Tickets (Freshdesk oder Zendesk sind besser)
- Dein Team hat unter 5 Personen und wenig Monitoring-Infrastruktur — der Free Plan reicht, aber der ROI ist fraglich
- Budget ist das primäre Entscheidungskriterium — bei 20+ Nutzern wird PagerDuty sehr teuer
- Du benötigst EU-Datenhosting ohne Ausnahme (kein EU-Rechenzentrum verfügbar)
Kurzfazit
PagerDuty ist der De-facto-Standard für strukturiertes Incident-Management in DevOps- und SRE-Teams — wer kritische digitale Services betreibt und rund um die Uhr erreichbar sein muss, kommt an PagerDuty kaum vorbei. Die Stärken liegen in der ausgereiften On-Call-Rotation, der tiefen Integration in bestehende Monitoring-Landschaften und der KI-gestützten Alert-Gruppierung, die aus hundert Alarmen einen einzigen Incident macht. Wo PagerDuty an Grenzen stößt: Der Preis skaliert pro Nutzer und wird bei wachsenden Teams schnell sehr teuer. Für kleine Teams unter 10 Personen oder Unternehmen mit harten EU-Hosting-Anforderungen gibt es günstigere Alternativen.
Für wen ist PagerDuty?
DevOps- und SRE-Teams in wachsenden Tech-Unternehmen: PagerDuty ist für diese Zielgruppe gebaut. Wer mehrere Services auf AWS, GCP oder Azure betreibt, Datadog oder New Relic für Monitoring nutzt und On-Call-Schichten fair rotieren will, bekommt hier das ausgereifteste Werkzeug am Markt. Die Integration in bestehende Tool-Chains ist klasse.
IT-Operations-Teams mit 24/7-Bereitschaftspflicht: Unternehmen mit kritischer Infrastruktur — Banken, E-Commerce-Plattformen, Gesundheits-IT, Telekommunikation — nutzen PagerDuty, um sicherzustellen, dass Incidents rund um die Uhr eskaliert werden. Die Eskalationsrichtlinien stellen sicher, dass kein Alert unbemerkt bleibt.
Platform-Engineering-Teams mit Alert-Fatigue: Wenn das Team täglich von hunderten irrelevanter Alerts überschwemmt wird, ist PagerDuty AIOps die richtige Therapie. Die maschinell lernende Alert-Gruppierung korreliert verwandte Events und reduziert den Lärm auf ein handhabbar geringes Niveau.
Wachsende SaaS-Anbieter mit Enterprise-Kunden: Wer SLAs gegenüber Enterprise-Kunden einhalten muss, braucht lückenlose Incident-Dokumentation. PagerDuty liefert vollständige Timelines und Post-Mortem-Reports — die lassen sich direkt an Kunden und Stakeholder kommunizieren.
Weniger geeignet für: IT-Support-Teams, die Nutzeranfragen bearbeiten (Freshdesk oder Zendesk sind die richtige Wahl), kleine Teams mit einfacher Infrastruktur, und Unternehmen, die EU-Datenhosting ohne Kompromisse benötigen.
Preise im Detail
| Plan | Preis | Nutzer | Was du bekommst |
|---|---|---|---|
| Free | 0 USD | bis 5 | On-Call-Scheduling, Eskalationsrichtlinien, 100 SMS/Anruf-Benachrichtigungen/Monat, Basis-Integrationen |
| Professional | 21 USD/Nutzer/Monat (jährlich) | unbegrenzt | Alles aus Free + Slack/Teams-Integration, externe Statusseite (bis 250 Abonnenten), Post-Incident-Reviews, erweiterte Benachrichtigungsquoten |
| Business | 41 USD/Nutzer/Monat (jährlich) | unbegrenzt | Alles aus Professional + Custom Incident Fields, bis zu 3 Incident-Typen, Statusseite bis 500 Abonnenten, erweiterte ITSM-Integrationen, mehrjähriger Datenzugriff |
| Enterprise | Auf Anfrage | unbegrenzt | Alles aus Business + vollständige Chat-Experience, erweiterte Workflows, Incident Tasks, bis zu 100 Custom Incident-Typen, AIOps Event Intelligence, premium Support |
Einordnung: Der Free Plan ist nur für kleine Teams zum Ausprobieren geeignet — 5 Nutzer und 100 monatliche SMS/Anruf-Benachrichtigungen reichen für produktiven Einsatz nicht aus. Der Professional Plan bei 21 USD reicht für Startups und kleinere Teams, die Slack-Integration aber keinen komplexen ITSM-Workflow brauchen. Das echte Produktivitätswerkzeug beginnt beim Business Plan — für Teams mit mehr als 15 Nutzern wird die Rechnung schnell fünfstellig pro Jahr. Jahres-Billing ist deutlich günstiger als monatliche Abrechnung.
Stärken im Detail
On-Call-Management ist das Herzstück und auf Industriestandard gereift. PagerDuty erlaubt verschachtelte Schichtpläne mit automatischen Überschreibungen, faire Rotationslogiken und mehrstufige Eskalationsrichtlinien. Wenn der primäre On-Call-Engineer nicht antwortet, eskaliert PagerDuty automatisch an den nächsten — per Push, SMS oder Anruf, je nach konfigurierter Dringlichkeit. Diese Tiefe der Konfiguration gibt es bei keinem anderen Tool ohne erhebliche Eigenentwicklung.
750+ Integrationen ohne Glue-Code. PagerDuty verbindet sich nativ mit dem kompletten DevOps-Stack: Monitoring (Datadog, New Relic, AWS CloudWatch, Prometheus), Versionsverwaltung (GitHub, GitLab), Ticketing (Jira, ServiceNow), Chat (Slack, Teams), Deployment-Tools (Jenkins, ArgoCD) und Cloud-Provider. Alerts aus allen Quellen landen in einem einzigen Incident-Cockpit — kein manuelles Routing, kein Copy-Paste.
AIOps-Alert-Gruppierung reduziert Lärm um bis zu 91%. Das ist keine Marketingzahl, sondern das Ergebnis des maschinellen Lernens auf Basis von Millionen historischer Incidents. Statt 80 Einzelalarmen bei einem Datenbankausfall bekommt der On-Call-Engineer einen Incident mit Kontext, Zeitlinie und automatisch identifizierter Root-Cause-Hypothese. Das ist der Unterschied zwischen Panik und strukturiertem Handeln.
Post-Mortem-Kultur wird operationalisiert. PagerDuty erstellt nach jedem Incident automatisch eine vollständige Timeline mit allen Aktionen, Benachrichtigungen und Reaktionszeiten. Die integrierten Post-Mortem-Templates helfen Teams, aus Incidents zu lernen — mit Metriken wie MTTD (Mean Time to Detect) und MTTR (Mean Time to Resolve), die über Zeit verfolgt werden können.
Schnelle Einrichtung für erste Tests. Wer Datadog oder AWS CloudWatch bereits nutzt, kann PagerDuty in unter 30 Minuten mit dem ersten produktiven Alert verbinden. Der Free Plan senkt die Einstiegshürde für erste Evaluierungen.
Schwächen ehrlich betrachtet
Die Kosten eskalieren mit dem Team. Bei 41 USD pro Nutzer und Monat im Business Plan zahlt ein 20-Personen-Team bereits 820 USD monatlich — fast 10.000 USD pro Jahr, nur für das Alerting-Tool. Bei 50 Nutzern sind das über 25.000 USD jährlich. PagerDuty ist klar als Premium-Produkt positioniert und rechtfertigt das mit Qualität, aber Budget-bewusste Teams sollten den Preisanstieg bei Wachstum einkalkulieren.
Keine EU-Datenhaltung. Alle Daten werden auf US-amerikanischen Servern verarbeitet und gespeichert. Ein EU-Rechenzentrum existiert nicht. Für europäische Unternehmen in regulierten Branchen (Gesundheitswesen, Finanzdienstleistungen nach DSGVO) ist das ein echtes Hindernis. PagerDuty bietet zwar Standardvertragsklauseln und ist im EU-US Data Privacy Framework zertifiziert — das mildert das Problem, löst es aber nicht vollständig.
Initialkonfiguration ist nicht trivial. Ein produktives Setup mit sinnvollen On-Call-Rotationen, Routing-Regeln, Service-Definitionen und Alert-Schwellenwerten braucht Zeit. Teams, die PagerDuty ohne Erfahrung einführen, unterschätzen oft den Aufwand für die erste saubere Konfiguration — schlechte Routing-Regeln führen dazu, dass entweder zu viele oder zu wenige Alerts durchkommen.
Kein Helpdesk-Workflow für Nutzeranfragen. PagerDuty ist für Maschinenalerts und interne Incidents gebaut, nicht für Nutzertickets. Wer IT-Support-Anfragen von Mitarbeitern oder Kunden verwalten will, braucht ein separates Tool. Die Vermischung beider Workflows in PagerDuty ist möglich, aber umständlich.
Englisch only. Oberfläche, Dokumentation und Support sind ausschließlich auf Englisch. Für deutschsprachige Teams, die kein gutes Englisch sprechen, oder für Unternehmen mit Compliance-Anforderungen an deutschsprachige Dokumentation, ist das ein praktisches Hindernis.
Alternativen im Vergleich
| Wenn du… | …nimm stattdessen |
|---|---|
| Nutzer-Tickets und Incident-Management in einem Tool willst | Freshdesk oder Zendesk |
| Monitoring, Dashboards UND Alerting ohne Extra-Tool willst | Datadog mit eigenem Alerting |
| Incident-Management in deine Jira-Welt integrieren willst | Jira Service Management (Atlassian-Ökosystem) |
| Budget-bewusst bist und ein einfacheres Setup suchst | Direktes Alerting in Datadog oder Grafana Alerting |
PagerDuty ist das beste spezialisierte On-Call-Tool — aber spezialisiert ist das Stichwort. Wer die Tiefe der On-Call-Konfiguration nicht braucht oder wer sein Monitoring-Tool bereits für Alerts nutzt, zahlt mit PagerDuty für Features, die er nie nutzt. Das Preisargument für Alternativen wird mit wachsender Teamgröße stärker.
So steigst du ein
Schritt 1: Erstelle einen PagerDuty-Account (Free Plan für bis zu 5 Nutzer, keine Kreditkarte nötig). Lege dein erstes Service-Objekt an und verbinde es mit einer Monitoring-Quelle — z.B. Datadog, AWS CloudWatch oder einem einfachen E-Mail-Alert. Innerhalb von 30 Minuten solltest du deinen ersten Test-Alert auf dein Mobilgerät erhalten. Nutze die Testphase, um die Benachrichtigungskanäle (Push, SMS, Anruf) zu konfigurieren und zu prüfen, ob sie in deiner Netzwerkumgebung funktionieren.
Schritt 2: Konfiguriere deine erste On-Call-Rotation mit realistischen Schichtzeiten und Eskalationsregeln. Definiere mindestens zwei Eskalationsstufen: Schritt 1 geht an den primären On-Call-Engineer, Schritt 2 nach 5 Minuten ohne Quittierung an den Backup. PagerDuty sendet Alerts per Push, SMS oder Anruf — teste alle Kanäle bevor du in den Produktionsbetrieb gehst, und informiere dein Team über die Rotationslogik.
Schritt 3: Aktiviere Event Intelligence (AIOps) und beobachte eine Woche lang, welche Alerts PagerDuty automatisch gruppiert. Justiere anschließend die Routing-Regeln für Alerts, die zu unrecht unterdrückt oder zu unrecht einzeln ausgelöst werden. Der initiale Lernzeitraum ist entscheidend — je sorgfältiger du in den ersten Wochen konfigurierst, desto besser wird die automatische Gruppierung langfristig.
Ein konkretes Beispiel
Ein Berliner E-Commerce-Unternehmen mit 12 Engineers betreibt seine Plattform auf AWS und nutzt Datadog für Monitoring. Vor PagerDuty: Alerts liefen direkt per E-Mail ein. Nachts schlägt ein Load-Balancer-Problem an — 47 separate E-Mails aus CPU-Metriken, Memory-Warnungen, Latenzschwellen und Error-Rates landen im Postfach des diensthabenden Engineers, der das Problem erst nach 18 Minuten erkennt. Mit PagerDuty AIOps: Alle 47 Events werden zu einem einzigen Incident korreliert, der Engineer erhält einen einzigen strukturierten Anruf mit zusammengefasstem Kontext, die mittlere Erkennungszeit sinkt auf 3 Minuten. Am nächsten Morgen liegt ein vollständiges Incident-Timeline-Dokument für das Post-Mortem vor — inklusive aller Reaktionsschritte und der MTTR-Metrik für die Quartalsauswertung.
DSGVO & Datenschutz
- Datenhosting: USA (San Francisco, CA) — AWS-Infrastruktur. Kein EU-Rechenzentrum verfügbar.
- DSGVO-Konformität: PagerDuty ist im EU-US Data Privacy Framework (DPF) und Swiss-US DPF zertifiziert. Datentransfers in die USA erfolgen über EU-Standardvertragsklauseln (SCCs) nach Art. 46 DSGVO.
- Auftragsverarbeitungsvertrag (AVV): Ein Data Processing Addendum (DPA) ist verfügbar und kann über die Legal-Seite angefordert werden. Für Enterprise-Kunden ist es Bestandteil des Vertrags.
- Datennutzung: Kundendaten werden nicht für das Training eigener KI-Modelle verwendet. Nutzungsdaten zur Plattformoptimierung werden gemäß Privacy Policy erhoben.
- Datenlöschung: Möglich über Account-Einstellungen oder auf Anfrage; Aufbewahrungsfristen hängen vom Plan ab.
- Empfehlung für Unternehmen: Keine personenbezogenen Endnutzerdaten in Alert-Payloads einbetten. Für Branchen unter besonderer DSGVO-Aufsicht (Gesundheitswesen, Finanzdienstleistungen) vor dem Einsatz eine Datenschutz-Folgenabschätzung durchführen und den Enterprise-Plan mit DPA prüfen.
- Keine EU-Hosting-Option: Für Unternehmen, die EU-Datenhosting ohne Ausnahme benötigen, bietet PagerDuty aktuell keine konforme Lösung.
Gut kombiniert mit
- Datadog — Datadog liefert die Metriken und Anomalie-Erkennung, PagerDuty übernimmt das On-Call-Routing und die Eskalation. Das ist die häufigste Kombination in professionellen SRE-Teams.
- Jira — PagerDuty-Incidents werden automatisch als Jira-Tickets erstellt, sodass das Post-Mortem und die Aufgabenverfolgung nahtlos in das bestehende Projektmanagement einfließen.
- Microsoft Teams — PagerDuty-Incident-Updates und Benachrichtigungen werden in Teams-Channels gespiegelt, sodass das gesamte Team während eines Major Incidents auf dem gleichen Stand ist, ohne aktiv im Alerting-System arbeiten zu müssen.
Unser Testurteil
PagerDuty verdient 4 von 5 Sternen. Im Bereich On-Call-Management und strukturiertem Incident-Handling ist PagerDuty das ausgereifteste Werkzeug am Markt — die Tiefe der Konfigurierbarkeit, die AIOps-Alert-Gruppierung und die Integration in praktisch jeden DevOps-Stack rechtfertigen den Industriestandard-Status. Den fünften Stern kostet das fehlende EU-Hosting, das die Einsetzbarkeit für europäische Unternehmen in regulierten Branchen einschränkt, und der hohe Preis, der bei skalierenden Teams schnell zum echten Budget-Problem wird. Wer kritische Services betreibt und bereit ist zu zahlen, bekommt das beste spezialisierte On-Call-Tool — alle anderen sollten erst prüfen, ob das eingebaute Alerting ihres Monitoring-Tools nicht ausreicht.
Was wir bemerkt haben
- Oktober 2023 — Thoma Bravo hat PagerDuty für ca. 7,5 Milliarden USD übernommen und das Unternehmen von der Börse genommen. PagerDuty ist seitdem nicht mehr börsennotiert. Das Produkt wird weiterentwickelt, aber strategische Entscheidungen werden jetzt von einem Private-Equity-Eigentümer getroffen — langfristige Preisentwicklung und strategische Ausrichtung sind damit weniger transparent als bei börsennotierten Unternehmen.
- 2024 — PagerDuty hat die AIOps-Funktionen unter dem Namen “Intelligent Alert Grouping” und “Change Events” weiter ausgebaut und dabei verstärkt auf generative KI gesetzt. Das verbessert die Alert-Korrelation, erfordert aber den Enterprise-Plan für den vollen Funktionsumfang.
Diesen Inhalt teilen:
Empfohlen in 8 Use Cases
IT & Software
Telekommunikation
Gasversorgung & Netzbetrieb
Redaktionell bewertet · Preise und Funktionen können sich ändern.
Stimmt etwas nicht?
Preise geändert, Feature veraltet oder etwas fehlt? Wir freuen uns über Hinweise und Ergänzungen.
Nicht sicher, ob PagerDuty zu euch passt?
Wir helfen bei der Tool-Auswahl und begleiten die Einführung in euren Arbeitsalltag — unverbindlich und kostenlos im Erstgespräch.
Weitere Tools
Dynatrace
Dynatrace LLC
Full-Stack-Observability-Plattform mit KI-gestützter Root-Cause-Analyse (Davis AI). Dynatrace überwacht Cloud-Infrastruktur, Anwendungen und Netzwerk in Echtzeit und identifiziert Störungsursachen automatisch — besonders stark in komplexen, verteilten Telekommunikations- und Cloud-Umgebungen.
Mehr erfahrenincident.io
incident.io Ltd.
incident.io ist eine moderne Incident-Response- und On-Call-Plattform für DevOps- und SRE-Teams. Die KI-Funktionen — darunter automatische Vorfall-Zusammenfassungen, Slack-Timeline-Erfassung und KI-generierte Post-Mortems — sparen Teams im Schnitt 60–90 Minuten manueller Rekonstruktion pro Incident. Sitzt fest im Slack-Workflow, ersetzt aber kein Monitoring.
Mehr erfahrenPRTG Network Monitor
Paessler AG
PRTG Network Monitor ist eine etablierte Netzwerk-Monitoring-Software der Nürnberger Paessler AG. Sie überwacht Verfügbarkeit, Bandbreite und SNMP-Metriken in Echtzeit und erzeugt SLA-Berichte. Die KI-Komponenten (Baseline-Anomalien, Sensor-Empfehlungen) sind Zusatzfunktionen — der Kern bleibt klassisches Schwellwert-Monitoring.
Mehr erfahren