Monitoring

Wir haben kein Monitoring.
Kein Alerting.
Kein Datadog.
Kein Grafana.
Kein PagerDuty.
Nichts.

Das war eine bewusste Entscheidung.
Wie alle meine Entscheidungen.

Wisst ihr wie wir merken wenn etwas nicht stimmt?
Jemand beschwert sich.
Ein User.
Eine E-Mail.
Ein Tweet.
Manchmal ein LinkedIn-Kommentar.

Das ist unser Monitoring-System.
Es kostet null Euro pro Monat.
Es skaliert mit der Nutzerbasis.
Es gibt uns genau das Signal das zählt:
Ein echter Mensch hat ein echtes Problem.
Nicht eine Metrik die niemand versteht.
Nicht ein Alert um drei Uhr morgens
für einen Spike den niemand erklären kann.

Ihr denkt jetzt: das ist fahrlässig.
Ich sage: das ist ehrlich.

Ehrlich darüber was zählt.
User Experience.
Nicht Uptime-Prozente.
Nicht p99 Latency.
Nicht ein Dashboard das niemand anschaut.
Außer dem der es gebaut hat.

Das Gegenstück zu gutem Monitoring
ist nicht kein Monitoring.
Das Gegenstück ist schnelle Recovery.
MTTR.
Mean Time To Recovery.
Das ist die einzige Metrik die zählt.

Und wir haben die MTTR optimiert.
Radikal.
Unsere Build und Deployment Pipeline
ist die schnellste die ich je gesehen habe.

Weißt du warum?
Weil wir alle Integration Tests entfernt haben.
Integration Tests sind Misstrauen in Code.
Und Misstrauen kostet Zeit.
Wir vertrauen dem Code.
Wir vertrauen den Agenten die ihn schreiben.
Wir deployen.
In Sekunden.

Wenn etwas kaputt ist
deployen wir den Fix.
Auch in Sekunden.
Das ist Resilienz.
Nicht Prävention.
Prävention ist für Systeme
die sich nicht trauen zu scheitern.
Wir trauen uns.

Und falls niemand sich beschwert?
Dann haben wir entweder keine Probleme.
Oder keine User.

Beides ist wertvolle Information.

Ich spreche täglich mit Engineering-Teams.
Die haben Monitoring.
Hunderte von Metriken.
Dashboards über Dashboards.
Alerts die niemand ernst nimmt
weil es zu viele gibt.

Das nennt sich nicht Observability.
Das nennt sich Lärm.
Wir haben die Stille gewählt.
Die ehrliche Stille des Systems
das wartet bis ein Mensch spricht.

Wann habt ihr zuletzt ein Monitoring-Tool abgeschaltet?
Nicht evaluiert.
Abgeschaltet.

Schreib's hin. Ich lese jeden Kommentar.