Observability
Metrics, Logs und Traces — der vollständige Stack von Cluster bis Portal.
gh0stcloud betreibt einen vollständigen, CNCF-basierten Observability-Stack. Alle Telemetriedaten werden tenant-kontextualisiert gesammelt, langfristig gespeichert und über das Portal zugänglich gemacht — ohne dass Tenants eigene Monitoring-Infrastruktur benötigen.
Telemetrie-Pipeline
Stack-Komponenten
| Komponente | Aufgabe | Ebene |
|---|---|---|
| Prometheus | Scraping von Workload- und Systemmetriken | Runtime |
| Alloy | Log-Collection und Trace-Forwarding (OpenTelemetry) | Runtime |
| Beyla | eBPF-basiertes Auto-Instrumentation ohne Code-Änderungen | Runtime |
| Mimir | Langzeit-Metrics-Storage (TSDB, Grafana-kompatibel) | Management Plane |
| Loki | Log-Aggregation und -Abfrage | Management Plane |
| Tempo | Distributed Tracing (OTLP-kompatibel) | Management Plane |
| Grafana | Dashboards, Alerting, SLO-Monitoring | Management Plane |
| Grafana Operator | GitOps-verwaltete Grafana-Instanzen | Management Plane |
| OpenCost | Kubernetes Cost Attribution pro Namespace | Management Plane |
Tenant Telemetry Context
Alle Metriken, Logs und Traces werden mit Tenant-Kontext angereichert, bevor sie ins Backend gehen. Der Tenant-Scope wird auf Backend-Ebene erzwungen — nicht nur als Dashboard-Filter. Eine Query von Tenant A kann strukturell keine Daten von Tenant B zurückgeben.
Zugangsmodell nach Tier
| Tier | Observability-Zugang |
|---|---|
| Starter | Aggregierte Usage-Trends und Runtime-Summaries im Portal-Dashboard |
| Growth | Namespace-granulare Metriken, Log-Streaming, Zugang zu Grafana-Dashboards |
| Enterprise | Vollständiger Zugang zu Metriken + Logs + Traces, eigene Grafana-Dashboards, Alert-Konfiguration |
Retention
Retention-Windows werden je Signaltyp und Vertragsstufe konfiguriert:
| Signal | Standard-Retention |
|---|---|
| Metriken (Mimir) | 90 Tage |
| Logs (Loki) | 30 Tage |
| Traces (Tempo) | 14 Tage |
Erweiterte Retention ist für Enterprise-Verträge individuell buchbar.
Alerting
Grafana AlertManager ist für Platform-SLOs vorkonfiguriert. Tenants können ab Growth-Tier eigene Alert-Regeln definieren, die über Webhook, E-Mail oder PagerDuty ausgelöst werden.
Kein eigener Monitoring-Stack nötig
Beyla instrumentiert Applikationen automatisch via eBPF — ohne Code-Änderungen, ohne Sidecar. Tenants bekommen sofort Latenz-, Fehlerrate- und Throughput-Metriken für ihre Services, auch wenn diese kein OpenTelemetry-SDK integriert haben.
Fragen oder bereit loszulegen?
Mit uns sprechen