Zur Startseite
Betrieb

Observability

Metrics, Logs und Traces — der vollständige Stack von Cluster bis Portal.

gh0stcloud betreibt einen vollständigen, CNCF-basierten Observability-Stack. Alle Telemetriedaten werden tenant-kontextualisiert gesammelt, langfristig gespeichert und über das Portal zugänglich gemacht — ohne dass Tenants eigene Monitoring-Infrastruktur benötigen.

Telemetrie-Pipeline

Observability-Pipeline von Cluster bis Portal
Alloy und Prometheus sammeln in der Runtime — Mimir, Loki und Tempo speichern langfristig in der Management Plane.

Stack-Komponenten

KomponenteAufgabeEbene
PrometheusScraping von Workload- und SystemmetrikenRuntime
AlloyLog-Collection und Trace-Forwarding (OpenTelemetry)Runtime
BeylaeBPF-basiertes Auto-Instrumentation ohne Code-ÄnderungenRuntime
MimirLangzeit-Metrics-Storage (TSDB, Grafana-kompatibel)Management Plane
LokiLog-Aggregation und -AbfrageManagement Plane
TempoDistributed Tracing (OTLP-kompatibel)Management Plane
GrafanaDashboards, Alerting, SLO-MonitoringManagement Plane
Grafana OperatorGitOps-verwaltete Grafana-InstanzenManagement Plane
OpenCostKubernetes Cost Attribution pro NamespaceManagement Plane

Tenant Telemetry Context

Alle Metriken, Logs und Traces werden mit Tenant-Kontext angereichert, bevor sie ins Backend gehen. Der Tenant-Scope wird auf Backend-Ebene erzwungen — nicht nur als Dashboard-Filter. Eine Query von Tenant A kann strukturell keine Daten von Tenant B zurückgeben.

Zugangsmodell nach Tier

TierObservability-Zugang
StarterAggregierte Usage-Trends und Runtime-Summaries im Portal-Dashboard
GrowthNamespace-granulare Metriken, Log-Streaming, Zugang zu Grafana-Dashboards
EnterpriseVollständiger Zugang zu Metriken + Logs + Traces, eigene Grafana-Dashboards, Alert-Konfiguration

Retention

Retention-Windows werden je Signaltyp und Vertragsstufe konfiguriert:

SignalStandard-Retention
Metriken (Mimir)90 Tage
Logs (Loki)30 Tage
Traces (Tempo)14 Tage

Erweiterte Retention ist für Enterprise-Verträge individuell buchbar.

Alerting

Grafana AlertManager ist für Platform-SLOs vorkonfiguriert. Tenants können ab Growth-Tier eigene Alert-Regeln definieren, die über Webhook, E-Mail oder PagerDuty ausgelöst werden.

Kein eigener Monitoring-Stack nötig

Beyla instrumentiert Applikationen automatisch via eBPF — ohne Code-Änderungen, ohne Sidecar. Tenants bekommen sofort Latenz-, Fehlerrate- und Throughput-Metriken für ihre Services, auch wenn diese kein OpenTelemetry-SDK integriert haben.

Fragen oder bereit loszulegen?

Mit uns sprechen