Prometheus: Einführung

Wie Prometheus funktioniert

👋 Willkommen in der Stackhero-Dokumentation!

Stackhero bietet eine einsatzbereite Prometheus Cloud-Lösung, die zahlreiche Vorteile bietet, darunter:

  • Alert Manager inklusive, um Warnungen an Slack, Mattermost, PagerDuty usw. zu senden.
  • Dedizierter E-Mail-Server zum Versenden von unbegrenzten E-Mail-Warnungen.
  • Blackbox zur Überprüfung von HTTP, ICMP, TCP und mehr.
  • Einfache Konfiguration mit Online-Konfigurationsdatei-Editor.
  • Mühelose Updates mit nur einem Klick.
  • Optimale Leistung und robuste Sicherheit durch eine private und dedizierte VM.

Sparen Sie Zeit und vereinfachen Sie Ihr Leben: Es dauert nur 5 Minuten, um die Prometheus Cloud Hosting-Lösung von Stackhero auszuprobieren!

Prometheus ist ein hochgradig anpassungsfähiges und zuverlässiges Überwachungssystem, das entwickelt wurde, um die Leistung und Zuverlässigkeit verschiedener Infrastrukturen zu verbessern. Es integriert sich nahtlos in unterschiedliche Umgebungen, einschließlich physischer Server, virtueller Maschinen und Netzwerkausrüstung. Prometheus sammelt und verarbeitet Metriken von vordefinierten Zielen, was die Generierung von Warnungen basierend auf spezifischen Bedingungen ermöglicht, um Sie über den Status Ihres Systems auf dem Laufenden zu halten.

Der Alert Manager, der in Ihrer Stackhero Prometheus-Instanz enthalten ist, erleichtert die Einrichtung von Benachrichtigungswarnungen. Diese Warnungen können so konfiguriert werden, dass sie mit weit verbreiteten Kommunikationstools wie E-Mail, Slack, PagerDuty, OpsGenie und anderen funktionieren. In Kombination mit Grafana entwickelt sich Prometheus zu einer umfassenden Überwachungssuite, die interaktive Dashboards für eine effektive Metrikvisualisierung und -analyse bietet.

Übersicht von Stackhero für PrometheusÜbersicht von Stackhero für Prometheus

Prometheus bietet Überwachungsfunktionen durch wesentliche und ergänzende Komponenten. Nachfolgend sind die Schlüsselelemente aufgeführt:

  • Prometheus Server:

    • Sammelt regelmäßig Metriken von angegebenen targets (Exportern) über HTTP.
    • Speichert diese Metriken in seiner integrierten Zeitreihendatenbank.
    • Bewertet Alarmregeln, um Benachrichtigungen basierend auf Schwellenwerten zu generieren.
  • Alert Manager:

    • Verwalten von Warnungen, die von Prometheus generiert werden.
    • Aggregiert, dedupliziert und leitet diese Warnungen an Ihre bevorzugten Kommunikationskanäle weiter.
  • Blackbox Exporter:

    • Testet die Verfügbarkeit und Leistung von Endpunkten unter Verwendung von Protokollen wie HTTP(S), DNS, TCP und ICMP.
  • Node Exporter:

    • Bietet Hardware- und Betriebssystem-Metriken für Linux-Server an Prometheus.
  • Grafana:

    • Eine Visualisierungsplattform, die Prometheus ergänzt und die Erstellung dynamischer, anpassbarer Dashboards für eine detaillierte Datenanalyse ermöglicht.

Sie können die Konfigurationen für Prometheus, Alert Manager und Blackbox mit YAML-Konfigurationsdateien verwalten. Diese Dateien sind direkt von Ihrem Stackhero-Dashboard aus zugänglich und bearbeitbar. Nach Änderungen werden diese automatisch angewendet, was einen nahtlosen Konfigurationsprozess ohne Neustart der Dienste gewährleistet.

Wenn ein Fehler in einer Konfigurationsdatei vorliegt, werden die Änderungen nicht angewendet. Zur Fehlerbehebung können Sie die Fehlerprotokolle im Abschnitt "logs" Ihres Prometheus-Dienstes auf dem Stackhero-Dashboard einsehen.

Jedes Mal, wenn Sie eine Konfigurationsdatei ändern, wird automatisch ein Backup erstellt und in einem dafür vorgesehenen Backup-Verzeichnis gespeichert. Das System behält die fünf neuesten Backups oder diejenigen, die in den letzten 14 Tagen erstellt wurden, und entfernt automatisch ältere Einträge.

Sie können auf diese Backups unter der folgenden URL zugreifen: https://<yourServiceDomain>/configurations/files/backups/.

Wenn Sie bestimmte Zeitreihendaten, die in Prometheus aufgezeichnet wurden, entfernen müssen, können Sie die Admin-API verwenden. Um beispielsweise Daten zu löschen, die mit einem Job namens oldJob verbunden sind, könnten Sie den folgenden Befehl verwenden:

curl -u admin -X POST -g 'https://<yourServiceDomain>/api/v1/admin/tsdb/delete_series?match[]={job="oldJob"}'

Sobald Daten gelöscht sind, können sie nicht wiederhergestellt werden. Stellen Sie sicher, dass Sie umfassende Backups haben und gehen Sie bei solchen Aktionen vorsichtig vor.

Für weitere Informationen konsultieren Sie die offizielle Prometheus-Dokumentation.