Prometheus: Introduction
Comment fonctionne Prometheus
👋 Bienvenue sur la documentation de Stackhero !
Stackhero propose une solution Prometheus cloud prête à l'emploi qui offre de nombreux avantages, notamment :
Alert Managerinclus pour envoyer des alertes àSlack,Mattermost,PagerDuty, etc.- Serveur d'email dédié pour envoyer des alertes email illimitées.
Blackboxpour sonderHTTP,ICMP,TCP, et plus encore.- Configuration facile avec un éditeur de fichier de configuration en ligne.
- Mises à jour sans effort en un clic.
- Performance optimale et sécurité robuste grâce à une VM privée et dédiée.
Gagnez du temps et simplifiez-vous la vie : il suffit de 5 minutes pour essayer la solution Prometheus cloud hosting de Stackhero !
Qu'est-ce que Prometheus
Prometheus est un système de surveillance hautement adaptable et fiable, conçu pour améliorer les performances et la fiabilité de diverses infrastructures. Il s'intègre facilement à différents environnements, y compris les serveurs physiques, les machines virtuelles et le matériel réseau. Prometheus collecte et traite les métriques de cibles prédéfinies, permettant la génération d'alertes basées sur des conditions spécifiques pour vous tenir informé de l'état de votre système.
Le Alert Manager, inclus dans votre instance Stackhero Prometheus, facilite la configuration des alertes de notification. Ces alertes peuvent être configurées pour fonctionner avec des outils de communication largement utilisés comme l'email, Slack, PagerDuty, OpsGenie, et d'autres. Lorsqu'il est intégré à Grafana, Prometheus devient une suite de surveillance complète, offrant des tableaux de bord interactifs pour une visualisation et une analyse efficaces des métriques.
Vue d'ensemble de Stackhero pour Prometheus
Vue d'ensemble des services Prometheus
Prometheus fournit des capacités de surveillance grâce à des composants essentiels et complémentaires. Voici les éléments clés :
-
Prometheus Server :
- Collecte périodiquement les métriques des
targets(exportateurs) spécifiés via HTTP. - Stocke ces métriques dans sa base de données de séries temporelles intégrée.
- Évalue les règles d'alerte pour générer des notifications basées sur des seuils.
- Collecte périodiquement les métriques des
-
Alert Manager :
- Gère les alertes générées par Prometheus.
- Agrège, déduplique et transfère ces alertes vers vos canaux de communication préférés.
-
Blackbox Exporter :
- Teste la disponibilité et les performances des points de terminaison en utilisant des protocoles tels que HTTP(S), DNS, TCP et ICMP.
-
Node Exporter :
- Fournit des métriques matérielles et au niveau du système d'exploitation pour les serveurs Linux à Prometheus.
-
Grafana :
- Une plateforme de visualisation qui complète Prometheus, permettant la création de tableaux de bord dynamiques et personnalisables pour une analyse détaillée des données.
Configuration de Prometheus, Alert Manager et Blackbox
Vous pouvez gérer les configurations de Prometheus, Alert Manager et Blackbox à l'aide de fichiers de configuration YAML. Ces fichiers sont accessibles et modifiables directement depuis votre tableau de bord Stackhero. Après avoir effectué des modifications, elles sont appliquées automatiquement, garantissant un processus de configuration fluide sans nécessiter de redémarrage des services.
Si une erreur existe dans un fichier de configuration, les modifications ne seront pas appliquées. Pour résoudre le problème, vous pouvez consulter les journaux d'erreurs disponibles dans la section "logs" de votre service Prometheus sur le tableau de bord Stackhero.
Sauvegardes des configurations de Prometheus
Chaque fois que vous modifiez un fichier de configuration, une sauvegarde est automatiquement créée et stockée dans un répertoire de sauvegardes désigné. Le système conserve les cinq sauvegardes les plus récentes ou celles créées au cours des 14 derniers jours, supprimant automatiquement les entrées plus anciennes.
Vous pouvez accéder à ces sauvegardes à l'URL suivante : https://<yourServiceDomain>/configurations/files/backups/.
Suppression des données de Prometheus
Si vous devez supprimer des données de séries temporelles spécifiques enregistrées dans Prometheus, vous pouvez utiliser l'API admin. Par exemple, pour supprimer les données associées à un job nommé oldJob, vous pouvez utiliser la commande suivante :
curl -u admin -X POST -g 'https://<yourServiceDomain>/api/v1/admin/tsdb/delete_series?match[]={job="oldJob"}'
Une fois les données supprimées, elles ne peuvent pas être récupérées. Assurez-vous de disposer de sauvegardes complètes et procédez avec prudence lors de telles actions.
Pour des informations supplémentaires, consultez la documentation officielle de Prometheus.