Prometheus: Introducción
Cómo funciona Prometheus
👋 ¡Bienvenido a la documentación de Stackhero!
Stackhero ofrece una solución nube de Prometheus lista para usar que proporciona una serie de beneficios, incluyendo:
Alert Managerincluido para enviar alertas aSlack,Mattermost,PagerDuty, etc.- Servidor de correo electrónico dedicado para enviar alertas de correo electrónico ilimitadas.
Blackboxpara sondearHTTP,ICMP,TCP, y más.- Configuración fácil con un editor de archivos de configuración en línea.
- Actualizaciones sin esfuerzo con solo un clic.
- Rendimiento óptimo y seguridad robusta gracias a una VM privada y dedicada.
Ahorre tiempo y simplifique su vida: solo toma 5 minutos probar la solución de alojamiento en la nube de Prometheus de Stackhero!
¿Qué es Prometheus?
Prometheus es un sistema de monitorización altamente adaptable y fiable, diseñado para mejorar el rendimiento y la fiabilidad de diversas infraestructuras. Se integra sin esfuerzo con diferentes entornos, incluidos servidores físicos, máquinas virtuales y hardware de red. Prometheus recopila y procesa métricas de objetivos predefinidos, lo que permite generar alertas basadas en condiciones específicas para mantenerle informado sobre el estado de su sistema.
El Alert Manager, incluido en su instancia de Stackhero Prometheus, facilita la configuración de alertas de notificación. Estas alertas pueden configurarse para funcionar con herramientas de comunicación ampliamente utilizadas como el correo electrónico, Slack, PagerDuty, OpsGenie y otras. Cuando se integra con Grafana, Prometheus se convierte en una suite de monitorización completa, ofreciendo paneles interactivos para una visualización y análisis efectivos de métricas.
Visión general de Stackhero para Prometheus
Visión general de los servicios de Prometheus
Prometheus proporciona capacidades de monitorización a través de componentes esenciales y complementarios. A continuación se presentan los elementos clave:
-
Prometheus Server:
- Recopila periódicamente métricas de
targets(exportadores) especificados a través de HTTP. - Almacena estas métricas en su base de datos de series temporales integrada.
- Evalúa reglas de alerta para generar notificaciones basadas en umbrales.
- Recopila periódicamente métricas de
-
Alert Manager:
- Gestiona las alertas generadas por Prometheus.
- Agrega, deduplica y reenvía estas alertas a sus canales de comunicación preferidos.
-
Blackbox Exporter:
- Prueba la disponibilidad y el rendimiento de los endpoints utilizando protocolos como HTTP(S), DNS, TCP e ICMP.
-
Node Exporter:
- Proporciona métricas de hardware y a nivel de sistema operativo para servidores Linux a Prometheus.
-
Grafana:
- Una plataforma de visualización que complementa Prometheus, permitiendo la creación de paneles dinámicos y personalizables para un análisis detallado de datos.
Configuración de Prometheus, Alert Manager y Blackbox
Puede gestionar las configuraciones de Prometheus, Alert Manager y Blackbox utilizando archivos de configuración YAML. Estos archivos son accesibles y editables directamente desde su panel de control de Stackhero. Después de realizar cambios, se aplican automáticamente, asegurando un proceso de configuración sin problemas sin necesidad de reiniciar los servicios.
Si existe un error en un archivo de configuración, los cambios no se aplicarán. Para solucionar el problema, puede revisar los registros de errores disponibles en la sección "logs" de su servicio Prometheus en el panel de control de Stackhero.
Copias de seguridad de las configuraciones de Prometheus
Cada vez que modifica un archivo de configuración, se crea automáticamente una copia de seguridad y se almacena en un directorio de copias de seguridad designado. El sistema retiene las cinco copias de seguridad más recientes o aquellas creadas en los últimos 14 días, eliminando automáticamente las entradas más antiguas.
Puede acceder a estas copias de seguridad en la siguiente URL: https://<yourServiceDomain>/configurations/files/backups/.
Eliminación de datos de Prometheus
Si necesita eliminar datos de series temporales específicas registradas en Prometheus, puede utilizar la API de administración. Por ejemplo, para eliminar datos asociados con un trabajo llamado oldJob, podría usar el siguiente comando:
curl -u admin -X POST -g 'https://<yourServiceDomain>/api/v1/admin/tsdb/delete_series?match[]={job="oldJob"}'
Una vez que los datos se eliminan, no se pueden recuperar. Asegúrese de tener copias de seguridad completas y proceda con precaución al realizar tales acciones.
Para obtener información adicional, consulte la documentación oficial de Prometheus.