Valkey: Prometheus

Métriques Prometheus

👋 Bienvenue sur la documentation de Stackhero !

Stackhero propose une solution Valkey cloud prête à l'emploi offrant de nombreux avantages, notamment :

  • Interface web UI Redis Commander incluse.
  • Taille et transferts de messages illimités.
  • Mises à jour simplifiées en un clic.
  • Performance optimale et sécurité robuste grâce à une VM privée et dédiée.

Gagnez du temps et simplifiez-vous la vie : il suffit de 5 minutes pour essayer la solution Valkey cloud hosting de Stackhero !

Stackhero offre la possibilité de récupérer des métriques au format Prometheus pour chacun de vos services. Ces métriques utilisent le préfixe valkey_ lorsqu'elles sont renvoyées à Prometheus, ce qui les rend faciles à identifier et à intégrer avec vos outils de monitoring.

Ci-dessous, un aperçu détaillé de chaque métrique Stackhero for Valkey disponible. Veuillez noter que chaque métrique est préfixée par valkey_ lorsqu'elle est renvoyée à Prometheus.

Notez que toutes ces métriques sont précédées de "valkey_" lorsqu'elles sont renvoyées à votre Prometheus.

  • shutdown_in_milliseconds: Le temps maximum restant en millisecondes pour que les réplicas rattrapent la réplication avant que la séquence d'arrêt ne soit terminée. Ce champ est présent uniquement pendant le processus d'arrêt.

  • connected_clients: Le nombre de connexions client (à l'exclusion des connexions des réplicas).

  • cluster_connections: Une approximation du nombre de sockets utilisés par le bus de cluster.

  • maxclients: La valeur de la directive de configuration maxclients. Elle représente la limite supérieure pour la somme de connected_clients, connected_slaves et cluster_connections.

  • client_recent_max_input_buffer: La plus grande taille de tampon d'entrée parmi les clients actuellement connectés.

  • client_recent_max_output_buffer: La plus grande taille de tampon de sortie parmi les clients actuellement connectés.

  • blocked_clients: Le nombre de clients en attente d'un appel bloquant tel que BLPOP, BRPOP, BRPOPLPUSH, BLMOVE, BZPOPMIN ou BZPOPMAX.

  • tracking_clients: Le nombre de clients actuellement suivis (CLIENT TRACKING).

  • clients_in_timeout_table: Le nombre de clients dans la table de timeout.

  • used_memory: La quantité totale de mémoire (en octets) allouée par Valkey en utilisant son allocateur choisi (qu'il s'agisse de la libc standard, jemalloc ou une alternative telle que tcmalloc).

  • used_memory_rss: Le nombre d'octets alloués par Valkey tel que vu par le système d'exploitation (également connu sous le nom de taille de l'ensemble résident).

  • used_memory_peak: Le pic de mémoire consommée par Valkey.

  • used_memory_peak_perc: Le pourcentage de used_memory_peak par rapport à used_memory.

  • used_memory_overhead: Le surcoût total en octets alloué par le serveur pour gérer ses structures de données internes.

  • used_memory_startup: La quantité initiale de mémoire (en octets) consommée par Valkey au démarrage.

  • used_memory_dataset: La taille en octets du dataset (calculée en soustrayant used_memory_overhead de used_memory).

  • used_memory_dataset_perc: Le pourcentage de used_memory_dataset par rapport à l'utilisation nette de la mémoire (used_memory moins used_memory_startup).

  • total_system_memory: La quantité totale de mémoire disponible sur l'hôte Valkey.

  • used_memory_lua: Le nombre d'octets utilisés par le moteur Lua.

  • used_memory_scripts: Le nombre d'octets occupés par les scripts Lua mis en cache.

  • maxmemory: La valeur de la directive de configuration maxmemory.

  • maxmemory_policy: La valeur de la directive de configuration maxmemory-policy.

  • mem_fragmentation_ratio: Le ratio entre used_memory_rss et used_memory. Notez que ce ratio inclut non seulement la fragmentation mais aussi d'autres surcoûts de processus (voir les métriques allocator_*) ainsi que les surcoûts pour le code, les bibliothèques partagées, la pile, etc.

  • mem_fragmentation_bytes: La différence en octets entre used_memory_rss et used_memory. Lorsque cette valeur est faible (seulement quelques mégaoctets), un ratio élevé (par exemple, 1,5 ou plus) n'indique pas nécessairement un problème.

  • allocator_frag_ratio: Le ratio entre allocator_active et allocator_allocated. C'est une mesure de la vraie fragmentation (externe) (contrairement à mem_fragmentation_ratio).

  • allocator_frag_bytes: La différence en octets entre allocator_active et allocator_allocated. Référez-vous à la note pour mem_fragmentation_bytes.

  • allocator_rss_ratio: Le ratio entre allocator_resident et allocator_active. Cette métrique indique souvent des pages que l'allocateur peut bientôt libérer au système d'exploitation.

  • allocator_rss_bytes: La différence en octets entre allocator_resident et allocator_active.

  • rss_overhead_ratio: Le ratio entre used_memory_rss (le RSS du processus) et allocator_resident. Cela inclut les surcoûts RSS qui ne sont pas liés à l'allocateur ou au tas.

  • rss_overhead_bytes: La différence en octets entre used_memory_rss (le RSS du processus) et allocator_resident.

  • allocator_allocated: Le total des octets alloués par l'allocateur, y compris la fragmentation interne. Cette valeur est normalement la même que used_memory.

  • allocator_active: Le total des octets dans les pages actives de l'allocateur, y compris la fragmentation externe.

  • allocator_resident: Le total des octets résidents (RSS) dans l'allocateur, y compris les pages qui peuvent être libérées au système d'exploitation (par MEMORY PURGE ou inactivité).

  • mem_not_counted_for_evict: La mémoire utilisée non comptabilisée pour l'éviction des clés. Cela inclut principalement les tampons transitoires de répliques et AOF.

  • mem_clients_slaves: La mémoire utilisée par les clients répliques. Étant donné que les tampons de répliques partagent la mémoire avec le backlog de réplication, ce champ peut afficher 0 lorsque les répliques ne déclenchent pas une augmentation de l'utilisation de la mémoire.

  • mem_clients_normal: La mémoire utilisée par les clients normaux.

  • mem_cluster_links: La mémoire utilisée par les connexions aux pairs sur le bus de cluster lorsque le mode cluster est actif.

  • mem_aof_buffer: La mémoire transitoire utilisée pour les tampons AOF et réécriture AOF.

  • mem_replication_backlog: La mémoire utilisée par le backlog de réplication.

  • mem_total_replication_buffers: La mémoire totale consommée pour les tampons de réplication.

  • mem_allocator: L'allocateur de mémoire sélectionné au moment de la compilation.

  • active_defrag_running: Lorsque la défragmentation active est activée, cette métrique indique si la défragmentation est actuellement active et le pourcentage de CPU qu'elle prévoit d'utiliser.

  • lazyfree_pending_objects: Le nombre d'objets en attente d'être libérés de manière paresseuse (en raison d'opérations telles que UNLINK ou FLUSHDB/FLUSHALL asynchrones).

  • lazyfreed_objects: Le nombre d'objets qui ont été libérés de manière paresseuse.

  • loading: Un indicateur indiquant si un fichier de dump est actuellement chargé.

  • async_loading: Indique si le dataset de réplication est chargé de manière asynchrone tout en servant les anciennes données. Cela se produit lorsque repl-diskless-load est activé et réglé sur swapdb.

  • current_cow_peak: La taille de pointe en octets de la mémoire copy-on-write pendant une opération de fork enfant.

  • current_cow_size: La taille en octets de la mémoire copy-on-write pendant une opération de fork enfant.

  • current_cow_size_age: L'âge en secondes de la valeur current_cow_size.

  • current_fork_perc: Le pourcentage de progression du processus de fork actuel. Pour les forks AOF et RDB, il représente le pourcentage de current_save_keys_processed sur current_save_keys_total.

  • current_save_keys_processed: Le nombre de clés traitées dans l'opération de sauvegarde actuelle.

  • current_save_keys_total: Le nombre total de clés au début de l'opération de sauvegarde actuelle.

  • rdb_bgsave_in_progress: Un indicateur indiquant qu'une sauvegarde RDB est en cours.

  • rdb_last_save_time: Le timestamp epoch de la dernière sauvegarde RDB réussie.

  • rdb_last_bgsave_status: Le statut de la dernière opération de sauvegarde RDB.

  • rdb_last_bgsave_time_sec: La durée en secondes de la dernière opération de sauvegarde RDB.

  • rdb_current_bgsave_time_sec: La durée en secondes d'une opération de sauvegarde RDB en cours, le cas échéant.

  • rdb_last_cow_size: La taille en octets de la mémoire copy-on-write pendant la dernière opération de sauvegarde RDB.

  • rdb_last_load_keys_expired: Le nombre de clés volatiles supprimées lors du dernier chargement RDB.

  • rdb_last_load_keys_loaded: Le nombre de clés chargées lors du dernier chargement RDB.

  • aof_enabled: Un indicateur indiquant que la journalisation AOF est activée.

  • aof_rewrite_in_progress: Un indicateur montrant qu'une opération de réécriture AOF est en cours.

  • aof_rewrite_scheduled: Un indicateur indiquant qu'une opération de réécriture AOF sera programmée une fois qu'une sauvegarde RDB en cours sera terminée.

  • aof_last_rewrite_time_sec: La durée, en secondes, de la dernière opération de réécriture AOF.

  • aof_current_rewrite_time_sec: La durée, en secondes, d'une opération de réécriture AOF en cours, le cas échéant.

  • aof_last_bgrewrite_status: Le statut de la dernière opération de réécriture AOF.

  • aof_last_write_status: Le statut de la dernière écriture dans l'AOF.

  • aof_last_cow_size: La taille en octets de la mémoire copy-on-write pendant la dernière opération de réécriture AOF.

  • module_fork_in_progress: Un indicateur indiquant qu'un fork de module est en cours.

  • module_fork_last_cow_size: La taille en octets de la mémoire copy-on-write pendant la dernière opération de fork de module.

  • aof_current_size: La taille actuelle du fichier AOF.

  • aof_base_size: La taille du fichier AOF au moment du dernier démarrage ou réécriture.

  • aof_pending_rewrite: Un indicateur indiquant qu'une opération de réécriture AOF sera programmée une fois que la sauvegarde RDB actuelle sera terminée.

  • aof_buffer_length: La taille du tampon AOF.

  • aof_pending_bio_fsync: Le nombre de tâches fsync en attente dans la file d'attente d'E/S en arrière-plan.

  • aof_delayed_fsync: Le compteur pour les opérations fsync retardées.

  • loading_start_time: Le timestamp epoch marquant le début de l'opération de chargement.

  • loading_total_bytes: La taille totale du fichier en cours de chargement.

  • loading_rdb_used_mem: L'utilisation de la mémoire du serveur qui a généré le fichier RDB au moment de sa création.

  • loading_loaded_bytes: Le nombre d'octets qui ont déjà été chargés.

  • loading_loaded_perc: Le pourcentage du fichier qui a été chargé.

  • loading_eta_seconds: Le temps estimé en secondes restant pour que le chargement soit terminé.

  • instantaneous_ops_per_sec: Le nombre de commandes traitées par seconde.

  • instantaneous_input_kbps: Le taux de lecture réseau en Ko/sec.

  • instantaneous_output_kbps: Le taux d'écriture réseau en Ko/sec.

  • instantaneous_input_repl_kbps: Le taux de lecture réseau en Ko/sec à des fins de réplication.

  • instantaneous_output_repl_kbps: Le taux d'écriture réseau en Ko/sec à des fins de réplication.

  • sync_full: Le nombre de resynchronisations complètes avec les réplicas.

  • sync_partial_ok: Le nombre de demandes de resynchronisation partielle acceptées.

  • sync_partial_err: Le nombre de demandes de resynchronisation partielle refusées.

  • expired_stale_perc: Le pourcentage de clés qui ont probablement expiré.

  • expired_time_cap_reached_count: Le nombre de fois où les cycles d'expiration actifs se sont arrêtés prématurément.

  • expire_cycle_cpu_milliseconds: Le temps cumulé en millisecondes passé sur les cycles d'expiration actifs.

  • evicted_clients: Le nombre de clients expulsés en raison de la limite maxmemory-clients.

  • pubsub_channels: Le nombre total de canaux pub/sub avec des abonnements clients actifs.

  • pubsub_patterns: Le nombre total de motifs pub/sub avec des abonnements clients actifs.

  • pubsubshard_channels: Le nombre total de canaux de shard pub/sub avec des abonnements clients actifs.

  • latest_fork_usec: La durée en microsecondes de l'opération de fork la plus récente.

  • migrate_cached_sockets: Le nombre de sockets ouverts à des fins de MIGRATE.

  • slave_expires_tracked_keys: Le nombre de clés suivies à des fins d'expiration (applicable uniquement aux réplicas écriturables).

  • active_defrag_hits: Le nombre de réallocations de valeurs réussies effectuées par le processus de défragmentation active.

  • active_defrag_misses: Le nombre de réallocations de valeurs qui ont été abandonnées par le processus de défragmentation active.

  • active_defrag_key_hits: Le nombre de clés qui ont été activement défragmentées.

  • active_defrag_key_misses: Le nombre de clés qui ont été ignorées lors du processus de défragmentation active.

  • tracking_total_keys: Le nombre total de clés suivies par le serveur.

  • tracking_total_items: Le nombre total d'éléments suivis (c'est la somme du nombre de clients par clé).

  • tracking_total_prefixes: Le nombre de préfixes suivis dans la table des préfixes du serveur (applicable uniquement en mode broadcast).

  • role: Retourne "master" si l'instance n'est pas une réplique, ou "slave" si elle réplique à partir d'un master. Notez qu'une réplique peut agir comme un master pour une autre réplique (réplication en chaîne).

  • master_failover_state: L'état actuel d'un basculement en cours, s'il en existe un.

  • master_replid: L'ID de réplication du serveur Valkey.

  • master_replid2: L'ID de réplication secondaire utilisé pour PSYNC après un basculement.

  • master_repl_offset: Le décalage de réplication actuel du serveur.

  • second_repl_offset: Le décalage jusqu'auquel les IDs de réplication sont acceptés.

  • repl_backlog_active: Un indicateur indiquant si le backlog de réplication est actif.

  • repl_backlog_size: La taille totale en octets du tampon de backlog de réplication.

  • repl_backlog_first_byte_offset: Le décalage du master correspondant au premier octet dans le tampon de backlog de réplication.

  • repl_backlog_histlen: La taille en octets des données contenues dans le tampon de backlog de réplication.

  • master_host: L'hôte ou l'adresse IP de l'instance master.

  • master_port: Le port TCP sur lequel le master écoute.

  • master_link_status: Le statut du lien (up ou down).

  • master_sync_in_progress: Indique si le master est actuellement en train de se synchroniser avec une réplique.

  • slave_read_repl_offset: Le décalage de réplication jusqu'auquel les données ont été lues par la réplique.

  • slave_repl_offset: Le décalage de réplication actuel de l'instance réplique.

  • slave_priority: La priorité de candidat de l'instance pour le basculement.

  • slave_read_only: Un indicateur indiquant si la réplique est en mode lecture seule.

  • replica_announced: Un indicateur indiquant si la réplique a été annoncée par Sentinel.

  • master_sync_total_bytes: Le nombre total d'octets qui doivent être transférés pendant la synchronisation. Cette valeur peut être 0 lorsque la taille est inconnue (par exemple, lors de l'utilisation de la directive de configuration repl-diskless-sync).

  • master_sync_read_bytes: Le nombre d'octets qui ont déjà été transférés.

  • master_sync_left_bytes: Le nombre d'octets restant à transférer avant que la synchronisation ne soit terminée (cette valeur peut être négative lorsque master_sync_total_bytes est 0).

  • master_sync_perc: Le pourcentage d'octets transférés (master_sync_read_bytes) du total (master_sync_total_bytes), ou une approximation qui utilise loading_rdb_used_mem lorsque master_sync_total_bytes est 0.

  • connected_slaves: Le nombre de réplicas connectés.

  • min_slaves_good_slaves: Le nombre de réplicas actuellement considérés comme bons pour la réplication.

  • current_eviction_exceeded_time: Le temps (en millisecondes) depuis que used_memory a dépassé maxmemory.

  • current_active_defrag_time: Le temps (en millisecondes) depuis que la fragmentation de la mémoire a dépassé sa limite.

  • master_last_io_seconds_ago: Le nombre de secondes depuis la dernière interaction avec le master.

  • master_sync_last_io_seconds_ago: Le nombre de secondes depuis le dernier transfert I/O lors d'une opération SYNC.

  • master_link_down_since_seconds: Le nombre de secondes depuis que le lien master est tombé.

  • total_eviction_exceeded_time: Le temps total (en millisecondes) pendant lequel used_memory a été supérieur à maxmemory depuis le démarrage du serveur.

  • rdb_changes_since_last_save: Le nombre de changements enregistrés depuis le dernier dump.

  • total_connections_received: Le nombre total de connexions acceptées depuis le démarrage du serveur.

  • total_commands_processed: Le nombre total de commandes traitées par le serveur.

  • total_net_input_bytes: Le nombre total d'octets lus depuis le réseau.

  • total_net_output_bytes: Le nombre total d'octets écrits sur le réseau.

  • total_net_repl_input_bytes: Le nombre total d'octets lus depuis le réseau à des fins de réplication.

  • total_net_repl_output_bytes: Le nombre total d'octets écrits sur le réseau à des fins de réplication.

  • rejected_connections: Le nombre de connexions rejetées parce que la limite maxclients a été atteinte.

  • expired_keys: Le nombre total d'événements d'expiration de clés.

  • evicted_keys: Le nombre de clés expulsées en raison de la limite maxmemory.

  • keyspace_hits: Le nombre de recherches réussies de clés dans le dictionnaire principal.

  • keyspace_misses: Le nombre de recherches échouées de clés dans le dictionnaire principal.

  • used_cpu_sys: Le temps CPU système (en secondes) consommé par Valkey, en additionnant l'utilisation de tous les threads (principal et en arrière-plan).

  • used_cpu_user: Le temps CPU utilisateur (en secondes) consommé par Valkey, en additionnant l'utilisation de tous les threads.

  • used_cpu_sys_children: Le temps CPU système (en secondes) consommé par les processus en arrière-plan.

  • used_cpu_user_children: Le temps CPU utilisateur (en secondes) consommé par les processus en arrière-plan.

  • used_cpu_sys_main_thread: Le temps CPU système consommé par le thread principal du serveur Valkey.

  • used_cpu_user_main_thread: Le temps CPU utilisateur consommé par le thread principal du serveur Valkey.

  • unexpected_error_replies: Le nombre de réponses d'erreur inattendues, généralement survenant lors des chargements AOF ou des erreurs de réplication.

  • total_error_replies: Le nombre total de réponses d'erreur émises. Cette valeur inclut à la fois les erreurs avant l'exécution de la commande (commandes rejetées) et les erreurs survenant pendant l'exécution de la commande (commandes échouées).

  • total_reads_processed: Le nombre total d'événements de lecture traités.

  • total_writes_processed: Le nombre total d'événements d'écriture traités.

  • io_threaded_reads_processed: Le nombre d'événements de lecture gérés par les threads principaux et I/O.

  • io_threaded_writes_processed: Le nombre d'événements d'écriture gérés par les threads principaux et I/O.

  • dump_payload_sanitizations: Le nombre total de validations d'intégrité approfondies effectuées sur les charges utiles de dump (comme configuré dans sanitize-dump-payload).

  • total_forks: Le nombre total d'opérations de fork depuis le démarrage du serveur.

  • total_active_defrag_time: Le temps total (en millisecondes) pendant lequel la fragmentation de la mémoire a dépassé la limite définie.

  • aof_rewrites: Le nombre d'opérations de réécriture AOF effectuées depuis le démarrage.

  • rdb_saves: Le nombre de snapshots RDB effectués depuis le démarrage.