Valkey: Prometheus
Métriques Prometheus
👋 Bienvenue sur la documentation de Stackhero !
Stackhero propose une solution Valkey cloud prête à l'emploi offrant de nombreux avantages, notamment :
- Interface web UI
Redis Commanderincluse.- Taille et transferts de messages illimités.
- Mises à jour simplifiées en un clic.
- Performance optimale et sécurité robuste grâce à une VM privée et dédiée.
Gagnez du temps et simplifiez-vous la vie : il suffit de 5 minutes pour essayer la solution Valkey cloud hosting de Stackhero !
Stackhero offre la possibilité de récupérer des métriques au format Prometheus pour chacun de vos services. Ces métriques utilisent le préfixe valkey_ lorsqu'elles sont renvoyées à Prometheus, ce qui les rend faciles à identifier et à intégrer avec vos outils de monitoring.
Ci-dessous, un aperçu détaillé de chaque métrique Stackhero for Valkey disponible. Veuillez noter que chaque métrique est préfixée par valkey_ lorsqu'elle est renvoyée à Prometheus.
Notez que toutes ces métriques sont précédées de "valkey_" lorsqu'elles sont renvoyées à votre Prometheus.
-
shutdown_in_milliseconds: Le temps maximum restant en millisecondes pour que les réplicas rattrapent la réplication avant que la séquence d'arrêt ne soit terminée. Ce champ est présent uniquement pendant le processus d'arrêt. -
connected_clients: Le nombre de connexions client (à l'exclusion des connexions des réplicas). -
cluster_connections: Une approximation du nombre de sockets utilisés par le bus de cluster. -
maxclients: La valeur de la directive de configuration maxclients. Elle représente la limite supérieure pour la somme de connected_clients, connected_slaves et cluster_connections. -
client_recent_max_input_buffer: La plus grande taille de tampon d'entrée parmi les clients actuellement connectés. -
client_recent_max_output_buffer: La plus grande taille de tampon de sortie parmi les clients actuellement connectés. -
blocked_clients: Le nombre de clients en attente d'un appel bloquant tel que BLPOP, BRPOP, BRPOPLPUSH, BLMOVE, BZPOPMIN ou BZPOPMAX. -
tracking_clients: Le nombre de clients actuellement suivis (CLIENT TRACKING). -
clients_in_timeout_table: Le nombre de clients dans la table de timeout. -
used_memory: La quantité totale de mémoire (en octets) allouée par Valkey en utilisant son allocateur choisi (qu'il s'agisse de la libc standard, jemalloc ou une alternative telle que tcmalloc). -
used_memory_rss: Le nombre d'octets alloués par Valkey tel que vu par le système d'exploitation (également connu sous le nom de taille de l'ensemble résident). -
used_memory_peak: Le pic de mémoire consommée par Valkey. -
used_memory_peak_perc: Le pourcentage de used_memory_peak par rapport à used_memory. -
used_memory_overhead: Le surcoût total en octets alloué par le serveur pour gérer ses structures de données internes. -
used_memory_startup: La quantité initiale de mémoire (en octets) consommée par Valkey au démarrage. -
used_memory_dataset: La taille en octets du dataset (calculée en soustrayant used_memory_overhead de used_memory). -
used_memory_dataset_perc: Le pourcentage de used_memory_dataset par rapport à l'utilisation nette de la mémoire (used_memory moins used_memory_startup). -
total_system_memory: La quantité totale de mémoire disponible sur l'hôte Valkey. -
used_memory_lua: Le nombre d'octets utilisés par le moteur Lua. -
used_memory_scripts: Le nombre d'octets occupés par les scripts Lua mis en cache. -
maxmemory: La valeur de la directive de configuration maxmemory. -
maxmemory_policy: La valeur de la directive de configuration maxmemory-policy. -
mem_fragmentation_ratio: Le ratio entre used_memory_rss et used_memory. Notez que ce ratio inclut non seulement la fragmentation mais aussi d'autres surcoûts de processus (voir les métriques allocator_*) ainsi que les surcoûts pour le code, les bibliothèques partagées, la pile, etc. -
mem_fragmentation_bytes: La différence en octets entre used_memory_rss et used_memory. Lorsque cette valeur est faible (seulement quelques mégaoctets), un ratio élevé (par exemple, 1,5 ou plus) n'indique pas nécessairement un problème. -
allocator_frag_ratio: Le ratio entre allocator_active et allocator_allocated. C'est une mesure de la vraie fragmentation (externe) (contrairement à mem_fragmentation_ratio). -
allocator_frag_bytes: La différence en octets entre allocator_active et allocator_allocated. Référez-vous à la note pour mem_fragmentation_bytes. -
allocator_rss_ratio: Le ratio entre allocator_resident et allocator_active. Cette métrique indique souvent des pages que l'allocateur peut bientôt libérer au système d'exploitation. -
allocator_rss_bytes: La différence en octets entre allocator_resident et allocator_active. -
rss_overhead_ratio: Le ratio entre used_memory_rss (le RSS du processus) et allocator_resident. Cela inclut les surcoûts RSS qui ne sont pas liés à l'allocateur ou au tas. -
rss_overhead_bytes: La différence en octets entre used_memory_rss (le RSS du processus) et allocator_resident. -
allocator_allocated: Le total des octets alloués par l'allocateur, y compris la fragmentation interne. Cette valeur est normalement la même que used_memory. -
allocator_active: Le total des octets dans les pages actives de l'allocateur, y compris la fragmentation externe. -
allocator_resident: Le total des octets résidents (RSS) dans l'allocateur, y compris les pages qui peuvent être libérées au système d'exploitation (par MEMORY PURGE ou inactivité). -
mem_not_counted_for_evict: La mémoire utilisée non comptabilisée pour l'éviction des clés. Cela inclut principalement les tampons transitoires de répliques et AOF. -
mem_clients_slaves: La mémoire utilisée par les clients répliques. Étant donné que les tampons de répliques partagent la mémoire avec le backlog de réplication, ce champ peut afficher 0 lorsque les répliques ne déclenchent pas une augmentation de l'utilisation de la mémoire. -
mem_clients_normal: La mémoire utilisée par les clients normaux. -
mem_cluster_links: La mémoire utilisée par les connexions aux pairs sur le bus de cluster lorsque le mode cluster est actif. -
mem_aof_buffer: La mémoire transitoire utilisée pour les tampons AOF et réécriture AOF. -
mem_replication_backlog: La mémoire utilisée par le backlog de réplication. -
mem_total_replication_buffers: La mémoire totale consommée pour les tampons de réplication. -
mem_allocator: L'allocateur de mémoire sélectionné au moment de la compilation. -
active_defrag_running: Lorsque la défragmentation active est activée, cette métrique indique si la défragmentation est actuellement active et le pourcentage de CPU qu'elle prévoit d'utiliser. -
lazyfree_pending_objects: Le nombre d'objets en attente d'être libérés de manière paresseuse (en raison d'opérations telles que UNLINK ou FLUSHDB/FLUSHALL asynchrones). -
lazyfreed_objects: Le nombre d'objets qui ont été libérés de manière paresseuse. -
loading: Un indicateur indiquant si un fichier de dump est actuellement chargé. -
async_loading: Indique si le dataset de réplication est chargé de manière asynchrone tout en servant les anciennes données. Cela se produit lorsque repl-diskless-load est activé et réglé sur swapdb. -
current_cow_peak: La taille de pointe en octets de la mémoire copy-on-write pendant une opération de fork enfant. -
current_cow_size: La taille en octets de la mémoire copy-on-write pendant une opération de fork enfant. -
current_cow_size_age: L'âge en secondes de la valeur current_cow_size. -
current_fork_perc: Le pourcentage de progression du processus de fork actuel. Pour les forks AOF et RDB, il représente le pourcentage de current_save_keys_processed sur current_save_keys_total. -
current_save_keys_processed: Le nombre de clés traitées dans l'opération de sauvegarde actuelle. -
current_save_keys_total: Le nombre total de clés au début de l'opération de sauvegarde actuelle. -
rdb_bgsave_in_progress: Un indicateur indiquant qu'une sauvegarde RDB est en cours. -
rdb_last_save_time: Le timestamp epoch de la dernière sauvegarde RDB réussie. -
rdb_last_bgsave_status: Le statut de la dernière opération de sauvegarde RDB. -
rdb_last_bgsave_time_sec: La durée en secondes de la dernière opération de sauvegarde RDB. -
rdb_current_bgsave_time_sec: La durée en secondes d'une opération de sauvegarde RDB en cours, le cas échéant. -
rdb_last_cow_size: La taille en octets de la mémoire copy-on-write pendant la dernière opération de sauvegarde RDB. -
rdb_last_load_keys_expired: Le nombre de clés volatiles supprimées lors du dernier chargement RDB. -
rdb_last_load_keys_loaded: Le nombre de clés chargées lors du dernier chargement RDB. -
aof_enabled: Un indicateur indiquant que la journalisation AOF est activée. -
aof_rewrite_in_progress: Un indicateur montrant qu'une opération de réécriture AOF est en cours. -
aof_rewrite_scheduled: Un indicateur indiquant qu'une opération de réécriture AOF sera programmée une fois qu'une sauvegarde RDB en cours sera terminée. -
aof_last_rewrite_time_sec: La durée, en secondes, de la dernière opération de réécriture AOF. -
aof_current_rewrite_time_sec: La durée, en secondes, d'une opération de réécriture AOF en cours, le cas échéant. -
aof_last_bgrewrite_status: Le statut de la dernière opération de réécriture AOF. -
aof_last_write_status: Le statut de la dernière écriture dans l'AOF. -
aof_last_cow_size: La taille en octets de la mémoire copy-on-write pendant la dernière opération de réécriture AOF. -
module_fork_in_progress: Un indicateur indiquant qu'un fork de module est en cours. -
module_fork_last_cow_size: La taille en octets de la mémoire copy-on-write pendant la dernière opération de fork de module. -
aof_current_size: La taille actuelle du fichier AOF. -
aof_base_size: La taille du fichier AOF au moment du dernier démarrage ou réécriture. -
aof_pending_rewrite: Un indicateur indiquant qu'une opération de réécriture AOF sera programmée une fois que la sauvegarde RDB actuelle sera terminée. -
aof_buffer_length: La taille du tampon AOF. -
aof_pending_bio_fsync: Le nombre de tâches fsync en attente dans la file d'attente d'E/S en arrière-plan. -
aof_delayed_fsync: Le compteur pour les opérations fsync retardées. -
loading_start_time: Le timestamp epoch marquant le début de l'opération de chargement. -
loading_total_bytes: La taille totale du fichier en cours de chargement. -
loading_rdb_used_mem: L'utilisation de la mémoire du serveur qui a généré le fichier RDB au moment de sa création. -
loading_loaded_bytes: Le nombre d'octets qui ont déjà été chargés. -
loading_loaded_perc: Le pourcentage du fichier qui a été chargé. -
loading_eta_seconds: Le temps estimé en secondes restant pour que le chargement soit terminé. -
instantaneous_ops_per_sec: Le nombre de commandes traitées par seconde. -
instantaneous_input_kbps: Le taux de lecture réseau en Ko/sec. -
instantaneous_output_kbps: Le taux d'écriture réseau en Ko/sec. -
instantaneous_input_repl_kbps: Le taux de lecture réseau en Ko/sec à des fins de réplication. -
instantaneous_output_repl_kbps: Le taux d'écriture réseau en Ko/sec à des fins de réplication. -
sync_full: Le nombre de resynchronisations complètes avec les réplicas. -
sync_partial_ok: Le nombre de demandes de resynchronisation partielle acceptées. -
sync_partial_err: Le nombre de demandes de resynchronisation partielle refusées. -
expired_stale_perc: Le pourcentage de clés qui ont probablement expiré. -
expired_time_cap_reached_count: Le nombre de fois où les cycles d'expiration actifs se sont arrêtés prématurément. -
expire_cycle_cpu_milliseconds: Le temps cumulé en millisecondes passé sur les cycles d'expiration actifs. -
evicted_clients: Le nombre de clients expulsés en raison de la limite maxmemory-clients. -
pubsub_channels: Le nombre total de canaux pub/sub avec des abonnements clients actifs. -
pubsub_patterns: Le nombre total de motifs pub/sub avec des abonnements clients actifs. -
pubsubshard_channels: Le nombre total de canaux de shard pub/sub avec des abonnements clients actifs. -
latest_fork_usec: La durée en microsecondes de l'opération de fork la plus récente. -
migrate_cached_sockets: Le nombre de sockets ouverts à des fins de MIGRATE. -
slave_expires_tracked_keys: Le nombre de clés suivies à des fins d'expiration (applicable uniquement aux réplicas écriturables). -
active_defrag_hits: Le nombre de réallocations de valeurs réussies effectuées par le processus de défragmentation active. -
active_defrag_misses: Le nombre de réallocations de valeurs qui ont été abandonnées par le processus de défragmentation active. -
active_defrag_key_hits: Le nombre de clés qui ont été activement défragmentées. -
active_defrag_key_misses: Le nombre de clés qui ont été ignorées lors du processus de défragmentation active. -
tracking_total_keys: Le nombre total de clés suivies par le serveur. -
tracking_total_items: Le nombre total d'éléments suivis (c'est la somme du nombre de clients par clé). -
tracking_total_prefixes: Le nombre de préfixes suivis dans la table des préfixes du serveur (applicable uniquement en mode broadcast). -
role: Retourne "master" si l'instance n'est pas une réplique, ou "slave" si elle réplique à partir d'un master. Notez qu'une réplique peut agir comme un master pour une autre réplique (réplication en chaîne). -
master_failover_state: L'état actuel d'un basculement en cours, s'il en existe un. -
master_replid: L'ID de réplication du serveur Valkey. -
master_replid2: L'ID de réplication secondaire utilisé pour PSYNC après un basculement. -
master_repl_offset: Le décalage de réplication actuel du serveur. -
second_repl_offset: Le décalage jusqu'auquel les IDs de réplication sont acceptés. -
repl_backlog_active: Un indicateur indiquant si le backlog de réplication est actif. -
repl_backlog_size: La taille totale en octets du tampon de backlog de réplication. -
repl_backlog_first_byte_offset: Le décalage du master correspondant au premier octet dans le tampon de backlog de réplication. -
repl_backlog_histlen: La taille en octets des données contenues dans le tampon de backlog de réplication. -
master_host: L'hôte ou l'adresse IP de l'instance master. -
master_port: Le port TCP sur lequel le master écoute. -
master_link_status: Le statut du lien (up ou down). -
master_sync_in_progress: Indique si le master est actuellement en train de se synchroniser avec une réplique. -
slave_read_repl_offset: Le décalage de réplication jusqu'auquel les données ont été lues par la réplique. -
slave_repl_offset: Le décalage de réplication actuel de l'instance réplique. -
slave_priority: La priorité de candidat de l'instance pour le basculement. -
slave_read_only: Un indicateur indiquant si la réplique est en mode lecture seule. -
replica_announced: Un indicateur indiquant si la réplique a été annoncée par Sentinel. -
master_sync_total_bytes: Le nombre total d'octets qui doivent être transférés pendant la synchronisation. Cette valeur peut être 0 lorsque la taille est inconnue (par exemple, lors de l'utilisation de la directive de configuration repl-diskless-sync). -
master_sync_read_bytes: Le nombre d'octets qui ont déjà été transférés. -
master_sync_left_bytes: Le nombre d'octets restant à transférer avant que la synchronisation ne soit terminée (cette valeur peut être négative lorsque master_sync_total_bytes est 0). -
master_sync_perc: Le pourcentage d'octets transférés (master_sync_read_bytes) du total (master_sync_total_bytes), ou une approximation qui utilise loading_rdb_used_mem lorsque master_sync_total_bytes est 0. -
connected_slaves: Le nombre de réplicas connectés. -
min_slaves_good_slaves: Le nombre de réplicas actuellement considérés comme bons pour la réplication. -
current_eviction_exceeded_time: Le temps (en millisecondes) depuis que used_memory a dépassé maxmemory. -
current_active_defrag_time: Le temps (en millisecondes) depuis que la fragmentation de la mémoire a dépassé sa limite. -
master_last_io_seconds_ago: Le nombre de secondes depuis la dernière interaction avec le master. -
master_sync_last_io_seconds_ago: Le nombre de secondes depuis le dernier transfert I/O lors d'une opération SYNC. -
master_link_down_since_seconds: Le nombre de secondes depuis que le lien master est tombé. -
total_eviction_exceeded_time: Le temps total (en millisecondes) pendant lequel used_memory a été supérieur à maxmemory depuis le démarrage du serveur. -
rdb_changes_since_last_save: Le nombre de changements enregistrés depuis le dernier dump. -
total_connections_received: Le nombre total de connexions acceptées depuis le démarrage du serveur. -
total_commands_processed: Le nombre total de commandes traitées par le serveur. -
total_net_input_bytes: Le nombre total d'octets lus depuis le réseau. -
total_net_output_bytes: Le nombre total d'octets écrits sur le réseau. -
total_net_repl_input_bytes: Le nombre total d'octets lus depuis le réseau à des fins de réplication. -
total_net_repl_output_bytes: Le nombre total d'octets écrits sur le réseau à des fins de réplication. -
rejected_connections: Le nombre de connexions rejetées parce que la limite maxclients a été atteinte. -
expired_keys: Le nombre total d'événements d'expiration de clés. -
evicted_keys: Le nombre de clés expulsées en raison de la limite maxmemory. -
keyspace_hits: Le nombre de recherches réussies de clés dans le dictionnaire principal. -
keyspace_misses: Le nombre de recherches échouées de clés dans le dictionnaire principal. -
used_cpu_sys: Le temps CPU système (en secondes) consommé par Valkey, en additionnant l'utilisation de tous les threads (principal et en arrière-plan). -
used_cpu_user: Le temps CPU utilisateur (en secondes) consommé par Valkey, en additionnant l'utilisation de tous les threads. -
used_cpu_sys_children: Le temps CPU système (en secondes) consommé par les processus en arrière-plan. -
used_cpu_user_children: Le temps CPU utilisateur (en secondes) consommé par les processus en arrière-plan. -
used_cpu_sys_main_thread: Le temps CPU système consommé par le thread principal du serveur Valkey. -
used_cpu_user_main_thread: Le temps CPU utilisateur consommé par le thread principal du serveur Valkey. -
unexpected_error_replies: Le nombre de réponses d'erreur inattendues, généralement survenant lors des chargements AOF ou des erreurs de réplication. -
total_error_replies: Le nombre total de réponses d'erreur émises. Cette valeur inclut à la fois les erreurs avant l'exécution de la commande (commandes rejetées) et les erreurs survenant pendant l'exécution de la commande (commandes échouées). -
total_reads_processed: Le nombre total d'événements de lecture traités. -
total_writes_processed: Le nombre total d'événements d'écriture traités. -
io_threaded_reads_processed: Le nombre d'événements de lecture gérés par les threads principaux et I/O. -
io_threaded_writes_processed: Le nombre d'événements d'écriture gérés par les threads principaux et I/O. -
dump_payload_sanitizations: Le nombre total de validations d'intégrité approfondies effectuées sur les charges utiles de dump (comme configuré dans sanitize-dump-payload). -
total_forks: Le nombre total d'opérations de fork depuis le démarrage du serveur. -
total_active_defrag_time: Le temps total (en millisecondes) pendant lequel la fragmentation de la mémoire a dépassé la limite définie. -
aof_rewrites: Le nombre d'opérations de réécriture AOF effectuées depuis le démarrage. -
rdb_saves: Le nombre de snapshots RDB effectués depuis le démarrage.