Valkey: Prometheus

Métricas de Prometheus

👋 ¡Bienvenido a la documentación de Stackhero!

Stackhero ofrece una solución Valkey cloud lista para usar que proporciona una serie de beneficios, incluyendo:

  • Interfaz web UI Redis Commander incluida.
  • Tamaño y transferencias de mensajes ilimitados.
  • Actualizaciones sin esfuerzo con solo un clic.
  • Rendimiento óptimo y seguridad robusta gracias a una VM privada y dedicada.

Ahorra tiempo y simplifica tu vida: ¡solo toma 5 minutos probar la solución de Valkey cloud hosting de Stackhero!

Stackhero ofrece la posibilidad de recuperar métricas en formato Prometheus para cada uno de sus servicios. Estas métricas utilizan el prefijo valkey_ cuando se devuelven a Prometheus, lo que las hace fáciles de identificar e integrar con sus herramientas de monitoreo.

A continuación, se presenta una descripción detallada de cada métrica Stackhero for Valkey disponible. Tenga en cuenta que cada métrica está precedida por valkey_ cuando se devuelve a Prometheus.

Tenga en cuenta que todas estas métricas están precedidas por "valkey_" cuando se devuelven a su Prometheus.

  • shutdown_in_milliseconds: El tiempo máximo restante en milisegundos para que las réplicas se pongan al día con la replicación antes de que se complete la secuencia de apagado. Este campo solo está presente durante el proceso de apagado.

  • connected_clients: El número de conexiones de clientes (excluyendo las conexiones de réplicas).

  • cluster_connections: Una aproximación del número de sockets utilizados por el bus del clúster.

  • maxclients: El valor de la directiva de configuración maxclients. Representa el límite superior para la suma de connected_clients, connected_slaves y cluster_connections.

  • client_recent_max_input_buffer: El tamaño más grande del búfer de entrada entre los clientes actualmente conectados.

  • client_recent_max_output_buffer: El tamaño más grande del búfer de salida entre los clientes actualmente conectados.

  • blocked_clients: El número de clientes esperando en una llamada bloqueante como BLPOP, BRPOP, BRPOPLPUSH, BLMOVE, BZPOPMIN o BZPOPMAX.

  • tracking_clients: El número de clientes que están siendo rastreados actualmente (CLIENT TRACKING).

  • clients_in_timeout_table: El número de clientes en la tabla de tiempo de espera.

  • used_memory: La cantidad total de memoria (en bytes) asignada por Valkey utilizando su asignador elegido (ya sea libc estándar, jemalloc o una alternativa como tcmalloc).

  • used_memory_rss: El número de bytes asignados por Valkey según lo visto por el sistema operativo (también conocido como el tamaño del conjunto residente).

  • used_memory_peak: El pico de memoria consumida por Valkey.

  • used_memory_peak_perc: El porcentaje de used_memory_peak en relación con used_memory.

  • used_memory_overhead: El sobrecoste total en bytes asignado por el servidor para gestionar sus estructuras de datos internas.

  • used_memory_startup: La cantidad inicial de memoria (en bytes) consumida por Valkey al inicio.

  • used_memory_dataset: El tamaño en bytes del conjunto de datos (calculado restando used_memory_overhead de used_memory).

  • used_memory_dataset_perc: El porcentaje de used_memory_dataset en relación con el uso neto de memoria (used_memory menos used_memory_startup).

  • total_system_memory: La cantidad total de memoria disponible en el host de Valkey.

  • used_memory_lua: El número de bytes utilizados por el motor Lua.

  • used_memory_scripts: El número de bytes ocupados por los scripts Lua en caché.

  • maxmemory: El valor de la directiva de configuración maxmemory.

  • maxmemory_policy: El valor de la directiva de configuración maxmemory-policy.

  • mem_fragmentation_ratio: La relación entre used_memory_rss y used_memory. Tenga en cuenta que esta relación incluye no solo la fragmentación sino también otros sobrecostes del proceso (ver las métricas allocator_*) junto con sobrecostes para el código, bibliotecas compartidas, la pila, etc.

  • mem_fragmentation_bytes: La diferencia en bytes entre used_memory_rss y used_memory. Cuando este valor es bajo (solo unos pocos megabytes), una relación alta (por ejemplo, 1.5 o más) no indica necesariamente un problema.

  • allocator_frag_ratio: La relación entre allocator_active y allocator_allocated. Esta es una medida de la verdadera fragmentación (externa) (a diferencia de mem_fragmentation_ratio).

  • allocator_frag_bytes: La diferencia en bytes entre allocator_active y allocator_allocated. Consulte la nota para mem_fragmentation_bytes.

  • allocator_rss_ratio: La relación entre allocator_resident y allocator_active. Esta métrica a menudo indica páginas que el asignador puede liberar pronto al sistema operativo.

  • allocator_rss_bytes: La diferencia en bytes entre allocator_resident y allocator_active.

  • rss_overhead_ratio: La relación entre used_memory_rss (el RSS del proceso) y allocator_resident. Esto incluye sobrecostes de RSS que no están relacionados con el asignador o el montón.

  • rss_overhead_bytes: La diferencia en bytes entre used_memory_rss (el RSS del proceso) y allocator_resident.

  • allocator_allocated: El total de bytes asignados por el asignador, incluida la fragmentación interna. Este valor normalmente es el mismo que used_memory.

  • allocator_active: El total de bytes en las páginas activas del asignador, incluida la fragmentación externa.

  • allocator_resident: El total de bytes residentes (RSS) en el asignador, incluidas las páginas que pueden ser liberadas al sistema operativo (por MEMORY PURGE o inactividad).

  • mem_not_counted_for_evict: La memoria utilizada no contabilizada para la expulsión de claves. Esto incluye principalmente búferes transitorios de réplicas y AOF.

  • mem_clients_slaves: La memoria utilizada por los clientes réplicas. Dado que los búferes de réplicas comparten memoria con el backlog de replicación, este campo podría mostrar 0 cuando las réplicas no desencadenan un aumento en el uso de memoria.

  • mem_clients_normal: La memoria utilizada por los clientes normales.

  • mem_cluster_links: La memoria utilizada por las conexiones a pares en el bus del clúster cuando el modo clúster está activo.

  • mem_aof_buffer: La memoria transitoria utilizada para los búferes AOF y reescritura AOF.

  • mem_replication_backlog: La memoria utilizada por el backlog de replicación.

  • mem_total_replication_buffers: La memoria total consumida para los búferes de replicación.

  • mem_allocator: El asignador de memoria seleccionado en tiempo de compilación.

  • active_defrag_running: Cuando la desfragmentación activa está habilitada, esta métrica indica si la desfragmentación está actualmente activa y el porcentaje de CPU que planea usar.

  • lazyfree_pending_objects: El número de objetos esperando ser liberados de manera perezosa (debido a operaciones como UNLINK o FLUSHDB/FLUSHALL asíncronas).

  • lazyfreed_objects: El número de objetos que han sido liberados de manera perezosa.

  • loading: Una bandera que indica si un archivo de volcado se está cargando actualmente.

  • async_loading: Indica si el conjunto de datos de replicación se está cargando de manera asíncrona mientras se sirven datos antiguos. Esto ocurre cuando repl-diskless-load está habilitado y configurado en swapdb.

  • current_cow_peak: El tamaño máximo en bytes de la memoria copy-on-write durante una operación de fork de hijo.

  • current_cow_size: El tamaño en bytes de la memoria copy-on-write durante una operación de fork de hijo.

  • current_cow_size_age: La antigüedad en segundos del valor current_cow_size.

  • current_fork_perc: El porcentaje de progreso del proceso de fork actual. Para forks AOF y RDB, representa el porcentaje de current_save_keys_processed sobre current_save_keys_total.

  • current_save_keys_processed: El número de claves procesadas en la operación de guardado actual.

  • current_save_keys_total: El número total de claves al inicio de la operación de guardado actual.

  • rdb_bgsave_in_progress: Una bandera que indica que una guardado RDB está en progreso.

  • rdb_last_save_time: La marca de tiempo epoch de la última guardado RDB exitosa.

  • rdb_last_bgsave_status: El estado de la última operación de guardado RDB.

  • rdb_last_bgsave_time_sec: La duración en segundos de la última operación de guardado RDB.

  • rdb_current_bgsave_time_sec: La duración en segundos de una operación de guardado RDB en curso, si la hay.

  • rdb_last_cow_size: El tamaño en bytes de la memoria copy-on-write durante la última operación de guardado RDB.

  • rdb_last_load_keys_expired: El número de claves volátiles eliminadas durante la última carga RDB.

  • rdb_last_load_keys_loaded: El número de claves cargadas durante la última carga RDB.

  • aof_enabled: Una bandera que indica que el registro AOF está activado.

  • aof_rewrite_in_progress: Una bandera que muestra que una operación de reescritura AOF está en progreso.

  • aof_rewrite_scheduled: Una bandera que indica que una operación de reescritura AOF se programará una vez que se complete una guardado RDB en curso.

  • aof_last_rewrite_time_sec: La duración, en segundos, de la última operación de reescritura AOF.

  • aof_current_rewrite_time_sec: La duración, en segundos, de una operación de reescritura AOF en curso, si la hay.

  • aof_last_bgrewrite_status: El estado de la última operación de reescritura AOF.

  • aof_last_write_status: El estado de la última escritura en el AOF.

  • aof_last_cow_size: El tamaño en bytes de la memoria copy-on-write durante la última operación de reescritura AOF.

  • module_fork_in_progress: Una bandera que indica que un fork de módulo está en progreso.

  • module_fork_last_cow_size: El tamaño en bytes de la memoria copy-on-write durante la última operación de fork de módulo.

  • aof_current_size: El tamaño actual del archivo AOF.

  • aof_base_size: El tamaño del archivo AOF en el momento del último inicio o reescritura.

  • aof_pending_rewrite: Una bandera que indica que una operación de reescritura AOF se programará una vez que se complete la guardado RDB actual.

  • aof_buffer_length: El tamaño del búfer AOF.

  • aof_pending_bio_fsync: El número de trabajos fsync pendientes en la cola de E/S en segundo plano.

  • aof_delayed_fsync: El contador para operaciones fsync retrasadas.

  • loading_start_time: La marca de tiempo epoch que marca el inicio de la operación de carga.

  • loading_total_bytes: El tamaño total del archivo que se está cargando.

  • loading_rdb_used_mem: El uso de memoria del servidor que generó el archivo RDB en el momento de su creación.

  • loading_loaded_bytes: El número de bytes que ya se han cargado.

  • loading_loaded_perc: El porcentaje del archivo que se ha cargado.

  • loading_eta_seconds: El tiempo estimado en segundos restante para que la carga se complete.

  • instantaneous_ops_per_sec: El número de comandos procesados por segundo.

  • instantaneous_input_kbps: La tasa de lectura de red en KB/seg.

  • instantaneous_output_kbps: La tasa de escritura de red en KB/seg.

  • instantaneous_input_repl_kbps: La tasa de lectura de red en KB/seg para fines de replicación.

  • instantaneous_output_repl_kbps: La tasa de escritura de red en KB/seg para fines de replicación.

  • sync_full: El número de resincronizaciones completas con réplicas.

  • sync_partial_ok: El número de solicitudes de resincronización parcial aceptadas.

  • sync_partial_err: El número de solicitudes de resincronización parcial denegadas.

  • expired_stale_perc: El porcentaje de claves que probablemente han expirado.

  • expired_time_cap_reached_count: El número de veces que los ciclos de expiración activos se han detenido prematuramente.

  • expire_cycle_cpu_milliseconds: El tiempo acumulado en milisegundos dedicado a los ciclos de expiración activos.

  • evicted_clients: El número de clientes expulsados debido al límite maxmemory-clients.

  • pubsub_channels: El número total de canales pub/sub con suscripciones de clientes activas.

  • pubsub_patterns: El número total de patrones pub/sub con suscripciones de clientes activas.

  • pubsubshard_channels: El número total de canales de shard pub/sub con suscripciones de clientes activas.

  • latest_fork_usec: La duración en microsegundos de la operación de fork más reciente.

  • migrate_cached_sockets: El número de sockets abiertos para fines de MIGRATE.

  • slave_expires_tracked_keys: El número de claves rastreadas para fines de expiración (aplicable solo a réplicas escribibles).

  • active_defrag_hits: El número de realojamientos de valores realizados con éxito por el proceso de desfragmentación activa.

  • active_defrag_misses: El número de realojamientos de valores que fueron abortados por el proceso de desfragmentación activa.

  • active_defrag_key_hits: El número de claves que fueron desfragmentadas activamente.

  • active_defrag_key_misses: El número de claves que fueron omitidas durante el proceso de desfragmentación activa.

  • tracking_total_keys: El número total de claves que está rastreando el servidor.

  • tracking_total_items: El número total de elementos rastreados (esta es la suma del número de clientes por clave).

  • tracking_total_prefixes: El número de prefijos rastreados en la tabla de prefijos del servidor (solo aplicable en modo de difusión).

  • role: Devuelve "master" si la instancia no es una réplica, o "slave" si está replicando desde un master. Tenga en cuenta que una réplica puede actuar como un master para otra réplica (replicación en cadena).

  • master_failover_state: El estado actual de un failover en curso, si existe alguno.

  • master_replid: El ID de replicación del servidor Valkey.

  • master_replid2: El ID de replicación secundario utilizado para PSYNC después de un failover.

  • master_repl_offset: El desplazamiento de replicación actual del servidor.

  • second_repl_offset: El desplazamiento hasta el cual se aceptan los IDs de replicación.

  • repl_backlog_active: Una bandera que indica si el backlog de replicación está activo.

  • repl_backlog_size: El tamaño total en bytes del búfer de backlog de replicación.

  • repl_backlog_first_byte_offset: El desplazamiento del master correspondiente al primer byte en el búfer de backlog de replicación.

  • repl_backlog_histlen: El tamaño en bytes de los datos contenidos en el búfer de backlog de replicación.

  • master_host: El host o la dirección IP de la instancia master.

  • master_port: El puerto TCP en el que el master está escuchando.

  • master_link_status: El estado del enlace (arriba o abajo).

  • master_sync_in_progress: Indica si el master está actualmente sincronizándose con una réplica.

  • slave_read_repl_offset: El desplazamiento de replicación hasta el cual los datos han sido leídos por la réplica.

  • slave_repl_offset: El desplazamiento de replicación actual de la instancia réplica.

  • slave_priority: La prioridad de candidato de la instancia para el failover.

  • slave_read_only: Una bandera que indica si la réplica está en modo de solo lectura.

  • replica_announced: Una bandera que indica si la réplica ha sido anunciada por Sentinel.

  • master_sync_total_bytes: El número total de bytes que deben ser transferidos durante la sincronización. Este valor podría ser 0 cuando el tamaño es desconocido (por ejemplo, al usar la directiva de configuración repl-diskless-sync).

  • master_sync_read_bytes: El número de bytes que ya han sido transferidos.

  • master_sync_left_bytes: El número de bytes restantes por transferir antes de que la sincronización se complete (este valor puede ser negativo cuando master_sync_total_bytes es 0).

  • master_sync_perc: El porcentaje de bytes transferidos (master_sync_read_bytes) del total (master_sync_total_bytes), o una aproximación que utiliza loading_rdb_used_mem cuando master_sync_total_bytes es 0.

  • connected_slaves: El número de réplicas conectadas.

  • min_slaves_good_slaves: El número de réplicas actualmente consideradas buenas para la replicación.

  • current_eviction_exceeded_time: El tiempo (en milisegundos) desde que used_memory superó maxmemory.

  • current_active_defrag_time: El tiempo (en milisegundos) desde que la fragmentación de la memoria superó su límite.

  • master_last_io_seconds_ago: El número de segundos desde la última interacción con el master.

  • master_sync_last_io_seconds_ago: El número de segundos desde la última transferencia I/O durante una operación SYNC.

  • master_link_down_since_seconds: El número de segundos desde que el enlace master cayó.

  • total_eviction_exceeded_time: El tiempo total (en milisegundos) que used_memory ha sido mayor que maxmemory desde el inicio del servidor.

  • rdb_changes_since_last_save: El número de cambios registrados desde el último volcado.

  • total_connections_received: El número total de conexiones aceptadas desde que el servidor comenzó.

  • total_commands_processed: El número total de comandos procesados por el servidor.

  • total_net_input_bytes: El número total de bytes leídos desde la red.

  • total_net_output_bytes: El número total de bytes escritos en la red.

  • total_net_repl_input_bytes: El número total de bytes leídos desde la red para fines de replicación.

  • total_net_repl_output_bytes: El número total de bytes escritos en la red para fines de replicación.

  • rejected_connections: El número de conexiones rechazadas porque se alcanzó el límite maxclients.

  • expired_keys: El número total de eventos de expiración de claves.

  • evicted_keys: El número de claves expulsadas debido al límite maxmemory.

  • keyspace_hits: El número de búsquedas exitosas de claves en el diccionario principal.

  • keyspace_misses: El número de búsquedas fallidas de claves en el diccionario principal.

  • used_cpu_sys: El tiempo de CPU del sistema (en segundos) consumido por Valkey, sumando el uso de todos los hilos (principal y en segundo plano).

  • used_cpu_user: El tiempo de CPU de usuario (en segundos) consumido por Valkey, sumando el uso de todos los hilos.

  • used_cpu_sys_children: El tiempo de CPU del sistema (en segundos) consumido por procesos en segundo plano.

  • used_cpu_user_children: El tiempo de CPU de usuario (en segundos) consumido por procesos en segundo plano.

  • used_cpu_sys_main_thread: El tiempo de CPU del sistema consumido por el hilo principal del servidor Valkey.

  • used_cpu_user_main_thread: El tiempo de CPU de usuario consumido por el hilo principal del servidor Valkey.

  • unexpected_error_replies: El número de respuestas de error inesperadas, generalmente surgidas durante cargas AOF o errores de replicación.

  • total_error_replies: El número total de respuestas de error emitidas. Este valor incluye tanto errores antes de la ejecución del comando (comandos rechazados) como errores que ocurren durante la ejecución del comando (comandos fallidos).

  • total_reads_processed: El número total de eventos de lectura procesados.

  • total_writes_processed: El número total de eventos de escritura procesados.

  • io_threaded_reads_processed: El número de eventos de lectura manejados por los hilos principales y de I/O.

  • io_threaded_writes_processed: El número de eventos de escritura manejados por los hilos principales y de I/O.

  • dump_payload_sanitizations: El número total de validaciones de integridad profundas realizadas en las cargas útiles de volcado (como se configura en sanitize-dump-payload).

  • total_forks: El número total de operaciones de fork desde que el servidor comenzó.

  • total_active_defrag_time: El tiempo total (en milisegundos) que la fragmentación de la memoria ha superado el límite establecido.

  • aof_rewrites: El número de operaciones de reescritura AOF realizadas desde el inicio.

  • rdb_saves: El número de snapshots RDB realizados desde el inicio.