Valkey: Prometheus

Métricas Prometheus

👋 Bem-vindo à documentação do Stackhero!

A Stackhero oferece uma solução Valkey cloud pronta a usar que proporciona uma série de benefícios, incluindo:

  • Interface web UI Redis Commander incluída.
  • Tamanho e transferências de mensagens ilimitados.
  • Atualizações simplificadas com apenas um clique.
  • Desempenho ótimo e segurança robusta alimentados por uma VM privada e dedicada.

Poupe tempo e simplifique a sua vida: são necessários apenas 5 minutos para experimentar a solução Valkey cloud hosting da Stackhero!

A Stackhero oferece a capacidade de recuperar métricas no formato Prometheus para cada um dos seus serviços. Estas métricas utilizam o prefixo valkey_ quando são retornadas ao Prometheus, o que as torna fáceis de identificar e integrar com as suas ferramentas de monitorização.

Abaixo está uma visão detalhada de cada métrica Stackhero for Valkey disponível. Note que cada métrica é prefixada com valkey_ quando retornada ao Prometheus.

Note que todas estas métricas são precedidas por "valkey_" quando são retornadas ao seu Prometheus.

  • shutdown_in_milliseconds: O tempo máximo restante em milissegundos para que as réplicas acompanhem a replicação antes que a sequência de desligamento seja concluída. Este campo está presente apenas durante o processo de desligamento.

  • connected_clients: O número de conexões de clientes (excluindo conexões de réplicas).

  • cluster_connections: Uma aproximação do número de sockets utilizados pelo barramento do cluster.

  • maxclients: O valor da diretiva de configuração maxclients. Representa o limite superior para a soma de connected_clients, connected_slaves e cluster_connections.

  • client_recent_max_input_buffer: O maior tamanho de buffer de entrada entre os clientes atualmente conectados.

  • client_recent_max_output_buffer: O maior tamanho de buffer de saída entre os clientes atualmente conectados.

  • blocked_clients: O número de clientes à espera de uma chamada bloqueante como BLPOP, BRPOP, BRPOPLPUSH, BLMOVE, BZPOPMIN ou BZPOPMAX.

  • tracking_clients: O número de clientes que estão atualmente a ser rastreados (CLIENT TRACKING).

  • clients_in_timeout_table: O número de clientes na tabela de timeout.

  • used_memory: A quantidade total de memória (em bytes) alocada pelo Valkey usando o seu alocador escolhido (seja a libc padrão, jemalloc ou uma alternativa como tcmalloc).

  • used_memory_rss: O número de bytes alocados pelo Valkey conforme visto pelo sistema operativo (também conhecido como tamanho do conjunto residente).

  • used_memory_peak: O pico de memória consumida pelo Valkey.

  • used_memory_peak_perc: A percentagem de used_memory_peak em relação a used_memory.

  • used_memory_overhead: O overhead total em bytes alocado pelo servidor para gerir as suas estruturas de dados internas.

  • used_memory_startup: A quantidade inicial de memória (em bytes) consumida pelo Valkey no arranque.

  • used_memory_dataset: O tamanho em bytes do dataset (calculado subtraindo used_memory_overhead de used_memory).

  • used_memory_dataset_perc: A percentagem de used_memory_dataset em relação ao uso líquido de memória (used_memory menos used_memory_startup).

  • total_system_memory: A quantidade total de memória disponível no host Valkey.

  • used_memory_lua: O número de bytes usados pelo motor Lua.

  • used_memory_scripts: O número de bytes ocupados por scripts Lua em cache.

  • maxmemory: O valor da diretiva de configuração maxmemory.

  • maxmemory_policy: O valor da diretiva de configuração maxmemory-policy.

  • mem_fragmentation_ratio: A relação entre used_memory_rss e used_memory. Note que esta relação inclui não apenas a fragmentação, mas também outros overheads de processo (veja as métricas allocator_*) juntamente com overheads para código, bibliotecas partilhadas, a pilha, etc.

  • mem_fragmentation_bytes: A diferença em bytes entre used_memory_rss e used_memory. Quando este valor é baixo (apenas alguns megabytes), uma relação alta (por exemplo, 1.5 ou acima) não indica necessariamente um problema.

  • allocator_frag_ratio: A relação entre allocator_active e allocator_allocated. Esta é uma medida da verdadeira fragmentação (externa) (ao contrário de mem_fragmentation_ratio).

  • allocator_frag_bytes: A diferença em bytes entre allocator_active e allocator_allocated. Consulte a nota para mem_fragmentation_bytes.

  • allocator_rss_ratio: A relação entre allocator_resident e allocator_active. Esta métrica muitas vezes indica páginas que o alocador pode em breve liberar de volta para o SO.

  • allocator_rss_bytes: A diferença em bytes entre allocator_resident e allocator_active.

  • rss_overhead_ratio: A relação entre used_memory_rss (o RSS do processo) e allocator_resident. Isto inclui overheads RSS que não estão relacionados ao alocador ou heap.

  • rss_overhead_bytes: A diferença em bytes entre used_memory_rss (o RSS do processo) e allocator_resident.

  • allocator_allocated: O total de bytes alocados pelo alocador, incluindo fragmentação interna. Este valor é normalmente o mesmo que used_memory.

  • allocator_active: O total de bytes nas páginas ativas do alocador, incluindo fragmentação externa.

  • allocator_resident: O total de bytes residentes (RSS) no alocador, incluindo páginas que podem ser liberadas de volta para o SO (por MEMORY PURGE ou inatividade).

  • mem_not_counted_for_evict: A memória usada não contabilizada para a remoção de chaves. Isto inclui predominantemente buffers transitórios de réplicas e AOF.

  • mem_clients_slaves: A memória usada por clientes réplicas. Como os buffers de réplicas partilham memória com o backlog de replicação, este campo pode mostrar 0 quando as réplicas não desencadeiam um aumento no uso de memória.

  • mem_clients_normal: A memória usada por clientes normais.

  • mem_cluster_links: A memória usada por conexões com pares no barramento do cluster quando o modo cluster está ativo.

  • mem_aof_buffer: A memória transitória usada para buffers AOF e reescrita AOF.

  • mem_replication_backlog: A memória usada pelo backlog de replicação.

  • mem_total_replication_buffers: A memória total consumida para buffers de replicação.

  • mem_allocator: O alocador de memória selecionado no momento da compilação.

  • active_defrag_running: Quando a desfragmentação ativa está ativada, esta métrica indica se a desfragmentação está atualmente ativa e a percentagem de CPU que pretende usar.

  • lazyfree_pending_objects: O número de objetos à espera de serem libertados de forma preguiçosa (devido a operações como UNLINK ou FLUSHDB/FLUSHALL assíncronas).

  • lazyfreed_objects: O número de objetos que foram libertados de forma preguiçosa.

  • loading: Um indicador que mostra se um ficheiro de dump está atualmente a ser carregado.

  • async_loading: Indica se o dataset de replicação está a ser carregado de forma assíncrona enquanto serve dados antigos. Isto ocorre quando repl-diskless-load está ativado e definido para swapdb.

  • current_cow_peak: O tamanho de pico em bytes da memória copy-on-write durante uma operação de fork filho.

  • current_cow_size: O tamanho em bytes da memória copy-on-write durante uma operação de fork filho.

  • current_cow_size_age: A idade em segundos do valor current_cow_size.

  • current_fork_perc: A percentagem de progresso do processo de fork atual. Para forks AOF e RDB, representa a percentagem de current_save_keys_processed de current_save_keys_total.

  • current_save_keys_processed: O número de chaves processadas na operação de salvamento atual.

  • current_save_keys_total: O número total de chaves no início da operação de salvamento atual.

  • rdb_bgsave_in_progress: Um indicador que mostra que uma salvaguarda RDB está em andamento.

  • rdb_last_save_time: O timestamp epoch da última salvaguarda RDB bem-sucedida.

  • rdb_last_bgsave_status: O estado da última operação de salvaguarda RDB.

  • rdb_last_bgsave_time_sec: A duração em segundos da última operação de salvaguarda RDB.

  • rdb_current_bgsave_time_sec: A duração em segundos de uma operação de salvaguarda RDB em andamento, se houver.

  • rdb_last_cow_size: O tamanho em bytes da memória copy-on-write durante a última operação de salvaguarda RDB.

  • rdb_last_load_keys_expired: O número de chaves voláteis eliminadas durante o último carregamento RDB.

  • rdb_last_load_keys_loaded: O número de chaves carregadas durante o último carregamento RDB.

  • aof_enabled: Um indicador que mostra que o registo AOF está ativado.

  • aof_rewrite_in_progress: Um indicador que mostra que uma operação de reescrita AOF está em andamento.

  • aof_rewrite_scheduled: Um indicador que mostra que uma operação de reescrita AOF será agendada assim que uma salvaguarda RDB em andamento for concluída.

  • aof_last_rewrite_time_sec: A duração, em segundos, da última operação de reescrita AOF.

  • aof_current_rewrite_time_sec: A duração, em segundos, de uma operação de reescrita AOF em andamento, se houver.

  • aof_last_bgrewrite_status: O estado da última operação de reescrita AOF.

  • aof_last_write_status: O estado da última escrita no AOF.

  • aof_last_cow_size: O tamanho em bytes da memória copy-on-write durante a última operação de reescrita AOF.

  • module_fork_in_progress: Um indicador que mostra que um fork de módulo está em andamento.

  • module_fork_last_cow_size: O tamanho em bytes da memória copy-on-write durante a última operação de fork de módulo.

  • aof_current_size: O tamanho atual do ficheiro AOF.

  • aof_base_size: O tamanho do ficheiro AOF no momento do último arranque ou reescrita.

  • aof_pending_rewrite: Um indicador que mostra que uma operação de reescrita AOF será agendada assim que a salvaguarda RDB atual for concluída.

  • aof_buffer_length: O tamanho do buffer AOF.

  • aof_pending_bio_fsync: O número de tarefas fsync pendentes na fila de I/O em segundo plano.

  • aof_delayed_fsync: O contador para operações fsync atrasadas.

  • loading_start_time: O timestamp epoch que marca o início da operação de carregamento.

  • loading_total_bytes: O tamanho total do ficheiro a ser carregado.

  • loading_rdb_used_mem: O uso de memória do servidor que gerou o ficheiro RDB no momento da sua criação.

  • loading_loaded_bytes: O número de bytes que já foram carregados.

  • loading_loaded_perc: A percentagem do ficheiro que foi carregada.

  • loading_eta_seconds: O tempo estimado em segundos restante para que o carregamento seja concluído.

  • instantaneous_ops_per_sec: O número de comandos processados por segundo.

  • instantaneous_input_kbps: A taxa de leitura de rede em KB/seg.

  • instantaneous_output_kbps: A taxa de escrita de rede em KB/seg.

  • instantaneous_input_repl_kbps: A taxa de leitura de rede em KB/seg para fins de replicação.

  • instantaneous_output_repl_kbps: A taxa de escrita de rede em KB/seg para fins de replicação.

  • sync_full: O número de ressincronizações completas com réplicas.

  • sync_partial_ok: O número de pedidos de ressincronização parcial aceites.

  • sync_partial_err: O número de pedidos de ressincronização parcial recusados.

  • expired_stale_perc: A percentagem de chaves que provavelmente expiraram.

  • expired_time_cap_reached_count: O número de vezes que os ciclos de expiração ativos pararam prematuramente.

  • expire_cycle_cpu_milliseconds: O tempo acumulado em milissegundos gasto em ciclos de expiração ativos.

  • evicted_clients: O número de clientes expulsos devido ao limite maxmemory-clients.

  • pubsub_channels: O número total de canais pub/sub com assinaturas de clientes ativas.

  • pubsub_patterns: O número total de padrões pub/sub com assinaturas de clientes ativas.

  • pubsubshard_channels: O número total de canais de shard pub/sub com assinaturas de clientes ativas.

  • latest_fork_usec: A duração em microssegundos da operação de fork mais recente.

  • migrate_cached_sockets: O número de sockets abertos para fins de MIGRATE.

  • slave_expires_tracked_keys: O número de chaves rastreadas para fins de expiração (aplicável apenas a réplicas graváveis).

  • active_defrag_hits: O número de realocações de valores realizadas com sucesso pelo processo de desfragmentação ativa.

  • active_defrag_misses: O número de realocações de valores que foram abortadas pelo processo de desfragmentação ativa.

  • active_defrag_key_hits: O número de chaves que foram ativamente desfragmentadas.

  • active_defrag_key_misses: O número de chaves que foram ignoradas durante o processo de desfragmentação ativa.

  • tracking_total_keys: O número total de chaves a serem rastreadas pelo servidor.

  • tracking_total_items: O número total de itens rastreados (esta é a soma do número de clientes por chave).

  • tracking_total_prefixes: O número de prefixos rastreados na tabela de prefixos do servidor (aplicável apenas em modo de broadcast).

  • role: Retorna "master" se a instância não for uma réplica, ou "slave" se estiver a replicar de um master. Note que uma réplica pode atuar como um master para outra réplica (replicação em cadeia).

  • master_failover_state: O estado atual de um failover em andamento, se existir.

  • master_replid: O ID de replicação do servidor Valkey.

  • master_replid2: O ID de replicação secundário usado para PSYNC após um failover.

  • master_repl_offset: O offset de replicação atual do servidor.

  • second_repl_offset: O offset até ao qual os IDs de replicação são aceites.

  • repl_backlog_active: Um indicador que mostra se o backlog de replicação está ativo.

  • repl_backlog_size: O tamanho total em bytes do buffer de backlog de replicação.

  • repl_backlog_first_byte_offset: O offset do master correspondente ao primeiro byte no buffer de backlog de replicação.

  • repl_backlog_histlen: O tamanho em bytes dos dados contidos no buffer de backlog de replicação.

  • master_host: O host ou endereço IP da instância master.

  • master_port: A porta TCP na qual o master está a escutar.

  • master_link_status: O estado do link (up ou down).

  • master_sync_in_progress: Indica se o master está atualmente a sincronizar com uma réplica.

  • slave_read_repl_offset: O offset de replicação até ao qual os dados foram lidos pela réplica.

  • slave_repl_offset: O offset de replicação atual da instância réplica.

  • slave_priority: A prioridade de candidato da instância para o failover.

  • slave_read_only: Um indicador que mostra se a réplica está em modo de leitura apenas.

  • replica_announced: Um indicador que mostra se a réplica foi anunciada pelo Sentinel.

  • master_sync_total_bytes: O número total de bytes que precisam ser transferidos durante a sincronização. Este valor pode ser 0 quando o tamanho é desconhecido (por exemplo, ao usar a diretiva de configuração repl-diskless-sync).

  • master_sync_read_bytes: O número de bytes que já foram transferidos.

  • master_sync_left_bytes: O número de bytes restantes a serem transferidos antes que a sincronização seja concluída (este valor pode ser negativo quando master_sync_total_bytes é 0).

  • master_sync_perc: A percentagem de bytes transferidos (master_sync_read_bytes) do total (master_sync_total_bytes), ou uma aproximação que usa loading_rdb_used_mem quando master_sync_total_bytes é 0.

  • connected_slaves: O número de réplicas conectadas.

  • min_slaves_good_slaves: O número de réplicas atualmente consideradas boas para fins de replicação.

  • current_eviction_exceeded_time: O tempo (em milissegundos) desde que used_memory excedeu maxmemory.

  • current_active_defrag_time: O tempo (em milissegundos) desde que a fragmentação de memória excedeu o seu limite.

  • master_last_io_seconds_ago: O número de segundos desde a última interação com o master.

  • master_sync_last_io_seconds_ago: O número de segundos desde a última transferência I/O durante uma operação SYNC.

  • master_link_down_since_seconds: O número de segundos desde que o link master caiu.

  • total_eviction_exceeded_time: O tempo total (em milissegundos) que used_memory esteve acima de maxmemory desde o arranque do servidor.

  • rdb_changes_since_last_save: O número de alterações registadas desde o último dump.

  • total_connections_received: O número total de conexões aceites desde o arranque do servidor.

  • total_commands_processed: O número total de comandos processados pelo servidor.

  • total_net_input_bytes: O número total de bytes lidos da rede.

  • total_net_output_bytes: O número total de bytes escritos na rede.

  • total_net_repl_input_bytes: O número total de bytes lidos da rede para fins de replicação.

  • total_net_repl_output_bytes: O número total de bytes escritos na rede para fins de replicação.

  • rejected_connections: O número de conexões rejeitadas porque o limite maxclients foi atingido.

  • expired_keys: O número total de eventos de expiração de chaves.

  • evicted_keys: O número de chaves expulsas devido ao limite maxmemory.

  • keyspace_hits: O número de pesquisas bem-sucedidas de chaves no dicionário principal.

  • keyspace_misses: O número de pesquisas falhadas de chaves no dicionário principal.

  • used_cpu_sys: O tempo de CPU do sistema (em segundos) consumido pelo Valkey, somando o uso de todos os threads (principal e em segundo plano).

  • used_cpu_user: O tempo de CPU do utilizador (em segundos) consumido pelo Valkey, somando o uso de todos os threads.

  • used_cpu_sys_children: O tempo de CPU do sistema (em segundos) consumido por processos em segundo plano.

  • used_cpu_user_children: O tempo de CPU do utilizador (em segundos) consumido por processos em segundo plano.

  • used_cpu_sys_main_thread: O tempo de CPU do sistema consumido pelo thread principal do servidor Valkey.

  • used_cpu_user_main_thread: O tempo de CPU do utilizador consumido pelo thread principal do servidor Valkey.

  • unexpected_error_replies: O número de respostas de erro inesperadas, geralmente surgindo durante carregamentos AOF ou erros de replicação.

  • total_error_replies: O número total de respostas de erro emitidas. Este valor inclui tanto erros antes da execução do comando (comandos rejeitados) quanto erros ocorridos durante a execução do comando (comandos falhados).

  • total_reads_processed: O número total de eventos de leitura processados.

  • total_writes_processed: O número total de eventos de escrita processados.

  • io_threaded_reads_processed: O número de eventos de leitura geridos pelos threads principais e de I/O.

  • io_threaded_writes_processed: O número de eventos de escrita geridos pelos threads principais e de I/O.

  • dump_payload_sanitizations: O número total de validações de integridade profundas realizadas em cargas úteis de dump (como configurado em sanitize-dump-payload).

  • total_forks: O número total de operações de fork desde o arranque do servidor.

  • total_active_defrag_time: O tempo total (em milissegundos) que a fragmentação de memória excedeu o limite definido.

  • aof_rewrites: O número de operações de reescrita AOF realizadas desde o arranque.

  • rdb_saves: O número de snapshots RDB realizados desde o arranque.