Valkey: Prometheus

Metryki Prometheus

👋 Witamy w dokumentacji Stackhero!

Stackhero oferuje gotowe do użycia rozwiązanie Valkey cloud, które zapewnia wiele korzyści, w tym:

  • Włączony web UI Redis Commander.
  • Nieograniczony rozmiar wiadomości i transfery.
  • Bezproblemowe aktualizacje za jednym kliknięciem.
  • Optymalna wydajność i solidne zabezpieczenia dzięki prywatnej i dedykowanej VM.

Oszczędzaj czas i uprość sobie życie: wystarczy 5 minut, aby wypróbować rozwiązanie Valkey cloud hosting Stackhero!

Stackhero oferuje możliwość pobierania metryk w formacie Prometheus dla każdej z Państwa usług. Te metryki używają prefiksu valkey_ przy zwracaniu do Prometheus, co ułatwia ich identyfikację i integrację z narzędziami monitorującymi.

Poniżej znajduje się szczegółowy przegląd każdej dostępnej metryki Stackhero for Valkey. Proszę zauważyć, że każda metryka jest poprzedzona prefiksem valkey_ przy zwracaniu do Prometheus.

Proszę zauważyć, że wszystkie te metryki są poprzedzone "valkey_" przy zwracaniu do Państwa Prometheus.

  • shutdown_in_milliseconds: Maksymalny pozostały czas w milisekundach dla replik, aby nadrobić replikację przed zakończeniem sekwencji zamykania. To pole jest obecne tylko podczas procesu zamykania.

  • connected_clients: Liczba połączeń klientów (z wyłączeniem połączeń z replik).

  • cluster_connections: Przybliżona liczba gniazd używanych przez magistralę klastra.

  • maxclients: Wartość dyrektywy konfiguracyjnej maxclients. Reprezentuje górny limit dla sumy connected_clients, connected_slaves i cluster_connections.

  • client_recent_max_input_buffer: Największy rozmiar bufora wejściowego wśród obecnie podłączonych klientów.

  • client_recent_max_output_buffer: Największy rozmiar bufora wyjściowego wśród obecnie podłączonych klientów.

  • blocked_clients: Liczba klientów oczekujących na blokujące wywołanie, takie jak BLPOP, BRPOP, BRPOPLPUSH, BLMOVE, BZPOPMIN lub BZPOPMAX.

  • tracking_clients: Liczba klientów, którzy są obecnie śledzeni (CLIENT TRACKING).

  • clients_in_timeout_table: Liczba klientów w tabeli timeout.

  • used_memory: Całkowita ilość pamięci (w bajtach) przydzielona przez Valkey przy użyciu wybranego alokatora (czy to standardowej libc, jemalloc, czy alternatywy takiej jak tcmalloc).

  • used_memory_rss: Liczba bajtów przydzielonych przez Valkey widziana przez system operacyjny (znana również jako rozmiar zestawu rezydentnego).

  • used_memory_peak: Szczytowe zużycie pamięci przez Valkey.

  • used_memory_peak_perc: Procent used_memory_peak w stosunku do used_memory.

  • used_memory_overhead: Całkowity narzut w bajtach przydzielony przez serwer do zarządzania wewnętrznymi strukturami danych.

  • used_memory_startup: Początkowa ilość pamięci (w bajtach) zużyta przez Valkey przy starcie.

  • used_memory_dataset: Rozmiar datasetu w bajtach (obliczany przez odjęcie used_memory_overhead od used_memory).

  • used_memory_dataset_perc: Procent used_memory_dataset w stosunku do netto zużycia pamięci (used_memory minus used_memory_startup).

  • total_system_memory: Całkowita ilość pamięci dostępna na hoście Valkey.

  • used_memory_lua: Liczba bajtów używanych przez silnik Lua.

  • used_memory_scripts: Liczba bajtów zajmowanych przez buforowane skrypty Lua.

  • maxmemory: Wartość dyrektywy konfiguracyjnej maxmemory.

  • maxmemory_policy: Wartość dyrektywy konfiguracyjnej maxmemory-policy.

  • mem_fragmentation_ratio: Stosunek między used_memory_rss a used_memory. Proszę zauważyć, że ten stosunek obejmuje nie tylko fragmentację, ale także inne narzuty procesowe (zobacz metryki allocator_*) oraz narzuty dla kodu, bibliotek współdzielonych, stosu itp.

  • mem_fragmentation_bytes: Różnica w bajtach między used_memory_rss a used_memory. Gdy ta wartość jest niska (tylko kilka megabajtów), wysoki stosunek (na przykład 1,5 lub więcej) niekoniecznie wskazuje na problem.

  • allocator_frag_ratio: Stosunek między allocator_active a allocator_allocated. Jest to miara prawdziwej (zewnętrznej) fragmentacji (w przeciwieństwie do mem_fragmentation_ratio).

  • allocator_frag_bytes: Różnica w bajtach między allocator_active a allocator_allocated. Odnieś się do uwagi dla mem_fragmentation_bytes.

  • allocator_rss_ratio: Stosunek między allocator_resident a allocator_active. Ta metryka często wskazuje strony, które alokator może wkrótce zwolnić do systemu operacyjnego.

  • allocator_rss_bytes: Różnica w bajtach między allocator_resident a allocator_active.

  • rss_overhead_ratio: Stosunek między used_memory_rss (RSS procesu) a allocator_resident. Obejmuje to narzuty RSS, które nie są związane z alokatorem lub stertą.

  • rss_overhead_bytes: Różnica w bajtach między used_memory_rss (RSS procesu) a allocator_resident.

  • allocator_allocated: Całkowita liczba bajtów przydzielonych przez alokator, w tym fragmentacja wewnętrzna. Ta wartość jest zazwyczaj taka sama jak used_memory.

  • allocator_active: Całkowita liczba bajtów w aktywnych stronach alokatora, w tym fragmentacja zewnętrzna.

  • allocator_resident: Całkowita liczba bajtów rezydentnych (RSS) w alokatorze, w tym strony, które mogą być zwolnione do systemu operacyjnego (przez MEMORY PURGE lub nieaktywność).

  • mem_not_counted_for_evict: Zużyta pamięć nie uwzględniona przy usuwaniu kluczy. Obejmuje głównie przejściowe bufory replik i AOF.

  • mem_clients_slaves: Pamięć używana przez klientów replik. Ponieważ bufory replik dzielą pamięć z backlogiem replikacji, to pole może pokazywać 0, gdy repliki nie powodują wzrostu zużycia pamięci.

  • mem_clients_normal: Pamięć używana przez normalnych klientów.

  • mem_cluster_links: Pamięć używana przez połączenia z rówieśnikami na magistrali klastra, gdy tryb klastra jest aktywny.

  • mem_aof_buffer: Przejściowa pamięć używana dla buforów AOF i przepisania AOF.

  • mem_replication_backlog: Pamięć używana przez backlog replikacji.

  • mem_total_replication_buffers: Całkowita pamięć zużyta na bufory replikacji.

  • mem_allocator: Alokator pamięci wybrany w czasie kompilacji.

  • active_defrag_running: Gdy aktywna defragmentacja jest włączona, ta metryka wskazuje, czy defragmentacja jest obecnie aktywna i jaki procent CPU zamierza użyć.

  • lazyfree_pending_objects: Liczba obiektów oczekujących na leniwe zwolnienie (z powodu operacji takich jak UNLINK lub asynchroniczne FLUSHDB/FLUSHALL).

  • lazyfreed_objects: Liczba obiektów, które zostały leniwie zwolnione.

  • loading: Flaga wskazująca, czy plik zrzutu jest obecnie ładowany.

  • async_loading: Wskazuje, czy dataset replikacji jest ładowany asynchronicznie podczas serwowania starych danych. Dzieje się tak, gdy repl-diskless-load jest włączony i ustawiony na swapdb.

  • current_cow_peak: Szczytowy rozmiar w bajtach pamięci copy-on-write podczas operacji fork dziecka.

  • current_cow_size: Rozmiar w bajtach pamięci copy-on-write podczas operacji fork dziecka.

  • current_cow_size_age: Wiek w sekundach wartości current_cow_size.

  • current_fork_perc: Procent postępu bieżącego procesu fork. Dla forków AOF i RDB reprezentuje procent current_save_keys_processed z current_save_keys_total.

  • current_save_keys_processed: Liczba kluczy przetworzonych w bieżącej operacji zapisu.

  • current_save_keys_total: Całkowita liczba kluczy na początku bieżącej operacji zapisu.

  • rdb_bgsave_in_progress: Flaga wskazująca, że zapis RDB jest w toku.

  • rdb_last_save_time: Znacznik czasu epoki ostatniego udanego zapisu RDB.

  • rdb_last_bgsave_status: Status ostatniej operacji zapisu RDB.

  • rdb_last_bgsave_time_sec: Czas trwania w sekundach ostatniej operacji zapisu RDB.

  • rdb_current_bgsave_time_sec: Czas trwania w sekundach trwającej operacji zapisu RDB, jeśli taka istnieje.

  • rdb_last_cow_size: Rozmiar w bajtach pamięci copy-on-write podczas ostatniej operacji zapisu RDB.

  • rdb_last_load_keys_expired: Liczba kluczy lotnych usuniętych podczas ostatniego ładowania RDB.

  • rdb_last_load_keys_loaded: Liczba kluczy załadowanych podczas ostatniego ładowania RDB.

  • aof_enabled: Flaga wskazująca, że logowanie AOF jest aktywowane.

  • aof_rewrite_in_progress: Flaga pokazująca, że operacja przepisania AOF jest w toku.

  • aof_rewrite_scheduled: Flaga wskazująca, że operacja przepisania AOF zostanie zaplanowana po zakończeniu trwającego zapisu RDB.

  • aof_last_rewrite_time_sec: Czas trwania, w sekundach, ostatniej operacji przepisania AOF.

  • aof_current_rewrite_time_sec: Czas trwania, w sekundach, trwającej operacji przepisania AOF, jeśli taka istnieje.

  • aof_last_bgrewrite_status: Status ostatniej operacji przepisania AOF.

  • aof_last_write_status: Status ostatniego zapisu do AOF.

  • aof_last_cow_size: Rozmiar w bajtach pamięci copy-on-write podczas ostatniej operacji przepisania AOF.

  • module_fork_in_progress: Flaga wskazująca, że fork modułu jest w toku.

  • module_fork_last_cow_size: Rozmiar w bajtach pamięci copy-on-write podczas ostatniej operacji fork modułu.

  • aof_current_size: Obecny rozmiar pliku AOF.

  • aof_base_size: Rozmiar pliku AOF w momencie ostatniego uruchomienia lub przepisania.

  • aof_pending_rewrite: Flaga wskazująca, że operacja przepisania AOF zostanie zaplanowana po zakończeniu bieżącego zapisu RDB.

  • aof_buffer_length: Rozmiar bufora AOF.

  • aof_pending_bio_fsync: Liczba zadań fsync oczekujących w kolejce I/O w tle.

  • aof_delayed_fsync: Licznik dla opóźnionych operacji fsync.

  • loading_start_time: Znacznik czasu epoki oznaczający początek operacji ładowania.

  • loading_total_bytes: Całkowity rozmiar pliku, który jest ładowany.

  • loading_rdb_used_mem: Zużycie pamięci przez serwer, który wygenerował plik RDB w momencie jego tworzenia.

  • loading_loaded_bytes: Liczba bajtów, które już zostały załadowane.

  • loading_loaded_perc: Procent pliku, który został załadowany.

  • loading_eta_seconds: Szacowany czas w sekundach pozostały do zakończenia ładowania.

  • instantaneous_ops_per_sec: Liczba przetworzonych poleceń na sekundę.

  • instantaneous_input_kbps: Szybkość odczytu sieciowego w KB/s.

  • instantaneous_output_kbps: Szybkość zapisu sieciowego w KB/s.

  • instantaneous_input_repl_kbps: Szybkość odczytu sieciowego w KB/s do celów replikacji.

  • instantaneous_output_repl_kbps: Szybkość zapisu sieciowego w KB/s do celów replikacji.

  • sync_full: Liczba pełnych resynchronizacji z replikami.

  • sync_partial_ok: Liczba zaakceptowanych żądań częściowej resynchronizacji.

  • sync_partial_err: Liczba odrzuconych żądań częściowej resynchronizacji.

  • expired_stale_perc: Procent kluczy, które prawdopodobnie wygasły.

  • expired_time_cap_reached_count: Liczba razy, kiedy aktywne cykle wygasania zostały zatrzymane przedwcześnie.

  • expire_cycle_cpu_milliseconds: Łączny czas w milisekundach spędzony na aktywnych cyklach wygasania.

  • evicted_clients: Liczba klientów usuniętych z powodu limitu maxmemory-clients.

  • pubsub_channels: Całkowita liczba kanałów pub/sub z aktywnymi subskrypcjami klientów.

  • pubsub_patterns: Całkowita liczba wzorców pub/sub z aktywnymi subskrypcjami klientów.

  • pubsubshard_channels: Całkowita liczba kanałów shard pub/sub z aktywnymi subskrypcjami klientów.

  • latest_fork_usec: Czas trwania w mikrosekundach najnowszej operacji fork.

  • migrate_cached_sockets: Liczba otwartych gniazd do celów MIGRATE.

  • slave_expires_tracked_keys: Liczba kluczy śledzonych do celów wygasania (dotyczy tylko zapisywalnych replik).

  • active_defrag_hits: Liczba udanych realokacji wartości wykonanych przez proces aktywnej defragmentacji.

  • active_defrag_misses: Liczba realokacji wartości, które zostały porzucone przez proces aktywnej defragmentacji.

  • active_defrag_key_hits: Liczba kluczy, które zostały aktywnie zdefragmentowane.

  • active_defrag_key_misses: Liczba kluczy, które zostały pominięte podczas procesu aktywnej defragmentacji.

  • tracking_total_keys: Całkowita liczba kluczy śledzonych przez serwer.

  • tracking_total_items: Całkowita liczba śledzonych elementów (jest to suma liczby klientów na klucz).

  • tracking_total_prefixes: Liczba śledzonych prefiksów w tabeli prefiksów serwera (dotyczy tylko trybu broadcast).

  • role: Zwraca "master", jeśli instancja nie jest repliką, lub "slave", jeśli replikuje z mastera. Proszę zauważyć, że replika może działać jako master dla innej repliki (replikacja łańcuchowa).

  • master_failover_state: Obecny stan trwającego przełączenia awaryjnego, jeśli istnieje.

  • master_replid: ID replikacji serwera Valkey.

  • master_replid2: Drugorzędny ID replikacji używany do PSYNC po przełączeniu awaryjnym.

  • master_repl_offset: Obecne przesunięcie replikacji serwera.

  • second_repl_offset: Przesunięcie, do którego akceptowane są ID replikacji.

  • repl_backlog_active: Flaga wskazująca, czy backlog replikacji jest aktywny.

  • repl_backlog_size: Całkowity rozmiar w bajtach bufora backlogu replikacji.

  • repl_backlog_first_byte_offset: Przesunięcie mastera odpowiadające pierwszemu bajtowi w buforze backlogu replikacji.

  • repl_backlog_histlen: Rozmiar w bajtach danych zawartych w buforze backlogu replikacji.

  • master_host: Host lub adres IP instancji master.

  • master_port: Port TCP, na którym nasłuchuje master.

  • master_link_status: Status linku (up lub down).

  • master_sync_in_progress: Wskazuje, czy master jest obecnie synchronizowany z repliką.

  • slave_read_repl_offset: Przesunięcie replikacji, do którego dane zostały odczytane przez replikę.

  • slave_repl_offset: Obecne przesunięcie replikacji instancji repliki.

  • slave_priority: Priorytet kandydata instancji do przełączenia awaryjnego.

  • slave_read_only: Flaga wskazująca, czy replika jest w trybie tylko do odczytu.

  • replica_announced: Flaga wskazująca, czy replika została ogłoszona przez Sentinel.

  • master_sync_total_bytes: Całkowita liczba bajtów, które muszą być przesłane podczas synchronizacji. Ta wartość może wynosić 0, gdy rozmiar jest nieznany (na przykład, gdy używana jest dyrektywa konfiguracyjna repl-diskless-sync).

  • master_sync_read_bytes: Liczba bajtów, które już zostały przesłane.

  • master_sync_left_bytes: Liczba bajtów pozostałych do przesłania przed zakończeniem synchronizacji (ta wartość może być ujemna, gdy master_sync_total_bytes wynosi 0).

  • master_sync_perc: Procent przesłanych bajtów (master_sync_read_bytes) z całości (master_sync_total_bytes), lub przybliżenie, które używa loading_rdb_used_mem, gdy master_sync_total_bytes wynosi 0.

  • connected_slaves: Liczba podłączonych replik.

  • min_slaves_good_slaves: Liczba replik obecnie uznawanych za dobre do celów replikacji.

  • current_eviction_exceeded_time: Czas (w milisekundach) od momentu, gdy used_memory ostatnio przekroczyło maxmemory.

  • current_active_defrag_time: Czas (w milisekundach) od momentu, gdy fragmentacja pamięci ostatnio przekroczyła swój limit.

  • master_last_io_seconds_ago: Liczba sekund od ostatniej interakcji z masterem.

  • master_sync_last_io_seconds_ago: Liczba sekund od ostatniego transferu I/O podczas operacji SYNC.

  • master_link_down_since_seconds: Liczba sekund od momentu, gdy link mastera spadł.

  • total_eviction_exceeded_time: Całkowity czas (w milisekundach), w którym used_memory było większe niż maxmemory od uruchomienia serwera.

  • rdb_changes_since_last_save: Liczba zmian zarejestrowanych od ostatniego zrzutu.

  • total_connections_received: Całkowita liczba zaakceptowanych połączeń od uruchomienia serwera.

  • total_commands_processed: Całkowita liczba poleceń przetworzonych przez serwer.

  • total_net_input_bytes: Całkowita liczba bajtów odczytanych z sieci.

  • total_net_output_bytes: Całkowita liczba bajtów zapisanych do sieci.

  • total_net_repl_input_bytes: Całkowita liczba bajtów odczytanych z sieci do celów replikacji.

  • total_net_repl_output_bytes: Całkowita liczba bajtów zapisanych do sieci do celów replikacji.

  • rejected_connections: Liczba połączeń odrzuconych, ponieważ osiągnięto limit maxclients.

  • expired_keys: Całkowita liczba zdarzeń wygaśnięcia kluczy.

  • evicted_keys: Liczba kluczy usuniętych z powodu limitu maxmemory.

  • keyspace_hits: Liczba udanych wyszukiwań kluczy w głównym słowniku.

  • keyspace_misses: Liczba nieudanych wyszukiwań kluczy w głównym słowniku.

  • used_cpu_sys: Czas CPU systemu (w sekundach) zużyty przez Valkey, sumując użycie wszystkich wątków (głównego i w tle).

  • used_cpu_user: Czas CPU użytkownika (w sekundach) zużyty przez Valkey, sumując użycie wszystkich wątków.

  • used_cpu_sys_children: Czas CPU systemu (w sekundach) zużyty przez procesy w tle.

  • used_cpu_user_children: Czas CPU użytkownika (w sekundach) zużyty przez procesy w tle.

  • used_cpu_sys_main_thread: Czas CPU systemu zużyty przez główny wątek serwera Valkey.

  • used_cpu_user_main_thread: Czas CPU użytkownika zużyty przez główny wątek serwera Valkey.

  • unexpected_error_replies: Liczba nieoczekiwanych odpowiedzi błędów, zazwyczaj występujących podczas ładowania AOF lub błędów replikacji.

  • total_error_replies: Całkowita liczba wydanych odpowiedzi błędów. Ta wartość obejmuje zarówno błędy przed wykonaniem polecenia (odrzucone polecenia), jak i błędy występujące podczas wykonywania polecenia (nieudane polecenia).

  • total_reads_processed: Całkowita liczba przetworzonych zdarzeń odczytu.

  • total_writes_processed: Całkowita liczba przetworzonych zdarzeń zapisu.

  • io_threaded_reads_processed: Liczba zdarzeń odczytu obsługiwanych przez główne i I/O wątki.

  • io_threaded_writes_processed: Liczba zdarzeń zapisu obsługiwanych przez główne i I/O wątki.

  • dump_payload_sanitizations: Całkowita liczba głębokich walidacji integralności przeprowadzonych na ładunkach zrzutów (zgodnie z konfiguracją w sanitize-dump-payload).

  • total_forks: Całkowita liczba operacji fork od uruchomienia serwera.

  • total_active_defrag_time: Całkowity czas (w milisekundach), w którym fragmentacja pamięci przekroczyła ustalony limit.

  • aof_rewrites: Liczba operacji przepisania AOF wykonanych od uruchomienia.

  • rdb_saves: Liczba snapshotów RDB wykonanych od uruchomienia.