Valkey: Prometheus

Prometheus-Metriken

👋 Willkommen in der Stackhero-Dokumentation!

Stackhero bietet eine einsatzbereite Valkey Cloud Lösung, die zahlreiche Vorteile bietet, darunter:

  • Redis Commander Web-UI inklusive.
  • Unbegrenzte Nachrichtengröße und Übertragungen.
  • Mühelose Updates mit nur einem Klick.
  • Optimale Performance und robuste Sicherheit durch eine private und dedizierte VM.

Sparen Sie Zeit und vereinfachen Sie Ihr Leben: Es dauert nur 5 Minuten, um die Valkey Cloud Hosting Lösung von Stackhero auszuprobieren!

Stackhero bietet die Möglichkeit, Metriken im Prometheus-Format für jeden Ihrer Dienste abzurufen. Diese Metriken verwenden das Präfix valkey_, wenn sie an Prometheus zurückgegeben werden, was sie leicht identifizierbar und in Ihre Überwachungstools integrierbar macht.

Nachfolgend finden Sie eine detaillierte Übersicht über jede verfügbare Stackhero for Valkey-Metrik. Bitte beachten Sie, dass jede Metrik mit valkey_ vorangestellt ist, wenn sie an Prometheus zurückgegeben wird.

Beachten Sie, dass all diese Metriken mit "valkey_" vorangestellt sind, wenn sie an Ihr Prometheus zurückgegeben werden.

  • shutdown_in_milliseconds: Die maximale verbleibende Zeit in Millisekunden, die Replikate benötigen, um die Replikation aufzuholen, bevor die Abschaltsequenz abgeschlossen ist. Dieses Feld ist nur während des Abschaltprozesses vorhanden.

  • connected_clients: Die Anzahl der Client-Verbindungen (ohne Verbindungen von Replikaten).

  • cluster_connections: Eine Schätzung der Anzahl der Sockets, die vom Cluster-Bus verwendet werden.

  • maxclients: Der Wert der maxclients-Konfigurationsrichtlinie. Er stellt die Obergrenze für die Summe von connected_clients, connected_slaves und cluster_connections dar.

  • client_recent_max_input_buffer: Die größte Eingabepuffergröße unter den derzeit verbundenen Clients.

  • client_recent_max_output_buffer: Die größte Ausgabepuffergröße unter den derzeit verbundenen Clients.

  • blocked_clients: Die Anzahl der Clients, die auf einen blockierenden Aufruf wie BLPOP, BRPOP, BRPOPLPUSH, BLMOVE, BZPOPMIN oder BZPOPMAX warten.

  • tracking_clients: Die Anzahl der derzeit verfolgten Clients (CLIENT TRACKING).

  • clients_in_timeout_table: Die Anzahl der Clients in der Timeout-Tabelle.

  • used_memory: Die insgesamt von Valkey zugewiesene Speichermenge (in Bytes) unter Verwendung des gewählten Allokators (sei es die Standard-libc, jemalloc oder eine Alternative wie tcmalloc).

  • used_memory_rss: Die Anzahl der von Valkey zugewiesenen Bytes, wie sie vom Betriebssystem gesehen werden (auch bekannt als Resident Set Size).

  • used_memory_peak: Der Spitzenwert des von Valkey verbrauchten Speichers.

  • used_memory_peak_perc: Der Prozentsatz von used_memory_peak im Verhältnis zu used_memory.

  • used_memory_overhead: Der gesamte Overhead in Bytes, der vom Server zur Verwaltung seiner internen Datenstrukturen zugewiesen wird.

  • used_memory_startup: Die anfängliche Speichermenge (in Bytes), die Valkey beim Start verbraucht.

  • used_memory_dataset: Die Größe des Datasets in Bytes (berechnet durch Subtraktion von used_memory_overhead von used_memory).

  • used_memory_dataset_perc: Der Prozentsatz von used_memory_dataset im Verhältnis zur Nettospeichernutzung (used_memory minus used_memory_startup).

  • total_system_memory: Die insgesamt auf dem Valkey-Host verfügbare Speichermenge.

  • used_memory_lua: Die Anzahl der vom Lua-Engine verwendeten Bytes.

  • used_memory_scripts: Die Anzahl der von zwischengespeicherten Lua-Skripten belegten Bytes.

  • maxmemory: Der Wert der maxmemory-Konfigurationsrichtlinie.

  • maxmemory_policy: Der Wert der maxmemory-policy-Konfigurationsrichtlinie.

  • mem_fragmentation_ratio: Das Verhältnis zwischen used_memory_rss und used_memory. Beachten Sie, dass dieses Verhältnis nicht nur die Fragmentierung, sondern auch andere Prozess-Overheads (siehe allocator_* Metriken) sowie Overheads für Code, Shared Libraries, den Stack usw. umfasst.

  • mem_fragmentation_bytes: Der Unterschied in Bytes zwischen used_memory_rss und used_memory. Wenn dieser Wert niedrig ist (nur wenige Megabytes), weist ein hohes Verhältnis (zum Beispiel 1,5 oder mehr) nicht unbedingt auf ein Problem hin.

  • allocator_frag_ratio: Das Verhältnis zwischen allocator_active und allocator_allocated. Dies ist ein Maß für die echte (externe) Fragmentierung (im Gegensatz zu mem_fragmentation_ratio).

  • allocator_frag_bytes: Der Unterschied in Bytes zwischen allocator_active und allocator_allocated. Siehe die Anmerkung zu mem_fragmentation_bytes.

  • allocator_rss_ratio: Das Verhältnis zwischen allocator_resident und allocator_active. Diese Metrik zeigt oft Seiten an, die der Allokator bald an das Betriebssystem zurückgeben kann.

  • allocator_rss_bytes: Der Unterschied in Bytes zwischen allocator_resident und allocator_active.

  • rss_overhead_ratio: Das Verhältnis zwischen used_memory_rss (dem Prozess-RSS) und allocator_resident. Dies umfasst RSS-Overheads, die nicht mit dem Allokator oder Heap zusammenhängen.

  • rss_overhead_bytes: Der Unterschied in Bytes zwischen used_memory_rss (dem Prozess-RSS) und allocator_resident.

  • allocator_allocated: Die insgesamt vom Allokator zugewiesenen Bytes, einschließlich interner Fragmentierung. Dieser Wert ist normalerweise derselbe wie used_memory.

  • allocator_active: Die insgesamt in den aktiven Seiten des Allokators enthaltenen Bytes, einschließlich externer Fragmentierung.

  • allocator_resident: Die insgesamt im Allokator vorhandenen Bytes (RSS), einschließlich Seiten, die an das Betriebssystem zurückgegeben werden können (durch MEMORY PURGE oder Inaktivität).

  • mem_not_counted_for_evict: Der verwendete Speicher, der nicht für die Schlüsselräumung gezählt wird. Dies umfasst hauptsächlich transiente Replikat- und AOF-Puffer.

  • mem_clients_slaves: Der von Replikat-Clients verwendete Speicher. Da Replikat-Puffer den Speicher mit dem Replikations-Backlog teilen, kann dieses Feld 0 anzeigen, wenn Replikate keinen Anstieg der Speichernutzung auslösen.

  • mem_clients_normal: Der von normalen Clients verwendete Speicher.

  • mem_cluster_links: Der von Verbindungen zu Peers auf dem Cluster-Bus verwendete Speicher, wenn der Cluster-Modus aktiv ist.

  • mem_aof_buffer: Der für AOF und AOF-Neuschreibpuffer verwendete transiente Speicher.

  • mem_replication_backlog: Der vom Replikations-Backlog verwendete Speicher.

  • mem_total_replication_buffers: Der insgesamt für Replikationspuffer verbrauchte Speicher.

  • mem_allocator: Der zur Kompilierungszeit ausgewählte Speicherallokator.

  • active_defrag_running: Wenn die aktive Defragmentierung aktiviert ist, zeigt diese Metrik an, ob die Defragmentierung derzeit aktiv ist und welchen Prozentsatz der CPU sie zu verwenden beabsichtigt.

  • lazyfree_pending_objects: Die Anzahl der Objekte, die darauf warten, faul freigegeben zu werden (aufgrund von Operationen wie UNLINK oder asynchronem FLUSHDB/FLUSHALL).

  • lazyfreed_objects: Die Anzahl der Objekte, die faul freigegeben wurden.

  • loading: Ein Indikator, ob derzeit eine Dump-Datei geladen wird.

  • async_loading: Gibt an, ob das Replikations-Dataset asynchron geladen wird, während alte Daten bereitgestellt werden. Dies tritt auf, wenn repl-diskless-load aktiviert und auf swapdb eingestellt ist.

  • current_cow_peak: Die Spitzengröße in Bytes des Copy-on-Write-Speichers während eines Kind-Fork-Vorgangs.

  • current_cow_size: Die Größe in Bytes des Copy-on-Write-Speichers während eines Kind-Fork-Vorgangs.

  • current_cow_size_age: Das Alter in Sekunden des current_cow_size-Werts.

  • current_fork_perc: Der prozentuale Fortschritt des aktuellen Fork-Prozesses. Für AOF- und RDB-Forks stellt er den Prozentsatz von current_save_keys_processed aus current_save_keys_total dar.

  • current_save_keys_processed: Die Anzahl der im aktuellen Speicherprozess verarbeiteten Schlüssel.

  • current_save_keys_total: Die Gesamtanzahl der Schlüssel zu Beginn des aktuellen Speicherprozesses.

  • rdb_bgsave_in_progress: Ein Indikator, dass ein RDB-Speicherprozess im Gange ist.

  • rdb_last_save_time: Der Epoch-Zeitstempel des letzten erfolgreichen RDB-Speicherprozesses.

  • rdb_last_bgsave_status: Der Status des letzten RDB-Speicherprozesses.

  • rdb_last_bgsave_time_sec: Die Dauer in Sekunden des letzten RDB-Speicherprozesses.

  • rdb_current_bgsave_time_sec: Die Dauer in Sekunden eines laufenden RDB-Speicherprozesses, falls vorhanden.

  • rdb_last_cow_size: Die Größe in Bytes des Copy-on-Write-Speichers während des letzten RDB-Speicherprozesses.

  • rdb_last_load_keys_expired: Die Anzahl der volatilen Schlüssel, die während des letzten RDB-Ladevorgangs gelöscht wurden.

  • rdb_last_load_keys_loaded: Die Anzahl der während des letzten RDB-Ladevorgangs geladenen Schlüssel.

  • aof_enabled: Ein Indikator, dass AOF-Logging aktiviert ist.

  • aof_rewrite_in_progress: Ein Indikator, dass ein AOF-Neuschreibvorgang im Gange ist.

  • aof_rewrite_scheduled: Ein Indikator, dass ein AOF-Neuschreibvorgang geplant wird, sobald ein laufender RDB-Speicherprozess abgeschlossen ist.

  • aof_last_rewrite_time_sec: Die Dauer in Sekunden des letzten AOF-Neuschreibvorgangs.

  • aof_current_rewrite_time_sec: Die Dauer in Sekunden eines laufenden AOF-Neuschreibvorgangs, falls vorhanden.

  • aof_last_bgrewrite_status: Der Status des letzten AOF-Neuschreibvorgangs.

  • aof_last_write_status: Der Status des letzten Schreibvorgangs in das AOF.

  • aof_last_cow_size: Die Größe in Bytes des Copy-on-Write-Speichers während des letzten AOF-Neuschreibvorgangs.

  • module_fork_in_progress: Ein Indikator, dass ein Modul-Fork im Gange ist.

  • module_fork_last_cow_size: Die Größe in Bytes des Copy-on-Write-Speichers während des letzten Modul-Fork-Vorgangs.

  • aof_current_size: Die aktuelle Größe der AOF-Datei.

  • aof_base_size: Die Größe der AOF-Datei zum Zeitpunkt des letzten Starts oder der Neuschreibung.

  • aof_pending_rewrite: Ein Indikator, dass ein AOF-Neuschreibvorgang geplant wird, sobald der aktuelle RDB-Speicherprozess abgeschlossen ist.

  • aof_buffer_length: Die Größe des AOF-Puffers.

  • aof_pending_bio_fsync: Die Anzahl der fsync-Jobs, die in der Hintergrund-I/O-Warteschlange anstehen.

  • aof_delayed_fsync: Der Zähler für verzögerte fsync-Operationen.

  • loading_start_time: Der Epoch-Zeitstempel, der den Beginn des Ladevorgangs markiert.

  • loading_total_bytes: Die Gesamtgröße der zu ladenden Datei.

  • loading_rdb_used_mem: Der Speicherverbrauch des Servers, der die RDB-Datei zum Zeitpunkt ihrer Erstellung generiert hat.

  • loading_loaded_bytes: Die Anzahl der bereits geladenen Bytes.

  • loading_loaded_perc: Der Prozentsatz der geladenen Datei.

  • loading_eta_seconds: Die geschätzte verbleibende Zeit in Sekunden, bis der Ladevorgang abgeschlossen ist.

  • instantaneous_ops_per_sec: Die Anzahl der pro Sekunde verarbeiteten Befehle.

  • instantaneous_input_kbps: Die Netzwerkleserate in KB/s.

  • instantaneous_output_kbps: Die Netzwerkschreibrate in KB/s.

  • instantaneous_input_repl_kbps: Die Netzwerkleserate in KB/s für Replikationszwecke.

  • instantaneous_output_repl_kbps: Die Netzwerkschreibrate in KB/s für Replikationszwecke.

  • sync_full: Die Anzahl der vollständigen Resynchronisationen mit Replikaten.

  • sync_partial_ok: Die Anzahl der akzeptierten Anfragen zur Teilresynchronisation.

  • sync_partial_err: Die Anzahl der abgelehnten Anfragen zur Teilresynchronisation.

  • expired_stale_perc: Der Prozentsatz der wahrscheinlich abgelaufenen Schlüssel.

  • expired_time_cap_reached_count: Die Anzahl der Male, die aktive Ablaufzyklen vorzeitig gestoppt wurden.

  • expire_cycle_cpu_milliseconds: Die kumulierte Zeit in Millisekunden, die für aktive Ablaufzyklen aufgewendet wurde.

  • evicted_clients: Die Anzahl der aufgrund des maxmemory-clients-Limits ausgewiesenen Clients.

  • pubsub_channels: Die Gesamtanzahl der Pub/Sub-Kanäle mit aktiven Client-Abonnements.

  • pubsub_patterns: Die Gesamtanzahl der Pub/Sub-Muster mit aktiven Client-Abonnements.

  • pubsubshard_channels: Die Gesamtanzahl der Pub/Sub-Shard-Kanäle mit aktiven Client-Abonnements.

  • latest_fork_usec: Die Dauer in Mikrosekunden des jüngsten Fork-Vorgangs.

  • migrate_cached_sockets: Die Anzahl der für MIGRATE-Zwecke geöffneten Sockets.

  • slave_expires_tracked_keys: Die Anzahl der zur Ablaufverfolgung verfolgten Schlüssel (nur für beschreibbare Replikate anwendbar).

  • active_defrag_hits: Die Anzahl der erfolgreichen Wertneuallokationen, die durch den aktiven Defragmentierungsprozess durchgeführt wurden.

  • active_defrag_misses: Die Anzahl der Wertneuallokationen, die durch den aktiven Defragmentierungsprozess abgebrochen wurden.

  • active_defrag_key_hits: Die Anzahl der aktiv defragmentierten Schlüssel.

  • active_defrag_key_misses: Die Anzahl der während des aktiven Defragmentierungsprozesses übersprungenen Schlüssel.

  • tracking_total_keys: Die Gesamtanzahl der vom Server verfolgten Schlüssel.

  • tracking_total_items: Die Gesamtanzahl der verfolgten Elemente (dies ist die Summe der Anzahl der Clients pro Schlüssel).

  • tracking_total_prefixes: Die Anzahl der im Präfixtabelle des Servers verfolgten Präfixe (nur im Broadcast-Modus anwendbar).

  • role: Gibt "master" zurück, wenn die Instanz kein Replikat ist, oder "slave", wenn sie von einem Master repliziert. Beachten Sie, dass ein Replikat als Master für ein anderes Replikat fungieren kann (Kettenreplikation).

  • master_failover_state: Der aktuelle Zustand eines laufenden Failovers, falls vorhanden.

  • master_replid: Die Replikations-ID des Valkey-Servers.

  • master_replid2: Die sekundäre Replikations-ID, die für PSYNC nach einem Failover verwendet wird.

  • master_repl_offset: Der aktuelle Replikationsversatz des Servers.

  • second_repl_offset: Der Versatz, bis zu dem Replikations-IDs akzeptiert werden.

  • repl_backlog_active: Ein Indikator, ob das Replikations-Backlog aktiv ist.

  • repl_backlog_size: Die Gesamtgröße in Bytes des Replikations-Backlog-Puffers.

  • repl_backlog_first_byte_offset: Der Master-Versatz, der dem ersten Byte im Replikations-Backlog-Puffer entspricht.

  • repl_backlog_histlen: Die Größe in Bytes der im Replikations-Backlog-Puffer enthaltenen Daten.

  • master_host: Der Host oder die IP-Adresse der Master-Instanz.

  • master_port: Der TCP-Port, auf dem der Master lauscht.

  • master_link_status: Der Status des Links (up oder down).

  • master_sync_in_progress: Gibt an, ob der Master derzeit mit einem Replikat synchronisiert wird.

  • slave_read_repl_offset: Der Replikationsversatz, bis zu dem Daten vom Replikat gelesen wurden.

  • slave_repl_offset: Der aktuelle Replikationsversatz der Replikatinstanz.

  • slave_priority: Die Kandidatenpriorität der Instanz für das Failover.

  • slave_read_only: Ein Indikator, ob das Replikat im Nur-Lese-Modus ist.

  • replica_announced: Ein Indikator, ob das Replikat von Sentinel angekündigt wurde.

  • master_sync_total_bytes: Die Gesamtanzahl der während der Synchronisation zu übertragenden Bytes. Dieser Wert kann 0 sein, wenn die Größe unbekannt ist (zum Beispiel bei Verwendung der Konfigurationsrichtlinie repl-diskless-sync).

  • master_sync_read_bytes: Die Anzahl der bereits übertragenen Bytes.

  • master_sync_left_bytes: Die Anzahl der verbleibenden Bytes, die übertragen werden müssen, bevor die Synchronisation abgeschlossen ist (dieser Wert kann negativ sein, wenn master_sync_total_bytes 0 ist).

  • master_sync_perc: Der Prozentsatz der übertragenen Bytes (master_sync_read_bytes) vom Gesamtwert (master_sync_total_bytes) oder eine Annäherung, die loading_rdb_used_mem verwendet, wenn master_sync_total_bytes 0 ist.

  • connected_slaves: Die Anzahl der verbundenen Replikate.

  • min_slaves_good_slaves: Die Anzahl der derzeit als gut für die Replikation angesehenen Replikate.

  • current_eviction_exceeded_time: Die Zeit (in Millisekunden), seit used_memory zuletzt maxmemory überschritten hat.

  • current_active_defrag_time: Die Zeit (in Millisekunden), seit die Speicherfragmentierung zuletzt ihr Limit überschritten hat.

  • master_last_io_seconds_ago: Die Anzahl der Sekunden seit der letzten Interaktion mit dem Master.

  • master_sync_last_io_seconds_ago: Die Anzahl der Sekunden seit dem letzten Transfer-I/O während eines SYNC-Vorgangs.

  • master_link_down_since_seconds: Die Anzahl der Sekunden, seit der Master-Link ausgefallen ist.

  • total_eviction_exceeded_time: Die Gesamtzeit (in Millisekunden), die used_memory seit dem Serverstart größer als maxmemory war.

  • rdb_changes_since_last_save: Die Anzahl der seit dem letzten Dump aufgezeichneten Änderungen.

  • total_connections_received: Die Gesamtanzahl der seit dem Serverstart akzeptierten Verbindungen.

  • total_commands_processed: Die Gesamtanzahl der vom Server verarbeiteten Befehle.

  • total_net_input_bytes: Die Gesamtanzahl der aus dem Netzwerk gelesenen Bytes.

  • total_net_output_bytes: Die Gesamtanzahl der ins Netzwerk geschriebenen Bytes.

  • total_net_repl_input_bytes: Die Gesamtanzahl der aus dem Netzwerk zu Replikationszwecken gelesenen Bytes.

  • total_net_repl_output_bytes: Die Gesamtanzahl der ins Netzwerk zu Replikationszwecken geschriebenen Bytes.

  • rejected_connections: Die Anzahl der abgelehnten Verbindungen, weil das maxclients-Limit erreicht wurde.

  • expired_keys: Die Gesamtanzahl der Schlüsselablaufereignisse.

  • evicted_keys: Die Anzahl der aufgrund des maxmemory-Limits ausgewiesenen Schlüssel.

  • keyspace_hits: Die Anzahl der erfolgreichen Schlüsselabfragen im Hauptwörterbuch.

  • keyspace_misses: Die Anzahl der fehlgeschlagenen Schlüsselabfragen im Hauptwörterbuch.

  • used_cpu_sys: Die vom System verbrauchte CPU-Zeit (in Sekunden) durch Valkey, summiert über alle Threads (Haupt- und Hintergrundthreads).

  • used_cpu_user: Die vom Benutzer verbrauchte CPU-Zeit (in Sekunden) durch Valkey, summiert über alle Threads.

  • used_cpu_sys_children: Die vom System verbrauchte CPU-Zeit (in Sekunden) durch Hintergrundprozesse.

  • used_cpu_user_children: Die vom Benutzer verbrauchte CPU-Zeit (in Sekunden) durch Hintergrundprozesse.

  • used_cpu_sys_main_thread: Die vom Hauptthread des Valkey-Servers verbrauchte System-CPU-Zeit.

  • used_cpu_user_main_thread: Die vom Hauptthread des Valkey-Servers verbrauchte Benutzer-CPU-Zeit.

  • unexpected_error_replies: Die Anzahl der unerwarteten Fehlermeldungen, die typischerweise während AOF-Ladevorgängen oder Replikationsfehlern auftreten.

  • total_error_replies: Die Gesamtanzahl der ausgegebenen Fehlermeldungen. Dieser Wert umfasst sowohl Fehler vor der Befehlsausführung (abgelehnte Befehle) als auch Fehler, die während der Befehlsausführung auftreten (fehlgeschlagene Befehle).

  • total_reads_processed: Die Gesamtanzahl der verarbeiteten Leseereignisse.

  • total_writes_processed: Die Gesamtanzahl der verarbeiteten Schreibereignisse.

  • io_threaded_reads_processed: Die Anzahl der von Haupt- und I/O-Threads bearbeiteten Leseereignisse.

  • io_threaded_writes_processed: Die Anzahl der von Haupt- und I/O-Threads bearbeiteten Schreibereignisse.

  • dump_payload_sanitizations: Die Gesamtanzahl der tiefen Integritätsprüfungen, die an Dump-Payloads durchgeführt wurden (wie in sanitize-dump-payload konfiguriert).

  • total_forks: Die Gesamtanzahl der Fork-Vorgänge seit dem Serverstart.

  • total_active_defrag_time: Die Gesamtzeit (in Millisekunden), die die Speicherfragmentierung das festgelegte Limit überschritten hat.

  • aof_rewrites: Die Anzahl der seit dem Start durchgeführten AOF-Neuschreibvorgänge.

  • rdb_saves: Die Anzahl der seit dem Start durchgeführten RDB-Snapshots.