Monitorare le istanze con Cloud Monitoring

Questo documento descrive come utilizzare la console Cloud Monitoring per monitorare le istanze Spanner.

La console di Cloud Monitoring offre vari strumenti di monitoraggio Spanner:

Se preferisci monitorare Spanner in modo programmatico, utilizza il client Cloud Librerie per il recupero da parte di Cloud Monitoring metriche di valutazione.

Utilizza la dashboard selezionata di Cloud Monitoring

Cloud Monitoring fornisce una dashboard selezionata che riassume le informazioni chiave sulle tue istanze Spanner, tra cui:

  • Incidenti: avvisi di monitoraggio creati dall'utente che sono aperti, attivi o risolto
  • Eventi: un elenco di log di controllo di Spanner (se abilitati e disponibile)
  • Istanze: un riepilogo generale delle tue istanze Spanner, tra cui capacità di calcolo, conteggio dei database e integrità delle istanze
  • Grafici aggregati sulla velocità effettiva e sull'utilizzo dello spazio di archiviazione

Per visualizzare la dashboard di Spanner, segui questi passaggi:

  1. Nella console Google Cloud, seleziona Monitoring o utilizza seguente pulsante:

    Vai a Monitoring

  2. Se nel riquadro di navigazione è visualizzata la voce Risorse, seleziona Risorse. e poi seleziona Cloud Spanner. In caso contrario, seleziona Dashboard e poi la dashboard Cloud Spanner.

Visualizza i dettagli dell'istanza e del database

Quando apri la dashboard selezionata per Spanner, vengono mostrati i dati aggregati di tutte le tue istanze. Puoi visualizzare ulteriori dettagli su una facendo clic sul nome dell'istanza in Istanze.

La dashboard mostra informazioni quali metadati dell'istanza, database nell'istanza e grafici di varie metriche suddivise per regione.

Dalla pagina della dashboard dell'istanza, puoi anche visualizzare i grafici per un database specifico nell'istanza:

  1. Sul lato destro, sopra i grafici delle metriche dell'istanza, fai clic su Database metriche.

  2. Nell'elenco a discesa Seleziona un'analisi, seleziona il database che vuoi esaminare.

    La console Cloud Monitoring mostra i grafici per il database.

Creare grafici personalizzati per le metriche di Spanner

Puoi utilizzare Cloud Monitoring per creare grafici personalizzati per Spanner metriche di valutazione. Puoi utilizzare Metrics Explorer per creare grafici temporanei ad hoc, puoi creare grafici da visualizzare nelle dashboard personalizzate.

In particolare, Cloud Monitoring ti consente di creare un grafico personalizzato che mostra se due o più metriche sono correlate tra loro. Ad esempio: puoi verificare una correlazione tra utilizzo CPU e latenza in un'istanza Spanner, il che potrebbe indicare che la tua un'istanza richiede più capacità di calcolo o che alcune query causando un elevato utilizzo della CPU.

Per iniziare a utilizzare questo esempio, segui questi passaggi:

  1. Nella console Google Cloud, seleziona Monitoraggio o utilizza il pulsante seguente:

    Vai a Monitoring

  2. Se nel riquadro di navigazione viene visualizzato Esplora metriche, selezionalo. Altrimenti, seleziona Risorse e poi Esplora metriche.

  3. Fai clic sulla scheda Opzioni di visualizzazione, poi seleziona Scala logaritmica sull'asse Y. casella di controllo. Questa opzione ti consente di confrontare più metriche quando una sola ha molto più grandi degli altri.

  4. Nell'elenco a discesa sopra il riquadro a destra, seleziona Linea.

  5. Fai clic sulla scheda Metriche. Ora puoi aggiungere metriche al grafico.

Per aggiungere metriche di latenza al grafico:

  1. Nella casella Trova tipo di risorsa e metrica, inserisci il valore spanner.googleapis.com/api/request_latencies, poi fai clic sulla riga visualizzata sotto la casella.
  2. Nella casella Filtro, inserisci il valore instance_id, quindi inserisci l'istanza all'ID che vuoi esaminare e fai clic su Applica.
  3. Nell'elenco a discesa Aggregatore, fai clic su Massimo.
  4. (Facoltativo) Modifica il percentile di latenza:

    1. Fai clic su Mostra opzioni avanzate.
    2. Fai clic sull'elenco a discesa Allineatore, quindi sul percentile di latenza che vuoi visualizzare.

      Nella maggior parte dei casi, occorre considerare la latenza del 50° percentile, comprendi la quantità tipica di latenza, ovvero il 99° percentile per comprendere la latenza dell'1% più lento delle richieste.

Per aggiungere metriche di utilizzo della CPU al grafico, segui questi passaggi:

  1. Fai clic su Aggiungi metrica.
  2. Nella casella Trova tipo di risorsa e metrica, inserisci il valore spanner.googleapis.com/instance/cpu/utilization, poi fai clic sulla riga sotto la casella.
  3. Nella casella Filtro, inserisci il valore instance_id, quindi inserisci l'istanza all'ID che vuoi esaminare e fai clic su Applica.
  4. Nell'elenco a discesa Aggregatore, fai clic su max.

Ora hai un grafico che mostra le metriche di utilizzo della CPU e di latenza per un'istanza Spanner. Se entrambe le metriche sono superiori al previsto allo stesso puoi adottare ulteriori misure per correggere problema.

Per saperne di più sulla creazione di grafici personalizzati, consulta la documentazione di Cloud Monitoring.

Creare avvisi per le metriche Spanner

Quando crei un'istanza di Spanner, scegli il tipo capacità di calcolo per l'istanza. Quando il carico di lavoro dell'istanza cambia, Spanner non regola automaticamente la capacità di calcolo dell'istanza. Di conseguenza, devi configurare diversi avvisi per assicurarti che l'istanza rimanga all'interno dei valori massimi consigliati per l'utilizzo della CPU e del limite consigliato per lo spazio di archiviazione.

I seguenti esempi mostrano come configurare i criteri di avviso per alcune metriche Spanner. Per un elenco completo delle metriche disponibili, consulta l'elenco delle metriche per Spanner.

CPU ad alta priorità

Per creare un criterio di avviso che si attivi quando l'utilizzo della CPU ad alta priorità per Spanner supera una soglia consigliata, utilizza le impostazioni seguenti.

Campo Nuova condizione

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Utilizzo CPU per priorità.

(il valore metric.type è spanner.googleapis.com/instance/cpu/utilization_by_priority).
Filtro instance_id = YOUR_INSTANCE_ID
priority = high
Tra serie temporali
Raggruppa serie temporali per
location per le istanze multiregionali.
lascia il campo vuoto per le istanze a livello di regione.
Tra serie temporali
Aggregazione di serie temporali
sum
Finestra scorrevole 10 m
Funzione finestra temporale continua mean
Campo Configura trigger di avviso

Valore
Tipo di condizione Threshold
Trigger di avviso Any time series violates
Posizione soglia Above threshold
Valore soglia 45% per le istanze multiregione;
65% per le istanze regionali.
Finestra di ripetizione test 10 minutes

Media mobile di 24 ore di CPU

Per creare un criterio di avviso che si attiva quando la media mobile di 24 ore della CPU per Spanner è superiore a una soglia consigliata, utilizza le seguenti impostazioni.

Campo Nuova condizione

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Utilizzo CPU smussato.

(metric.type è spanner.googleapis.com/instance/cpu/smoothed_utilization).
Filtro instance_id = YOUR_INSTANCE_ID
Tra serie temporali
Aggregazione di serie temporali
sum
Finestra scorrevole 10 m
Funzione finestra temporale continua mean
Campo Configura trigger di avviso

Valore
Tipo di condizione Threshold
Trigger di avviso Any time series violates
Posizione soglia Above threshold
Soglia 90%
Finestra di ripetizione test 10 minutes

Spazio di archiviazione

Per creare un criterio di avviso che si attiva quando lo spazio di archiviazione per l'istanza Spanner supera una soglia consigliata, utilizza le seguenti impostazioni.

Campo Nuova condizione

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Spazio di archiviazione utilizzato.

(il valore metric.type è spanner.googleapis.com/instance/storage/utilization).
Filtro instance_id = YOUR_INSTANCE_ID
Tra serie temporali
Aggregazione di serie temporali
sum
Finestra scorrevole 10 m
Funzione finestra temporale continua max
Campo Configura trigger di avviso

Valore
Tipo di condizione Threshold
La condizione si attiva se Any time series violates
Posizione soglia Above threshold
Valore soglia Non è necessario impostare una soglia specifica per lo spazio di archiviazione massimo per nodo. Tuttavia, ti consigliamo di impostare un avviso quando raggiungi il limite di spazio di archiviazione massimo. Per saperne di più, vedi Metriche di utilizzo dello spazio di archiviazione.
Finestra di ripetizione test 10 minutes

Passaggi successivi