arrow_back

Concetti fondamentali di Google Cloud: introduzione a BigQuery

Accedi Partecipa
Metti alla prova le tue conoscenze e condividile con la nostra community.
done
Accedi a oltre 700 lab pratici, badge delle competenze e corsi

Concetti fondamentali di Google Cloud: introduzione a BigQuery

Lab 30 minuti universal_currency_alt 5 crediti show_chart Introduttivi
info Questo lab potrebbe incorporare strumenti di AI a supporto del tuo apprendimento.
Metti alla prova le tue conoscenze e condividile con la nostra community.
done
Accedi a oltre 700 lab pratici, badge delle competenze e corsi

Panoramica

In questo lab caricherai il log di un server web in una tabella BigQuery. Dopo aver caricato i dati, eseguirai una query usando l'interfaccia utente web e l'interfaccia a riga di comando di BigQuery.

BigQuery aiuta a eseguire l'analisi interattiva di database su scala petabyte e consente un'analisi quasi in tempo reale di enormi set di dati. Offre un linguaggio di query e funzioni SQL 2011 con cui hai già familiarità.

I dati archiviati in BigQuery sono a elevata durabilità. Google archivia i dati replicandoli per impostazione predefinita, senza costi aggiuntivi per le repliche. Con BigQuery, paghi solo per le risorse che utilizzi. L'archiviazione di dati in BigQuery è economica. I costi delle query vengono addebitati in base alla quantità di dati elaborati: quando invii una query, paghi per i nodi di calcolo solo per la durata della query stessa. Non devi pagare per mantenere operativo un cluster di calcolo.

L'utilizzo di BigQuery prevede l'interazione con varie risorse Google Cloud Platform, tra cui progetti (trattati in altre sezioni di questo corso), set di dati, tabelle e job. Questo lab offre una breve introduzione ad alcune di queste risorse e ne riepiloga il ruolo nell'ambito dell'interazione con BigQuery.

Set di dati: un set di dati è un meccanismo di raggruppamento che può non contenere alcuna tabella o contenerne un numero vario ed è l'unità di livello inferiore del controllo dell'accesso. I set di dati sono di proprietà dei progetti GCP. Ogni set di dati può essere condiviso con singoli utenti.

Tabella: una tabella è una struttura a righe e colonne che contiene i dati. Ogni tabella ha uno schema che descrive le colonne altamente tipizzate di valori e appartiene a un set di dati.

Obiettivi

In questo lab imparerai a eseguire le attività seguenti:

  • Caricare i dati in BigQuery da Cloud Storage.

  • Eseguire una query sui dati in BigQuery.

Attività 1: accedi alla console di Google Cloud Platform (GCP)

Per ciascun lab, riceverai un nuovo progetto Google Cloud e un insieme di risorse per un periodo di tempo limitato senza alcun costo aggiuntivo.

  1. Accedi a Qwiklabs utilizzando una finestra di navigazione in incognito.

  2. Tieni presente la durata dell'accesso al lab (ad esempio, 1:15:00) e assicurati di finire entro quell'intervallo di tempo.
    Non è disponibile una funzionalità di pausa. Se necessario, puoi riavviare il lab ma dovrai ricominciare dall'inizio.

  3. Quando è tutto pronto, fai clic su Inizia lab.

  4. Annota le tue credenziali del lab (Nome utente e Password). Le userai per accedere a Google Cloud Console.

  5. Fai clic su Apri console Google.

  6. Fai clic su Utilizza un altro account e copia/incolla le credenziali per questo lab nei prompt.
    Se utilizzi altre credenziali, compariranno errori oppure ti verranno addebitati dei costi.

  7. Accetta i termini e salta la pagina di ripristino delle risorse.

Prendi nota se la tua area geografica assegnata è più vicina agli Stati Uniti o all'Europa.

Attività 2: carica i dati in BigQuery da Cloud Storage

  1. Nel menu di navigazione (Menu di navigazione) della console, fai clic su BigQuery e poi su Fine.

  2. Crea un nuovo set di dati all'interno del progetto facendo clic sull'icona Visualizza azioni accanto all'ID progetto nella sezione Explorer. Seleziona quindi Crea set di dati.

  3. Nella finestra di dialogo Crea set di dati, digita logdata in corrispondenza di ID set di dati.

  4. Per Località dei dati, seleziona Stati Uniti (US). Fai clic su Crea set di dati.

  5. Crea una nuova tabella in logdata per archiviare i dati del file CSV.

  6. Espandi l'ID progetto e fai clic sull'icona Visualizza azioni accanto al set di dati logdata. Seleziona quindi Apri.

  7. Fai clic su Crea tabella. Nella sezione Origine della pagina Crea tabella:

  • Per Crea tabella da, seleziona Google Cloud Storage e digita gs://cloud-training/gcpfci/access_log.csv nel campo.
  • Verifica che Formato file sia impostato su CSV.
Nota: se in precedenza hai creato una tabella, l'opzione Crea da job precedente consente di riutilizzare le impostazioni per creare tabelle simili in modo rapido.
  1. Nella sezione Destinazione:

  • Per Nome set di dati, lascia selezionato logdata.

  • Per Nome tabella, digita accesslog.

  • Per Tipo di tabella dovrebbe essere selezionato Tabella nativa.

  1. Nella sezione Schema, contrassegna Parametri di schema e input per Rilevamento automatico.

  2. Accetta i valori predefiniti rimanenti e fai clic su Crea tabella.

    BigQuery crea un job di caricamento per creare una tabella e caricarvi i dati (questa operazione potrebbe richiedere qualche secondo).

  3. (Facoltativo) Per monitorare l'avanzamento del job, fai clic su Cronologia dei job.

  4. Quando il job di caricamento è completo, fai clic su logdata > accesslog.

  5. Nella pagina dei dettagli della tabella, fai clic su Dettagli per visualizzare le proprietà della tabella e quindi su Anteprima per visualizzare i dati della tabella.

    Ciascuna riga della tabella registra un riscontro su un server web. Il primo campo, string_field_0, corrisponde all'indirizzo IP del client. I campi dal quarto al nono registrano il giorno, il mese, l'anno, l'ora, i minuti e i secondi in cui si è verificato il riscontro. In questa attività imparerai il pattern giornaliero di caricamento su questo server web.

Fai clic su Controlla i miei progressi per verificare l'obiettivo. Carica i dati in BigQuery da Cloud Storage

Attività 3: esegui una query sui dati utilizzando l'interfaccia utente web di BigQuery

In questa sezione del lab userai l'interfaccia utente web di BigQuery per eseguire una query sulla tabella accesslog che hai creato in precedenza.

  1. Nell'editor delle query, digita (o copia e incolla) la seguente query:

  2. Dato che hai indicato a BigQuery di individuare in automatico lo schema quando carichi i dati, il campo int_field_6 include l'ora del giorno in cui si è verificato ciascun riscontro web.

    select int64_field_6 as hour, count(*) as hitcount from logdata.accesslog
    group by hour
    order by hour
    

    Noterai che lo strumento di convalida delle query ti comunica che la sintassi della query è valida (segno di spunta verde) e indica la quantità di dati che verranno elaborati dalla query. La quantità di dati elaborati ti consente di stabilire il costo della query utilizzando il Calcolatore prezzi di Google Cloud Platform.

  3. Fai clic su Esegui ed esamina i risultati. In quale ora del giorno c'è più traffico sul sito web? E in quale ce n'è meno?

Attività 4: esegui una query sui dati utilizzando il comando bq

In questa sezione del lab userai il comando bq in Cloud Shell per eseguire una query sulla tabella accesslog che hai creato in precedenza.

  1. Nella console di Google Cloud Platform, fai clic su Attiva Cloud Shell Attiva Cloud Shell e quindi su Continua.

  2. Nel prompt di Cloud Shell inserisci il seguente comando:

    bq query "select string_field_10 as request, count(*) as requestcount from logdata.accesslog group by request order by requestcount desc"
    

    La prima volta che utilizzi il comando bq, questo acquisisce le tue credenziali Google Cloud Platform e ti chiede di scegliere il progetto predefinito. Scegli il progetto che ti è stato assegnato in Qwiklabs. Il nome include qwiklabs-gcp- seguito da un numero esadecimale.

    Il comando bq esegue quindi l'azione richiesta sulla riga di comando. Quale URL offerto da questo server web è il più popolare? E qual è il meno popolare?

Complimenti!

In questo lab hai caricato i dati archiviati in Cloud Storage in una tabella ospitata da Google BigQuery. Hai poi eseguito una query sui dati per individuare i pattern.

Termina il lab

Una volta completato il lab, fai clic su Termina lab. Google Cloud Skills Boost rimuove le risorse che hai utilizzato ed esegue la pulizia dell'account.

Avrai la possibilità di inserire una valutazione in merito alla tua esperienza. Seleziona il numero di stelle applicabile, inserisci un commento, quindi fai clic su Invia.

Il numero di stelle corrisponde alle seguenti valutazioni:

  • 1 stella = molto insoddisfatto
  • 2 stelle = insoddisfatto
  • 3 stelle = esperienza neutra
  • 4 stelle = soddisfatto
  • 5 stelle = molto soddisfatto

Se non vuoi lasciare un feedback, chiudi la finestra di dialogo.

Per feedback, suggerimenti o correzioni, utilizza la scheda Assistenza.

Copyright 2020 Google LLC Tutti i diritti riservati. Google e il logo Google sono marchi di Google LLC. Tutti gli altri nomi di società e prodotti sono marchi delle rispettive società a cui sono associati.

Questi contenuti non sono al momento disponibili

Ti invieremo una notifica via email quando sarà disponibile

Bene.

Ti contatteremo via email non appena sarà disponibile