
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
In questo lab possiedi un parco taxi di New York e vuoi monitorare l'andamento della tua attività in tempo reale. Creerai una pipeline di dati in modalità flusso per acquisire le entrate dei taxi, il numero di passeggeri, lo stato delle corse e molto altro, quindi visualizzerai i risultati in una dashboard di gestione.
In questo lab imparerai a:
Per ciascun lab, riceverai un nuovo progetto Google Cloud e un insieme di risorse per un periodo di tempo limitato senza alcun costo aggiuntivo.
Fai clic sul pulsante Avvia lab. Se devi effettuare il pagamento per il lab, si apre una finestra popup per permetterti di selezionare il metodo di pagamento. A sinistra, trovi il riquadro Dettagli lab con le seguenti informazioni:
Fai clic su Apri console Google Cloud (o fai clic con il tasto destro del mouse e seleziona Apri link in finestra di navigazione in incognito se utilizzi il browser Chrome).
Il lab avvia le risorse e apre un'altra scheda con la pagina di accesso.
Suggerimento: disponi le schede in finestre separate posizionate fianco a fianco.
Se necessario, copia il Nome utente di seguito e incollalo nella finestra di dialogo di accesso.
Puoi trovare il Nome utente anche nel riquadro Dettagli lab.
Fai clic su Avanti.
Copia la Password di seguito e incollala nella finestra di dialogo di benvenuto.
Puoi trovare la Password anche nel riquadro Dettagli lab.
Fai clic su Avanti.
Fai clic nelle pagine successive:
Dopo qualche istante, la console Google Cloud si apre in questa scheda.
Google Cloud Shell è una macchina virtuale in cui sono caricati strumenti per sviluppatori. Offre una home directory permanente da 5 GB e viene eseguita su Google Cloud.
Google Cloud Shell fornisce l'accesso da riga di comando alle risorse Google Cloud.
Nella barra degli strumenti in alto a destra della console Cloud, fai clic sul pulsante Apri Cloud Shell.
Fai clic su Continua.
Bastano pochi istanti per eseguire il provisioning e connettersi all'ambiente. Quando la connessione è attiva, l'autenticazione è già avvenuta e il progetto è impostato sul tuo PROJECT_ID. Ad esempio:
gcloud è lo strumento a riga di comando di Google Cloud. È preinstallato su Cloud Shell e supporta il completamento.
Output:
Output di esempio:
Output:
Output di esempio:
In questa attività, creerai il set di dati taxirides
. Hai due diverse opzioni per crearlo: Google Cloud Shell o la console Google Cloud.
In questo lab utilizzerai un estratto del set di dati aperto della NYC Taxi & Limousine Commission. Un piccolo file di dati separato da virgole verrà utilizzato per simulare aggiornamenti periodici dei dati sui taxi.
BigQuery è un data warehouse serverless. Le tabelle in BigQuery sono organizzate in set di dati. In questo lab i dati sui taxi verranno inviati in modalità flusso dal file autonomo tramite Dataflow per essere archiviati in BigQuery. Con questa configurazione, qualsiasi nuovo file di dati depositato nel bucket Cloud Storage di origine verrebbe automaticamente elaborato per il caricamento.
Utilizza una delle seguenti opzioni per creare un nuovo set di dati BigQuery:
taxirides
.taxirides.realtime
(schema vuoto a cui invierai dati in modalità flusso in seguito).Nella console Google Cloud, nel menu di navigazione(), fai clic su BigQuery.
Se viene visualizzata la finestra di dialogo di benvenuto, fai clic su Fine.
Fai clic su Visualizza azioni () accanto al tuo ID progetto, quindi su Crea set di dati.
In ID set di dati, digita taxirides.
In Località dei dati, seleziona:
Quindi, fai clic su Crea set di dati.
Nel riquadro Explorer, fai clic su Espandi nodo () per visualizzare il nuovo set di dati taxirides.
Fai clic sull'icona Visualizza azioni () accanto al set di dati taxirides, quindi su Apri.
Fai clic su Crea tabella.
In Tabella, digita realtime
Per lo schema, fai clic su Modifica come testo e incolla quanto segue:
In Impostazioni di partizionamento e clustering, seleziona timestamp.
Fai clic su Crea tabella.
In questa attività, sposterai i file richiesti nel tuo progetto.
Cloud Storage permette di archiviare e recuperare qualsiasi volume di dati in qualsiasi momento a livello globale. Puoi utilizzare Cloud Storage per scenari diversi, tra cui pubblicazione di contenuti di siti web, archiviazione di dati e disaster recovery o distribuzione agli utenti di oggetti di dati di grandi dimensioni tramite download diretto.
Durante l'avvio del lab è stato creato un bucket Cloud Storage per te.
In questa attività, configurerai una pipeline di dati in modalità flusso per leggere i file del bucket Cloud Storage e scrivere dati in BigQuery.
Dataflow è una modalità serverless per eseguire l'analisi dei dati.
Nella console Cloud, nel menu di navigazione (), fai clic su Visualizza tutti i prodotti > Analytics > Dataflow.
Nella barra dei menu in alto, fai clic su Crea job da modello.
Digita streaming-taxi-pipeline come nome per il tuo job Dataflow.
In Endpoint a livello di regione, seleziona
Fai clic su Parametri obbligatori.
In Posizione temporanea, utilizzata per la scrittura di file temporanei, incolla o digita:
In N. massimo di worker, digita 2.
In Numero di worker, digita 1.
Deseleziona Usa il tipo di macchina predefinito.
In Uso generico, scegli le seguenti opzioni:
Serie: E2
Tipo di macchina: e2-medium (2 vCPU, 4 GB di memoria)
È stato avviato un nuovo job in modalità flusso. Ora puoi visualizzare una rappresentazione visiva della pipeline di dati. Serviranno dai 3 ai 5 minuti prima che i dati inizino a spostarsi in BigQuery.
In questa attività, analizzerai i dati durante l'elaborazione in modalità flusso.
Nella console Cloud, nel menu di navigazione (), fai clic su BigQuery.
Se viene visualizzata la finestra di dialogo di benvenuto, fai clic su Fine.
In Editor di query, digita quanto segue, quindi fai clic su Esegui:
Dovresti vedere un output simile al seguente:
In questa attività, calcolerai le aggregazioni nel flusso per il reporting.
In Editor di query, cancella la query attuale.
Copia e incolla questa query e fai clic su Esegui.
Il risultato mostra i parametri chiave al minuto per ogni corsa del taxi.
Fai clic su Salva > Salva query.
Nella finestra di dialogo Salva query, nel campo Nome, digita Query salvata personale.
In Regione, assicurati che la regione corrisponda a quella del lab Qwiklabs.
Fai clic su Salva.
In questa attività, arresterai il job Dataflow per liberare risorse per il tuo progetto.
Nella console Cloud, nel menu di navigazione (), fai clic su Visualizza tutti i prodotti > Analytics > Dataflow.
Fai clic su streaming-taxi-pipeline o sul nome del nuovo job.
Fai clic su Arresta, quindi seleziona Annulla > Arresta job.
In questa attività, creerai una dashboard in tempo reale per visualizzare i dati.
Nella console Cloud, nel menu di navigazione (), fai clic su BigQuery.
Nel riquadro Explorer, espandi il tuo ID progetto.
Espandi Query, quindi fai clic su Query salvata personale.
La tua query viene caricata nell'editor di query.
Fai clic su Esegui.
Nella sezione Risultati delle query, fai clic su Apri in > Looker Studio.
Viene visualizzato Looker Studio. Fai clic su Inizia.
Nella finestra Looker Studio, fai clic sul grafico a barre.
(
Viene visualizzato il riquadro Grafico.
Fai clic su Aggiungi un grafico, quindi seleziona Grafico combinato.
Nel riquadro Configurazione, in Dimensione intervallo di dati, passa il mouse sopra la voce minute (Date) e fai clic su X per rimuoverla.
Nel riquadro Dati, seleziona la voce dashboard_sort e trascinala in Configurazione > Dimensione intervallo di dati > Aggiungi dimensione.
In Configurazione > Dimensione, fai clic su minute, quindi seleziona dashboard_sort.
In Configurazione > Metrica, fai clic su dashboard_sort, quindi seleziona total_rides.
In Configurazione > Metrica, fai clic su Conteggio record, quindi seleziona total_passengers.
In Configurazione > Metrica, fai clic su Aggiungi metrica, quindi seleziona total_revenue.
In Configurazione > Ordina, fai clic su total_rides, quindi seleziona dashboard_sort.
In Configurazione > Ordina, fai clic su Crescente.
Il grafico dovrebbe essere simile a questo:
Quando la dashboard ti soddisfa, fai clic su Salva e condividi per salvare questa origine dati.
Se ti viene richiesto di completare la configurazione dell'account, digita i dettagli del paese e dell'azienda, accetta i termini e le condizioni, quindi fai clic su Continua.
Se ti viene chiesto di specificare quali aggiornamenti vuoi ricevere, rispondi no a tutti, quindi fai clic su Continua.
Se viene visualizzata la finestra Verifica l'accesso ai dati prima di salvare, fai clic su Accetta e salva.
Se ti viene chiesto di scegliere un account, seleziona il tuo Account studente.
Ogni volta che un utente visita la tua dashboard, sarà aggiornato con le ultime transazioni. Puoi provarlo tu stesso facendo clic su Altre opzioni (), quindi su Aggiorna dati.
In questa attività, creerai un grafico delle serie temporali.
Fai clic su questo link a Looker Studio per aprire Looker Studio in una nuova scheda del browser.
Nella pagina Report, nella sezione Inizia con un modello, fai clic sul modello [+] Report vuoto.
Si apre un nuovo report vuoto con la finestra Aggiungi dati al report.
Dall'elenco Connettori Google, seleziona il riquadro BigQuery.
Fai clic su Query personalizzata, quindi seleziona il tuo ProjectID. Dovrebbe apparire nel formato qwiklabs-gcp-xxxxxxx.
In Inserisci query personalizzata, incolla questa query:
Fai clic su Aggiungi > Aggiungi al report.
Viene visualizzato un nuovo report senza titolo. Il completamento dell'aggiornamento dello schermo potrebbe richiedere fino a un minuto.
Nel riquadro Dati, fai clic su Aggiungi un campo > Aggiungi campo calcolato.
Fai clic su Tutti i campi nell'angolo a sinistra.
Modifica il tipo di campo timestamp in Data e ora > Data, ora e minuti (AAAAMMGGhhmm).
Nella finestra di dialogo per la modifica del timestamp, fai clic su Continua, quindi su Fine.
Nel menu in alto, fai clic su Aggiungi un grafico.
Scegli Grafico serie temporali.
Posiziona il grafico nell'angolo in basso a sinistra, nello spazio vuoto.
In Configurazione > Dimensione, fai clic su timestamp (Date), quindi seleziona timestamp.
In Configurazione > Dimensione, fai clic su timestamp, quindi seleziona calendar.
In Tipo di dati, seleziona Data e ora > Data, ora e minuti.
Fai clic all'esterno della finestra di dialogo per chiuderla. Non devi aggiungere un nome.
In Configurazione > Metrica, fai clic su Conteggio record, quindi seleziona meter reading.
In questo lab hai utilizzato Dataflow per inviare dati in modalità flusso da una pipeline a BigQuery.
Una volta completato il lab, fai clic su Termina lab. Google Cloud Skills Boost rimuove le risorse che hai utilizzato ed esegue la pulizia dell'account.
Avrai la possibilità di inserire una valutazione in merito alla tua esperienza. Seleziona il numero di stelle applicabile, inserisci un commento, quindi fai clic su Invia.
Il numero di stelle corrisponde alle seguenti valutazioni:
Se non vuoi lasciare un feedback, chiudi la finestra di dialogo.
Per feedback, suggerimenti o correzioni, utilizza la scheda Assistenza.
Copyright 2024 Google LLC Tutti i diritti riservati. Google e il logo Google sono marchi di Google LLC. Tutti gli altri nomi di società e prodotti sono marchi delle rispettive società a cui sono associati.
Questi contenuti non sono al momento disponibili
Ti invieremo una notifica via email quando sarà disponibile
Bene.
Ti contatteremo via email non appena sarà disponibile
One lab at a time
Confirm to end all existing labs and start this one