
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create a Cloud Storage bucket
/ 50
Run an Example Pipeline Remotely
/ 50
L'SDK Apache Beam è un modello di programmazione open source per pipeline di dati. In Google Cloud, puoi definire una pipeline con un programma Apache Beam e poi utilizzare Dataflow per eseguire la pipeline.
In questo lab configurerai l'ambiente di sviluppo Python per Dataflow (utilizzando l'SDK Apache Beam per Python) ed eseguirai una pipeline Dataflow di esempio.
In questo lab imparerai a:
Leggi le seguenti istruzioni. I lab sono a tempo e non possono essere messi in pausa. Il timer si avvia quando fai clic su Avvia lab e ti mostra per quanto tempo avrai a disposizione le risorse Google Cloud.
Con questo lab pratico avrai la possibilità di completare le attività in prima persona, in un ambiente cloud reale e non di simulazione o demo. Riceverai delle nuove credenziali temporanee che potrai utilizzare per accedere a Google Cloud per la durata del lab.
Per completare il lab, avrai bisogno di:
Fai clic sul pulsante Avvia lab. Se devi effettuare il pagamento per il lab, si aprirà una finestra di dialogo per permetterti di selezionare il metodo di pagamento. A sinistra, trovi il riquadro Dettagli lab con le seguenti informazioni:
Fai clic su Apri console Google Cloud (o fai clic con il tasto destro del mouse e seleziona Apri link in finestra di navigazione in incognito se utilizzi il browser Chrome).
Il lab avvia le risorse e apre un'altra scheda con la pagina di accesso.
Suggerimento: disponi le schede in finestre separate posizionate fianco a fianco.
Se necessario, copia il Nome utente di seguito e incollalo nella finestra di dialogo di accesso.
Puoi trovare il Nome utente anche nel riquadro Dettagli lab.
Fai clic su Avanti.
Copia la Password di seguito e incollala nella finestra di dialogo di benvenuto.
Puoi trovare la Password anche nel riquadro Dettagli lab.
Fai clic su Avanti.
Fai clic nelle pagine successive:
Dopo qualche istante, la console Google Cloud si apre in questa scheda.
Cloud Shell è una macchina virtuale in cui sono caricati strumenti per sviluppatori. Offre una home directory permanente da 5 GB e viene eseguita su Google Cloud. Cloud Shell fornisce l'accesso da riga di comando alle risorse Google Cloud.
Quando la connessione è attiva, l'autenticazione è già avvenuta e il progetto è impostato sul tuo PROJECT_ID. L'output contiene una riga che dichiara il PROJECT_ID per questa sessione:
gcloud
è lo strumento a riga di comando di Google Cloud. È preinstallato su Cloud Shell e supporta il completamento tramite tasto Tab.
Fai clic su Autorizza.
L'output dovrebbe avere ora il seguente aspetto:
Output:
Output:
Output di esempio:
gcloud
, in Google Cloud, fai riferimento alla Panoramica dell'interfaccia a riga di comando gcloud.
Per garantire l'accesso all'API necessaria, riavvia la connessione all'API Dataflow.
Nella console Cloud, inserisci "API Dataflow" nella barra di ricerca in alto. Fai clic sul risultato per API Dataflow.
Fai clic su Gestisci.
Fai clic su Disabilita API.
Se ti viene chiesto di confermare, fai clic su Disabilita.
Quando l'API è stata nuovamente abilitata, la pagina mostrerà l'opzione per disabilitare.
Quando esegui una pipeline utilizzando Dataflow, i risultati vengono archiviati in un bucket Cloud Storage. In questa attività creerai un bucket Cloud Storage per i risultati della pipeline che eseguirai in un'attività successiva.
us
Fai clic su Crea.
Se appare il messaggio L'accesso pubblico verrà vietato fai clic su Conferma.
Verifica l'attività completata
Fai clic su Controlla i miei progressi per verificare l'attività eseguita. Se hai completato correttamente l'attività, riceverai un punteggio di valutazione.
Python3.9
:Il comando estrae un container Docker con l'ultima versione stabile di Python 3.9, quindi apre una shell dei comandi per eseguire questi comandi all'interno del container.
Verranno visualizzati alcuni avvisi correlati alle dipendenze che, in questo lab, possono essere ignorati.
wordcount.py
in locale utilizzando il comando seguente:È possibile che venga visualizzato un messaggio simile al seguente:
Questo messaggio può essere ignorato.
OUTPUT_FILE
:OUTPUT_FILE
ed esegui il comando cat
sul file:Nei risultati è visualizzata ciascuna parola presente nel file e quante volte compare.
wordcount.py
in remoto:Attendi finché nell'output non viene visualizzato questo messaggio:
Quindi continua con il lab.
Inizialmente dovresti vedere il tuo job wordcount con stato In esecuzione.
Quando lo stato visualizzato è Riuscito, il processo è stato completato.
Verifica l'attività completata
Fai clic su Controlla i miei progressi per verificare l'attività eseguita. Se hai completato correttamente l'attività, riceverai un punteggio di valutazione.
Fai clic su Menu di navigazione > Cloud Storage nella console Google Cloud.
Fai clic sul nome del bucket. Nel bucket dovresti vedere le directory results e staging.
Fai clic sulla cartella results. Dovresti vedere i file di output creati dal job:
Fai clic su un file per vedere i conteggi delle parole al suo interno.
La seguente domanda a scelta multipla consoliderà la tua conoscenza dei concetti esposti in questo lab. Rispondi alle domande al meglio delle tue capacità.
Hai imparato a configurare l'ambiente di sviluppo Python per Dataflow (utilizzando l'SDK Apache Beam per Python) e hai eseguito una pipeline Dataflow di esempio.
Questo lab fa parte di una serie chiamata Qwik Starts, pensata per offrirti un piccolo assaggio delle diverse funzionalità disponibili in Google Cloud. Cerca "Qwik Starts" nel catalogo di Google Cloud Skills Boost per trovare il prossimo lab da seguire.
Per ottenere una copia del libro su cui è basato questo lab: Data Science in Google Cloud Platform: O'Reilly Media, Inc.
… per utilizzare al meglio le tecnologie Google Cloud. I nostri corsi ti consentono di sviluppare competenze tecniche e best practice per aiutarti a metterti subito al passo e avanzare nel tuo percorso di apprendimento. Offriamo vari livelli di formazione, dal livello base a quello avanzato, con opzioni di corsi on demand, dal vivo e virtuali, in modo da poter scegliere il più adatto in base ai tuoi impegni. Le certificazioni ti permettono di confermare e dimostrare le tue abilità e competenze relative alle tecnologie Google Cloud.
Ultimo aggiornamento del manuale: 4 febbraio 2024
Ultimo test del lab: 4 maggio 2023
Copyright 2025 Google LLC Tutti i diritti riservati. Google e il logo Google sono marchi di Google LLC. Tutti gli altri nomi di società e prodotti sono marchi delle rispettive società a cui sono associati.
Questi contenuti non sono al momento disponibili
Ti invieremo una notifica via email quando sarà disponibile
Bene.
Ti contatteremo via email non appena sarà disponibile
One lab at a time
Confirm to end all existing labs and start this one