arrow_back

Creazione di un mesh di dati con Dataplex: Challenge Lab

Accedi Partecipa
Metti alla prova le tue conoscenze e condividile con la nostra community.
done
Accedi a oltre 700 lab pratici, badge delle competenze e corsi

Creazione di un mesh di dati con Dataplex: Challenge Lab

Lab 1 ora 30 minuti universal_currency_alt 1 credito show_chart Introduttivi
info Questo lab potrebbe incorporare strumenti di AI a supporto del tuo apprendimento.
Metti alla prova le tue conoscenze e condividile con la nostra community.
done
Accedi a oltre 700 lab pratici, badge delle competenze e corsi

GSP514

Laboratori autogestiti Google Cloud

Panoramica

In un Challenge Lab ti vengono presentati uno scenario e un insieme di attività. Anziché seguire le istruzioni passo passo, utilizzerai le competenze apprese dai lab durante il corso per capire come completare le attività autonomamente. Tramite un sistema di valutazione automatico (visibile in questa pagina), riceverai un feedback che ti consentirà di capire se hai completato le attività in modo corretto.

Quando partecipi a un Challenge Lab non ricevi alcuna formazione sui concetti di Google Cloud. Dovrai estendere le competenze che hai appreso, ad esempio modificare i valori predefiniti e leggere ed esaminare i messaggi di errore per correggere i tuoi errori.

Per ottenere un punteggio del 100% devi completare tutte le attività correttamente nel tempo stabilito.

Configurazione

Prima di fare clic sul pulsante Avvia lab

Leggi le seguenti istruzioni. I lab sono a tempo e non possono essere messi in pausa. Il timer si avvia quando fai clic su Avvia lab e ti mostra per quanto tempo avrai a disposizione le risorse Google Cloud.

Con questo lab pratico avrai la possibilità di completare le attività in prima persona, in un ambiente cloud reale e non di simulazione o demo. Riceverai delle nuove credenziali temporanee che potrai utilizzare per accedere a Google Cloud per la durata del lab.

Per completare il lab, avrai bisogno di:

  • Accesso a un browser internet standard (Chrome è il browser consigliato).
Nota: utilizza una finestra del browser in incognito o privata per eseguire questo lab. Ciò evita eventuali conflitti tra il tuo account personale e l'account Studente, che potrebbero causare addebiti aggiuntivi sul tuo account personale.
  • È ora di completare il lab: ricorda che, una volta iniziato, non puoi metterlo in pausa.
Nota: se hai già un account o un progetto Google Cloud personale, non utilizzarlo per questo lab per evitare addebiti aggiuntivi al tuo account.

Scenario della sfida

Hai appena iniziato a svolgere l'incarico di Junior Data Engineer. Finora hai aiutato i team a creare e gestire le risorse Dataplex.

Dovresti avere le competenze e le conoscenze necessarie per svolgere queste attività.

La sfida

Ti viene chiesto di aiutare un team di sviluppo appena formato a creare un nuovo mesh di dati utilizzando Dataplex. Nello specifico, dovrai creare un lake Dataplex con più zone e asset. Dovrai inoltre taggare gli asset nel nuovo lake e valutarli in termini di qualità dei dati. Ti viene chiesto di completare le seguenti attività:

  • Creare un lake Dataplex con due zone e due asset.
  • Creare e applicare un modello di tag per taggare un'intera zona come dati protetti.
  • Assegnare un ruolo IAM Dataplex a un altro utente.
  • Creare e caricare un file di specifiche della qualità dei dati su Cloud Storage.
  • Definire ed eseguire un job di qualità dei dati in Dataplex.

Alcuni standard che dovrai seguire:

  • Assicurati che tutte le API necessarie (come Dataplex, Data Catalog e Dataproc) siano abilitate correttamente.
  • Crea tutte le risorse nella regione , se non diversamente indicato.

Ogni attività è descritta dettagliatamente di seguito. In bocca al lupo!

Attività 1: crea un lake Dataplex con due zone e due asset

Il bucket Cloud Storage e il set di dati BigQuery per il passaggio 2 sono stati creati in precedenza in questo lab.

  1. Crea un lake Dataplex denominato Sales Lake con due zone a livello di regione:
  • Una zona non elaborata denominata Raw Customer Zone
  • Una zona organizzata denominata Curated Customer Zone
  1. Collega un asset creato in precedenza a ciascuna zona:
  • Alla zona non elaborata, collega il bucket Cloud Storage denominato -customer-online-sessions come nuovo asset denominato Customer Engagements.
  • Alla zona organizzata, collega il set di dati BigQuery denominato .customer_orders come nuovo asset denominato Customer Orders.

Fai clic su Controlla i miei progressi per verificare l'obiettivo. Crea un lake Dataplex con due zone e due asset

Attività 2: crea e applica un modello di tag a una zona

  1. Crea un modello di tag pubblico denominato Protected Customer Data Template con due campi enumerati:
  • Il primo campo denominato Raw Data Flag con due valori: Yes e No.
  • Il secondo campo denominato Protected Contact Information Flag con due valori: Yes e No
  1. Usa questo modello per taggare Raw Customer Zone utilizzando il valore Yes per entrambi i flag.

Fai clic su Controlla i miei progressi per verificare l'obiettivo. Crea e applica un modello di tag a una zona

Attività 3: assegna un ruolo IAM Dataplex a un altro utente

  • Utilizzando il principio del privilegio minimo, assegna il ruolo IAM Dataplex appropriato all'Utente 2 () che gli consente di caricare nuovi file di Cloud Storage nella risorsa Dataplex denominata Customer Engagements.

Fai clic su Controlla i miei progressi per verificare l'obiettivo. Assegna un ruolo IAM Dataplex a un altro utente.

Attività 4: crea e carica un file di specifiche della qualità dei dati su Cloud Storage

Il bucket Cloud Storage per il passaggio 2 è stato creato in precedenza in questo lab.

  1. Crea un file delle specifiche della qualità dei dati denominato dq-customer-orders.yaml con le seguenti specifiche:
  • Regola NOT NULL applicata alla colonna user_id della tabella customer_orders.ordered_items
  • Regola NOT NULL applicata alla colonna order_id della tabella customer_orders.ordered_items
  1. Carica il file nel bucket Cloud Storage denominato -dq-config.

Fai clic su Controlla i miei progressi per verificare l'obiettivo. Crea e carica un file di specifiche della qualità dei dati

Attività 5: definisci ed esegui un job di qualità dei dati in Dataplex

Il set di dati BigQuery per il passaggio 1 è stato creato in precedenza in questo lab.

  1. Definisci un job di qualità dei dati utilizzando il file dq-customer-orders.yaml con le seguenti specifiche:
Proprietà Valore
Data Quality Job Name Customer Orders Data Quality Job
BigQuery destination table for the results .orders_dq_dataset.results
User service account Compute Engine default service account
  1. Esegui immediatamente il job di qualità dei dati.
L'esecuzione del job può richiedere diversi minuti. Potresti dover aggiornare la pagina per verificare che il job sia stato eseguito correttamente.

Fai clic su Controlla i miei progressi per verificare l'obiettivo. Definisci ed esegui un job di qualità dei dati in Dataplex

Complimenti!

Badge Build a Data Mesh with Dataplex

Guadagna il tuo prossimo badge delle competenze

Questo self-paced lab fa parte della Quest con badge delle competenze Build a Data Mesh with Dataplex. Il completamento di questa Quest con badge delle competenze ti permette di ottenere il badge indicato in precedenza come riconoscimento per l'obiettivo raggiunto. Condividi il badge sul tuo CV e sulle piattaforme social e annuncia il risultato che hai raggiunto utilizzando #GoogleCloudBadge.

Formazione e certificazione Google Cloud

… per utilizzare al meglio le tecnologie Google Cloud. I nostri corsi ti consentono di sviluppare competenze tecniche e best practice per aiutarti a metterti subito al passo e avanzare nel tuo percorso di apprendimento. Offriamo vari livelli di formazione, dal livello base a quello avanzato, con opzioni di corsi on demand, dal vivo e virtuali, in modo da poter scegliere il più adatto in base ai tuoi impegni. Le certificazioni ti permettono di confermare e dimostrare le tue abilità e competenze relative alle tecnologie Google Cloud.

Ultimo aggiornamento del manuale: 04 luglio 2023

Ultimo test del lab: 04 luglio 2023

Copyright 2024 Google LLC Tutti i diritti riservati. Google e il logo Google sono marchi di Google LLC. Tutti gli altri nomi di società e prodotti sono marchi delle rispettive società a cui sono associati.

Questi contenuti non sono al momento disponibili

Ti invieremo una notifica via email quando sarà disponibile

Bene.

Ti contatteremo via email non appena sarà disponibile