Checkpoint
Create a lake
/ 20
Add zone to your lake
/ 20
Attach an asset to a zone
/ 40
Delete assets, zones, and lakes
/ 20
Dataplex: Qwik Start - Console
GSP1143
Panoramica
Dataplex è un data fabric intelligente che consente alle organizzazioni l'individuazione, la gestione, il monitoraggio e la governance dei dati a livello centralizzato tra data lake, data warehouse e data mart per potenziare l'analisi su larga scala. Nello specifico, puoi utilizzare Dataplex per creare un'architettura a mesh di dati, ovvero un approccio organizzativo e tecnico che decentralizza la proprietà dei dati tra i proprietari dei dati del dominio.
Dataplex gestisce i dati in un modo da non richiedere lo spostamento o la duplicazione dei dati. Man mano che aggiungi nuove risorse di dati, Dataplex raccoglie i metadati sia per i dati strutturati che per quelli non strutturati e registra automaticamente tutti i metadati in un metastore sicuro e unificato. Dati e metadati possono quindi essere valutati tramite servizi Google Cloud come Data Catalog e BigQuery.
In questo lab imparerai come iniziare a creare il tuo mesh di dati creando e rimuovendo lake, zone e asset in Dataplex utilizzando la console Google Cloud.
Attività previste
- Abilitare l'API Dataplex
- Creare un lake
- Aggiungere una zona al lake
- Collegare e scollegare asset
- Eliminare zone e lake
Configurazione e requisiti
Prima di fare clic sul pulsante Avvia lab
Leggi le seguenti istruzioni. I lab sono a tempo e non possono essere messi in pausa. Il timer si avvia quando fai clic su Avvia lab e ti mostra per quanto tempo avrai a disposizione le risorse Google Cloud.
Con questo lab pratico avrai la possibilità di completare le attività in prima persona, in un ambiente cloud reale e non di simulazione o demo. Riceverai delle nuove credenziali temporanee che potrai utilizzare per accedere a Google Cloud per la durata del lab.
Per completare il lab, avrai bisogno di:
- Accesso a un browser internet standard (Chrome è il browser consigliato).
- È ora di completare il lab: ricorda che, una volta iniziato, non puoi metterlo in pausa.
Come avviare il lab e accedere alla console Google Cloud
-
Fai clic sul pulsante Avvia lab. Se devi effettuare il pagamento per il lab, si apre una finestra popup per permetterti di selezionare il metodo di pagamento. A sinistra, trovi il riquadro Dettagli lab con le seguenti informazioni:
- Il pulsante Apri console Google Cloud
- Tempo rimanente
- Credenziali temporanee da utilizzare per il lab
- Altre informazioni per seguire questo lab, se necessario
-
Fai clic su Apri console Google Cloud (o fai clic con il tasto destro del mouse e seleziona Apri link in finestra di navigazione in incognito se utilizzi il browser Chrome).
Il lab avvia le risorse e apre un'altra scheda con la pagina di accesso.
Suggerimento: disponi le schede in finestre separate posizionate fianco a fianco.
Nota: se visualizzi la finestra di dialogo Scegli un account, fai clic su Usa un altro account. -
Se necessario, copia il Nome utente di seguito e incollalo nella finestra di dialogo di accesso.
{{{user_0.username | "Username"}}} Puoi trovare il Nome utente anche nel riquadro Dettagli lab.
-
Fai clic su Avanti.
-
Copia la Password di seguito e incollala nella finestra di dialogo di benvenuto.
{{{user_0.password | "Password"}}} Puoi trovare la Password anche nel riquadro Dettagli lab.
-
Fai clic su Avanti.
Importante: devi utilizzare le credenziali fornite dal lab. Non utilizzare le credenziali del tuo account Google Cloud. Nota: utilizzare il tuo account Google Cloud per questo lab potrebbe comportare addebiti aggiuntivi. -
Fai clic nelle pagine successive:
- Accetta i termini e le condizioni.
- Non inserire opzioni di recupero o l'autenticazione a due fattori, perché si tratta di un account temporaneo.
- Non registrarti per le prove gratuite.
Dopo qualche istante, la console Google Cloud si apre in questa scheda.
Abilita l'API Cloud Dataplex
-
Nella console Google Cloud, inserisci API Cloud Dataplex nella barra di ricerca in alto.
-
Fai clic sul risultato per API Cloud Dataplex in Marketplace.
-
Fai clic su Abilita.
Attività 1: crea un lake
In Dataplex, un lake è il dominio organizzativo più alto che rappresenta un'area dati specifica o un'unità aziendale. Ad esempio, puoi creare un lake per ogni reparto o dominio dati della tua organizzazione, in modo da poter organizzare e fornire dati per gruppi di utenti specifici.
In questa attività creerai un lake per iniziare a creare un mesh di dati.
- Nella console Google Cloud, nel menu di navigazione (), vai ad Analisi > Dataplex.
Se viene visualizzato Ti diamo il benvenuto nella nuova esperienza Dataplex
, fai clic su Chiudi.
-
In Gestisci lake, fai clic su Gestisci.
-
Fai clic su Crea lake.
-
Inserisci le informazioni richieste per creare un nuovo lake:
Proprietà | Valore |
---|---|
Nome visualizzato | sensors |
ID | Lascia il valore predefinito. |
Regione |
Lascia invariati gli altri valori predefiniti.
- Fai clic su Crea.
La creazione del lake può richiedere fino a 3 minuti.
Fai clic su Controlla i miei progressi per verificare l'obiettivo.
Attività 2: aggiungi una zona al lake
Dopo averlo creato, puoi aggiungere zone al lake. Le zone sono sottodomini all'interno di un lake che puoi utilizzare per classificare ulteriormente i dati. Ad esempio, puoi classificare i dati in base alla fase, all'utilizzo o alle restrizioni.
Esistono due tipi di zone:
- Le zone non elaborate contengono dati in formati non elaborati (come i file nei bucket Cloud Storage) e non sono soggette a un rigoroso controllo del tipo.
- Le zone curate contengono dati puliti, formattati e pronti per l'analisi come le tabelle BigQuery.
In questa attività creerai una zona non elaborata per lavorare con i file in un bucket Cloud Storage.
-
Nella scheda Gestisci, fai clic sul nome del tuo lake.
-
Fai clic su Aggiungi zona.
-
Inserisci le informazioni richieste per creare una nuova zona:
Proprietà | Valore |
---|---|
Nome visualizzato | temperature raw data |
ID | Lascia il valore predefinito. |
Tipo | Zona non elaborata |
Posizioni dei dati | A livello di regione |
Lascia invariati gli altri valori predefiniti.
Ad esempio, l'opzione Attiva rilevamento metadati in Impostazioni di rilevamento è abilitata per impostazione predefinita e consente agli utenti autorizzati di rilevare i dati nella zona.
- Fai clic su Crea.
La creazione della zona può richiedere fino a 2 minuti.
Fai clic su Controlla i miei progressi per verificare l'obiettivo.
Attività 3: collega un asset a una zona
I dati archiviati nei bucket Cloud Storage o nei set di dati BigQuery possono essere collegati come asset alle zone all'interno di un lake Dataplex.
In questa attività, collegherai un bucket Cloud Storage creato nella console Google Cloud.
-
Nella scheda Zone, fai clic sul nome della tua zona.
-
Nella scheda Asset, fai clic su Aggiungi asset.
-
Fai clic su Aggiungi un asset.
-
Inserisci le informazioni richieste per collegare un nuovo asset:
Proprietà | Valore |
---|---|
Tipo | Bucket di archiviazione |
Nome visualizzato | measurements |
ID | Lascia il valore predefinito. |
Lascia invariati gli altri valori predefiniti.
- In Bucket, fai clic su Sfoglia.
Puoi collegare un bucket Cloud Storage esistente o crearne uno nuovo senza uscire da Dataplex. Nei passaggi successivi, creerai un nuovo bucket Cloud Storage e lo collegherai alla zona.
-
Fai clic su Crea nuovo bucket ().
-
Fornisci l'ID progetto come nome del bucket (
), quindi fai clic su Continua. -
In Tipo di località, seleziona Regione, quindi seleziona
.
Lascia invariati gli altri valori predefiniti.
- Fai clic su Crea.
Se appare il messaggio L'accesso pubblico verrà vietato
fai clic su Conferma.
-
Fai clic su Seleziona per selezionare il bucket appena creato, quindi fai clic su Continua.
-
Per Impostazioni di rilevamento, seleziona Eredita per ereditare le impostazioni di rilevamento dal livello di zona, quindi fai clic su Continua.
-
Fai clic su Invia.
Fai clic su Controlla i miei progressi per verificare l'obiettivo.
Attività 4: elimina asset, zone e lake
Per eliminare un lake è necessario prima scollegare gli asset e poi eliminare le zone.
In questa attività scollegherai l'asset dalla zona, quindi eliminerai la zona e, infine, eliminerai il lake.
Scollega un asset
-
Dal menu a sinistra fai clic sulla scheda Gestisci, quindi sul nome del lake.
-
Nella scheda Zone, fai clic sul nome della tua zona.
-
Nella scheda Asset, seleziona la casella di controllo a sinistra del nome dell'asset.
-
Fai clic su Elimina asset.
-
Fai clic su Elimina per confermare.
Questa azione non elimina i dati sottostanti nel bucket Cloud Storage. Impedisce semplicemente che il bucket Cloud Storage sia accessibile o rilevabile utilizzando il lake in Dataplex.
Elimina una zona
-
Dal menu a sinistra fai clic sulla scheda Gestisci, quindi sul nome del lake.
-
Nella scheda Zone, seleziona la casella di controllo a sinistra del nome della zona.
-
Fai clic su Elimina zona.
-
Fai clic su Elimina per confermare.
Elimina il lake
-
Dal menu a sinistra fai clic sulla scheda Gestisci, quindi sul nome del lake.
-
Nella parte superiore della pagina, fai clic su Elimina.
-
Conferma l'eliminazione digitando elimina nella casella di testo.
-
Fai clic su Elimina lake per confermare.
Fai clic su Controlla i miei progressi per verificare l'obiettivo.
Complimenti!
Hai utilizzato la console Google Cloud per creare ed eliminare lake, zone e asset in Dataplex.
Formazione e certificazione Google Cloud
… per utilizzare al meglio le tecnologie Google Cloud. I nostri corsi ti consentono di sviluppare competenze tecniche e best practice per aiutarti a metterti subito al passo e avanzare nel tuo percorso di apprendimento. Offriamo vari livelli di formazione, dal livello base a quello avanzato, con opzioni di corsi on demand, dal vivo e virtuali, in modo da poter scegliere il più adatto in base ai tuoi impegni. Le certificazioni ti permettono di confermare e dimostrare le tue abilità e competenze relative alle tecnologie Google Cloud.
Ultimo aggiornamento del manuale: 20 settembre 2023
Ultimo test del lab: 20 settembre 2023
Copyright 2024 Google LLC Tutti i diritti riservati. Google e il logo Google sono marchi di Google LLC. Tutti gli altri nomi di società e prodotti sono marchi delle rispettive società a cui sono associati.