Points de contrôle
Create a lake
/ 20
Add zone to your lake
/ 20
Attach an asset to a zone
/ 40
Delete assets, zones, and lakes
/ 20
Dataplex : Qwik Start – Console
GSP1143
Présentation
Dataplex est une data fabric intelligente qui permet aux entreprises de découvrir, de gérer, de surveiller et de gouverner leurs données de façon centralisée sur des lacs, des entrepôts et des magasins de données pour optimiser les analyses à grande échelle. Vous pouvez utiliser Dataplex pour développer une architecture de maillage de données, c'est-à-dire une approche technique destinée aux entreprises qui décentralise la propriété des données parmi les propriétaires de données du domaine.
Dataplex gère les données d'une manière qui ne nécessite pas de les déplacer ni de les dupliquer. Lorsque vous ajoutez des éléments de données, Dataplex collecte les métadonnées des données structurées et non structurées, puis les enregistre dans un metastore sécurisé et unifié. Grâce à des services Google Cloud tels que Data Catalog et BigQuery, vous pouvez ensuite évaluer ces données et métadonnées.
Dans cet atelier, vous allez apprendre à développer votre propre maillage de données en créant et en supprimant des lacs, des zones et des éléments dans Dataplex à l'aide de la console Google Cloud.
Objectifs de l'atelier
- Activer l'API Dataplex
- Créer un lac
- Ajouter une zone à votre lac
- Associer et dissocier des éléments
- Supprimer des zones et des lacs
Préparation
Avant de cliquer sur le bouton "Démarrer l'atelier"
Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.
Cet atelier pratique vous permet de suivre vous-même les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Nous vous fournissons des identifiants temporaires pour vous connecter à Google Cloud le temps de l'atelier.
Pour réaliser cet atelier :
- vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome) ;
- vous disposez d'un temps limité ; une fois l'atelier commencé, vous ne pouvez pas le mettre en pause.
Démarrer l'atelier et se connecter à la console Google Cloud
-
Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, un pop-up s'affiche pour vous permettre de sélectionner un mode de paiement. Sur la gauche, vous trouverez le panneau Détails concernant l'atelier, qui contient les éléments suivants :
- Le bouton Ouvrir la console Google Cloud
- Le temps restant
- Les identifiants temporaires que vous devez utiliser pour cet atelier
- Des informations complémentaires vous permettant d'effectuer l'atelier
-
Cliquez sur Ouvrir la console Google Cloud (ou effectuez un clic droit et sélectionnez Ouvrir le lien dans la fenêtre de navigation privée si vous utilisez le navigateur Chrome).
L'atelier lance les ressources, puis ouvre la page Se connecter dans un nouvel onglet.
Conseil : Réorganisez les onglets dans des fenêtres distinctes, placées côte à côte.
Remarque : Si la boîte de dialogue Sélectionner un compte s'affiche, cliquez sur Utiliser un autre compte. -
Si nécessaire, copiez le nom d'utilisateur ci-dessous et collez-le dans la boîte de dialogue Se connecter.
{{{user_0.username | "Username"}}} Vous trouverez également le nom d'utilisateur dans le panneau Détails concernant l'atelier.
-
Cliquez sur Suivant.
-
Copiez le mot de passe ci-dessous et collez-le dans la boîte de dialogue Bienvenue.
{{{user_0.password | "Password"}}} Vous trouverez également le mot de passe dans le panneau Détails concernant l'atelier.
-
Cliquez sur Suivant.
Important : Vous devez utiliser les identifiants fournis pour l'atelier. Ne saisissez pas ceux de votre compte Google Cloud. Remarque : Si vous utilisez votre propre compte Google Cloud pour cet atelier, des frais supplémentaires peuvent vous être facturés. -
Accédez aux pages suivantes :
- Acceptez les conditions d'utilisation.
- N'ajoutez pas d'options de récupération ni d'authentification à deux facteurs (ce compte est temporaire).
- Ne vous inscrivez pas à des essais gratuits.
Après quelques instants, la console Cloud s'ouvre dans cet onglet.
Activer l'API Cloud Dataplex
-
Dans la console Google Cloud, saisissez API Cloud Dataplex dans la barre de recherche en haut de l'écran.
-
Dans les résultats, cliquez sur API Cloud Dataplex sous "Marketplace".
-
Cliquez sur Activer.
Tâche 1 : Créer un lac
Dans Dataplex, un lac est le domaine d'organisation le plus élevé qui représente une zone de données ou une unité d'entreprise spécifique. Par exemple, vous pouvez créer un lac pour chaque service ou domaine de données de votre organisation. Vous aurez ainsi la possibilité d'organiser et de fournir des données à des groupes d'utilisateurs particuliers.
Dans cette tâche, vous allez créer un lac pour commencer à développer un maillage de données.
- Dans la console Google Cloud, accédez au menu de navigation (), puis à Analyse > Dataplex.
Si la fenêtre Bienvenue dans la nouvelle interface Dataplex
apparaît, cliquez sur Fermer.
-
Sous Gérer les lacs, cliquez sur Gérer.
-
Cliquez sur Créer un lac de données.
-
Saisissez les informations requises pour créer un lac de données :
Propriété | Valeur |
---|---|
Nom à afficher | sensors |
ID | Conservez la valeur par défaut. |
Région |
Conservez les autres valeurs par défaut.
- Cliquez sur Créer.
La création d'un lac peut prendre jusqu'à trois minutes.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Tâche 2 : Ajouter une zone à votre lac
Après avoir créé un lac, vous pouvez y ajouter des zones. Il s'agit de sous-domaines vous permettant de classer vos données. Par exemple, vous pouvez classer vos données par étape, utilisation ou restrictions.
Il existe deux types de zones :
- Les zones brutes contiennent des données dans des formats bruts (par exemple, les fichiers dans des buckets Cloud Storage) et ne sont pas soumises à une vérification stricte du type.
- Les zones sélectionnées contiennent des données nettoyées, formatées et prêtes à être analysées, comme les tables BigQuery.
Dans cette tâche, vous allez créer une zone brute pour exploiter des fichiers dans un bucket Cloud Storage.
-
Dans l'onglet Gérer, cliquez sur le nom de votre lac.
-
Cliquez sur Ajouter une zone.
-
Saisissez les informations requises pour créer une zone :
Propriété | Valeur |
---|---|
Nom à afficher | temperature raw data |
ID | Conservez la valeur par défaut. |
Type | Zone brute |
Emplacements des données | Régional |
Conservez les autres valeurs par défaut.
Par exemple, l'option Activer la découverte des métadonnées sous les paramètres de découverte est activée par défaut. Elle permet aux utilisateurs autorisés de découvrir les données dans la zone.
- Cliquez sur Créer.
La création de la zone peut prendre jusqu'à deux minutes.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Tâche 3 : Associer un élément à une zone
Les données stockées dans des buckets Cloud Storage ou des ensembles de données BigQuery peuvent être associées en tant qu'éléments aux zones d'un lac Dataplex.
Dans cette tâche, vous allez associer un bucket Cloud Storage créé dans la console Google Cloud.
-
Dans l'onglet Zones, cliquez sur le nom de votre zone.
-
Dans l'onglet Éléments, cliquez sur Ajouter des éléments.
-
Cliquez sur Ajouter un élément.
-
Saisissez les informations requises pour associer un élément :
Propriété | Valeur |
---|---|
Type | Bucket de stockage |
Nom à afficher | measurements |
ID | Conservez la valeur par défaut. |
Conservez les autres valeurs par défaut.
- Dans le champ Bucket, cliquez sur Parcourir.
Vous pouvez associer un bucket Cloud Storage existant ou en créer un nouveau sans quitter Dataplex. Lors des étapes suivantes, vous allez créer un bucket et l'associer à la zone.
-
Cliquez sur Créer un bucket ().
-
Indiquez l'ID de votre projet comme nom de bucket (
), puis cliquez sur Continuer. -
Dans le champ Type d'emplacement, sélectionnez Région, puis
.
Conservez les autres valeurs par défaut.
- Cliquez sur Créer.
Si le message L'accès public sera bloqué
s'affiche, cliquez sur Confirmer.
-
Cliquez sur Sélectionner pour sélectionner le bucket que vous venez de créer, puis cliquez sur Continuer.
-
Dans les paramètres de découverte, sélectionnez Hériter pour hériter des paramètres de découverte du niveau de la zone, puis cliquez sur Continuer.
-
Cliquez sur Envoyer.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Tâche 4 : Supprimer des éléments, des zones et des lacs
Pour supprimer un lac de données, vous devez d'abord dissocier les éléments, puis supprimer les zones.
Dans cette tâche, vous allez dissocier l'élément de la zone, supprimer la zone, puis supprimer le lac.
Dissocier un élément
-
Dans le menu de gauche, cliquez sur l'onglet Gérer, puis cliquez sur le nom de votre lac de données.
-
Dans l'onglet Zones, cliquez sur le nom de votre zone.
-
Dans l'onglet Éléments, cochez la case située à gauche du nom de l'élément.
-
Cliquez sur Supprimer des éléments.
-
Cliquez sur Supprimer pour confirmer.
Cette action ne supprime pas les données sous-jacentes dans le bucket Cloud Storage. Elle empêche seulement d'accéder au bucket Cloud Storage ou de le découvrir à l'aide du lac de données dans Dataplex.
Supprimer une zone
-
Dans le menu de gauche, cliquez sur l'onglet Gérer, puis cliquez sur le nom de votre lac de données.
-
Dans l'onglet Zones, cochez la case située à gauche du nom de la zone.
-
Cliquez sur Supprimer la zone.
-
Cliquez sur Supprimer pour confirmer.
Supprimer le lac de données
-
Dans le menu de gauche, cliquez sur l'onglet Gérer, puis cliquez sur le nom de votre lac de données.
-
En haut de la page, cliquez sur Supprimer.
-
Pour confirmer la suppression, saisissez delete dans la zone de texte.
-
Cliquez sur Supprimer le lac de données pour confirmer.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Félicitations !
Vous avez utilisé la console Google Cloud pour créer et supprimer des lacs, des zones et des éléments dans Dataplex.
Formations et certifications Google Cloud
Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.
Dernière mise à jour du manuel : 20 septembre 2023
Dernier test de l'atelier : 20 septembre 2023
Copyright 2024 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.