arrow_back

Explorer les métadonnées d'ensemble de données de différents projets avec Data Catalog

Testez vos connaissances et partagez-les avec notre communauté

Explorer les métadonnées d'ensemble de données de différents projets avec Data Catalog

Atelier 1 heure 30 minutes universal_currency_alt 1 crédit show_chart Débutant
info Cet atelier peut intégrer des outils d'IA pour vous accompagner dans votre apprentissage.
Testez vos connaissances et partagez-les avec notre communauté

Data Catalog est obsolète et ne sera plus disponible à partir du 30 janvier 2026. Vous pouvez toujours effectuer cet atelier si vous le souhaitez.

Pour savoir comment transférer vos utilisateurs, vos charges de travail et votre contenu Data Catalog vers le catalogue Dataplex, consultez "Passer de Data Catalog au catalogue Dataplex" (https://cloud.google.com/dataplex/docs/transition-to-dataplex-catalog).

GSP789

Présentation

Data Catalog est un service de gestion des métadonnées entièrement géré et évolutif au sein de Dataplex.

Sans les bons outils, la gestion des éléments de données peut être chronophage et coûteuse. Data Catalog fournit un emplacement centralisé où les organisations peuvent rechercher, gérer et décrire leurs éléments de données.

Utiliser Data Catalog

Vous pouvez interagir avec Data Catalog de deux manières :

  • En recherchant des éléments de données auxquels vous avez accès
  • En ajoutant des tags de métadonnées à des éléments

Points abordés

Dans cet atelier, vous allez apprendre à effectuer les tâches suivantes :

  • Explorer un environnement d'entreprise simulé associé à deux projets, deux ensembles de données et deux comptes utilisateur
  • Parcourir manuellement une table BigQuery dans l'interface utilisateur
  • Exécuter des requêtes pour mieux comprendre les colonnes de données sensibles à taguer par la suite
  • Utiliser Data Catalog pour rechercher des ensembles de données existants dans les projets
  • Utiliser les modèles de tag Data Catalog pour ajouter des tags de métadonnées aux éléments

En quoi est-ce utile ?

  • Affichez les éléments de données de plusieurs projets dans votre organisation.
  • Créez des modèles de tag réutilisables en vue d'ajouter des descriptions de données à l'intention de vos équipes.
  • Repérez rapidement les ensembles de données contenant des informations permettant d'identifier personnellement les utilisateurs.
  • Le contrôle des accès aux métadonnées est hérité des utilisateurs connectés (aucune LCA Data Catalog distincte n'est requise).

Prérequis

Très important : Avant de commencer cet atelier, déconnectez-vous de votre compte Gmail personnel ou professionnel, ou lancez l'atelier dans une fenêtre de navigation privée. Cela vous évitera d'être connecté au mauvais compte.

Préparation

  1. Si vous ne l'avez pas encore fait, cliquez sur Démarrer l'atelier.

  2. Conseil : La génération automatique des deux projets Google Cloud, des deux ensembles de données préremplis et des deux comptes utilisateur dans l'environnement de l'atelier va prendre entre trois et cinq minutes. Vous pouvez continuer à lire les informations concernant cet atelier pendant ce temps (vous devez lire le scénario ci-dessous pour vous connecter).

  3. Cliquez sur Ouvrir la console Bike dans l'atelier ou dans une nouvelle fenêtre de navigation privée, et accédez à la console Cloud. Ne vous connectez pas tout de suite avec les comptes fournis. Poursuivez tout d'abord la lecture du scénario. Vous recevrez les instructions relatives au compte à utiliser plus tard.

Important : Une fois que vous avez démarré l'atelier, vous ne pouvez plus l'interrompre. Si vous l'arrêtez, tous les projets du participant en cours d'exécution seront supprimés.

Scénario : PDG d'une société de transport de la ville de New York

Vous dirigez une entreprise de transport basée à New York. Vos équipes d'analystes de données interrogent les ensembles de données sur les moyens de transport new-yorkais (vélo et voiture) que vous avez collectés.

Difficultés :

  • Certains de vos ensembles de données contiennent des informations sensibles pour lesquelles vous souhaitez contrôler les accès.
  • Votre équipe se plaint d'avoir des difficultés à localiser le bon ensemble de données parmi tous ceux auxquels elle a accès.
  • Pour vous conformer aux dernières exigences réglementaires, vous devez trouver un moyen clair de signaler tous les ensembles de données contenant des informations permettant d'identifier personnellement les utilisateurs.

Ensembles de données de votre organisation

  • NYC Bike Share Trips (Trajets en vélos en libre-service dans la ville de NY)
  • NYC Motor Vehicle Collisions (Collisions impliquant des véhicules motorisés à NY)

Chaque équipe d'ingénieurs de données gère son ensemble de données dans un projet Google Cloud distinct qui lui est propre afin de faciliter la gestion de l'accès et de la facturation. Si cette méthode facilite la tâche des ingénieurs de données, elle complique celle des analystes, car les ensembles de données sont plus difficiles à trouver.

Tous les rôles d'analyste ne sont pas équivalents

Pour compliquer encore les choses, votre équipe d'informatique décisionnelle compte différents niveaux d'analystes de données :

  • Analystes de données – moins de droits
  • Propriétaire – droits d'administration complets

Examiner les conditions automatiquement créées pour vous

Afin de simuler au mieux un vrai environnement d'entreprise comptant plusieurs projets et ensembles de données à cataloguer, votre équipe d'ingénieurs vous a donné accès à des ressources existantes (autrement dit, des ressources ont été préchargées dans l'atelier pour que vous n'ayez pas à les créer).

Votre équipe vous a fourni les accès mentionnés ci-dessus aux éléments suivants :

  • Deux projets
  • Deux comptes utilisateur

Elle a ajouté les remarques suivantes concernant la restriction des accès :

  • Le propriétaire dispose d'un accès complet à tous les projets et ensembles de données.
  • Les analystes de données ne doivent pas avoir accès à l'ensemble de données "NYC Motor Vehicle Collisions" et ne peuvent pas l'interroger (données sensibles).

Partie 1 : Explorer l'environnement de données existant avec le rôle Propriétaire

Rappel : Votre équipe d'ingénieurs de données vous a fourni deux projets contenant chacun un ensemble de données différent sur la ville de New York. Vérifiez que le rôle Propriétaire permet de consulter et d'interroger tous ces ensembles de données.

  1. Connectez-vous à l'aide de l'adresse e-mail et du mot de passe du Propriétaire (droits d'administration complets), générés automatiquement pour cet atelier.

  2. Acceptez les conditions d'utilisation de Google Cloud (si vous y êtes invité).

Localiser le projet NYC Collisions

  1. Cliquez sur le menu déroulant indiquant le nom de votre projet en haut de la page pour sélectionner un projet.

  1. Reportez-vous au nom généré automatiquement par Qwiklabs pour le projet NYC Motor Vehicle Collisions, puis localisez cette valeur de chaîne dans le pop-up de sélection du projet :

Activer l'API Data Catalog

  1. Accédez au menu de navigation > Solutions > Tous les produits et faites-le défiler vers le bas jusqu'à Data Catalog.
  2. Pointez sur le nom, puis cliquez sur l'icône en forme de punaise pour placer Data Catalog tout en haut du menu de navigation.
  3. Cliquez sur Data Catalog. Si un pop-up s'affiche, cliquez sur Fermer.
  4. Vérifiez que l'API est déjà activée (si aucun message ne vous demande d'activer l'API, c'est qu'elle est déjà activée et qu'aucune action de votre part n'est requise).

Vous utiliserez Data Catalog dans la suite de cet atelier, une fois que vous aurez recherché et interrogé manuellement les ensembles de données dans BigQuery.

Localiser et épingler BigQuery

  1. Faites défiler le menu de navigation vers le bas jusqu'à BigQuery.
  2. Pointez sur le nom, puis cliquez sur l'icône en forme de punaise.
  3. Cliquez sur BigQuery, puis sur OK.

Tâche 1 : Vérifier que le rôle Propriétaire permet de consulter et d'interroger l'ensemble de données new_york_mv_collisions

Vérifiez que le rôle Propriétaire permet de consulter l'ensemble de données new_york_mv_collisions.

  1. Dans BigQuery, sous Explorateur, cliquez sur le nom de votre projet pour ouvrir la liste des ensembles de données auxquels vous avez accès.

  2. Vérifiez que vous pouvez voir l'ensemble de données new_york_mv_collisions.

  3. Cliquez sur l'ensemble de données new_york_mv_collisions pour ouvrir les tables qu'il contient.

  4. Cliquez sur la table nypd_mv_collisions, puis examinez les champs disponibles dans le schéma.

Le schéma doit ressembler à ce qui suit :

Répondez aux questions suivantes.

La table ne contient pas d'informations personnelles, comme un numéro de téléphone ou une adresse e-mail, mais vous devez néanmoins rester prudent lorsque vous partagez l'ensemble de données qui la contient avec davantage de personnes.

Dans la suite de cet atelier, nous verrons comment accéder aux ensembles de données restreints et utiliser Data Catalog pour ajouter proactivement des tags de métadonnées enrichies aux ensembles de données et tables de votre organisation.

Remarque : Cet ensemble de données NYPD Collisions est automatiquement chargé dans votre projet à partir de l'ensemble de données BigQuery public d'origine, mis à jour quotidiennement. Cliquez sur le lien pour en savoir plus sur la collecte de l'ensemble de données et voir des exemples de requêtes.

Vérifier que le rôle Propriétaire permet d'interroger l'ensemble de données sur les collisions

Comme vous êtes connecté en tant que propriétaire global, vérifiez que vous pouvez voir les projets et ensembles de données, et que vous pouvez y accéder. Vérifiez aussi que vous pouvez exécuter la requête ci-dessous.

  • Copiez la requête suivante, puis collez-la dans l'éditeur de requêtes BigQuery. Ensuite, cliquez sur Exécuter :

Quels ont été les 10 premiers facteurs d'accidents de voiture dans la ville de New York ?

SELECT contributing_factor_vehicle_1 AS collision_factor, COUNT(*) AS num_collisions FROM `new_york_mv_collisions.nypd_mv_collisions` WHERE contributing_factor_vehicle_1 != "Unspecified" AND contributing_factor_vehicle_1 != "" GROUP BY collision_factor ORDER BY num_collisions DESC LIMIT 10;

Cliquez sur Vérifier ma progression pour valider l'objectif. Interroger les données sur les collisions dans la ville de New York

Tâche 2 : Vérifier que le rôle Propriétaire permet de consulter et d'interroger l'ensemble de données Bike Share

  1. Cliquez sur Sélectionnez un projet en haut de la page.

  2. Cliquez sur l'onglet Tous.

  3. Localisez l'ensemble de données Bike Share en vous reportant à l'ID de projet correspondant, automatiquement généré :

  1. Cliquez sur l'ID du projet.
Remarque : Si le message "Travail non enregistré" s'affiche, cliquez sur QUITTER.
  1. Dans l'interface utilisateur BigQuery, ouvrez l'ID de projet > new_york_citibike > table citibike_trips.

Une fois les détails et l'aperçu du schéma affichés, répondez aux questions ci-dessous.

Quels sont les trajets en vélos en libre-service les plus populaires en fonction du genre des utilisateurs ?

L'ensemble de données public NYC Citi Bike effectue un suivi de tous les trajets (station de retrait, station de retour) ainsi que d'autres aspects pour chaque utilisateur.

  • Ajoutez la requête ci-dessous dans l'éditeur de requête, puis cliquez sur Exécuter pour trouver les trajets les plus populaires en fonction du genre des utilisateurs. Notez que les trois seules valeurs disponibles dans l'ensemble de données sont "unknown" (inconnu), "male" (homme) et "female" (femme), lesquelles risquent de ne pas être représentatives de tous les utilisateurs de vélos en libre-service :
WITH unknown AS ( SELECT gender, CONCAT(start_station_name, " to ", end_station_name) AS route, COUNT(*) AS num_trips FROM `new_york_citibike.citibike_trips` WHERE gender = 'unknown' GROUP BY gender, start_station_name, end_station_name ORDER BY num_trips DESC LIMIT 5 ) , female AS ( SELECT gender, CONCAT(start_station_name, " to ", end_station_name) AS route, COUNT(*) AS num_trips FROM `new_york_citibike.citibike_trips` WHERE gender = 'female' GROUP BY gender, start_station_name, end_station_name ORDER BY num_trips DESC LIMIT 5 ) , male AS ( SELECT gender, CONCAT(start_station_name, " to ", end_station_name) AS route, COUNT(*) AS num_trips FROM `bigquery-public-data.new_york_citibike.citibike_trips` WHERE gender = 'male' GROUP BY gender, start_station_name, end_station_name ORDER BY num_trips DESC LIMIT 5 ) SELECT * FROM unknown UNION ALL SELECT * FROM female UNION ALL SELECT * FROM male;

Cliquez sur Vérifier ma progression pour valider l'objectif. Trouver les trajets les plus populaires à vélo en fonction du genre des utilisateurs

Vous allez apprendre à ajouter des tags de données sensibles aux ensembles de données et aux tables.

Récapitulatif de l'exploration

  • Vous avez exploré chacun des ensembles de données NYC (sur les collisions et les trajets en vélos en libre-service).
  • Chacun de ces ensembles de données est stocké dans un projet distinct.
  • Le rôle Propriétaire (avec lequel vous êtes actuellement connecté) permet de consulter et d'interroger chaque ensemble de données.

Partie 2 : Explorer l'environnement de données existant avec un accès utilisateur restreint

Jusqu'à maintenant, vous vous êtes connecté avec le compte Propriétaire, auquel votre équipe d'ingénieurs de données a fourni le niveau d'autorisation le plus élevé.

Vous avez demandé à vos équipes d'ingénieurs de limiter l'accès de vos analystes de données comme suit.

Les analystes de données sont autorisés à voir :

  • NYC Bike Share (Trajets en vélos en libre-service dans la ville de NY)

Ils ne peuvent PAS voir :

  • NYC Motor Vehicle Collisions (Collisions impliquant des véhicules motorisés à NY)

Se déconnecter du compte Propriétaire

  1. Cliquez sur l'icône du profil.

  2. Déconnectez-vous.

Tâche 3 : Se connecter avec le compte Analyste de données et vérifier que l'accès au projet est bien restreint

  1. Cliquez sur Utiliser un autre compte.

  2. Connectez-vous à nouveau à Google Cloud à l'aide de l'adresse e-mail et du mot de passe partagé associés au compte Analyste de données.

  3. Sous Sélectionnez un projet, vérifiez qu'un seul projet autogénéré par Qwiklabs s'affiche, et non deux.

  4. Sélectionnez le projet Qwiklabs auquel vous avez accès.

  5. Accédez à BigQuery.

Tâche 4 : Tenter d'interroger directement un ensemble de données privé

Dans BigQuery, vous pouvez interroger tous les projets auxquels vous avez accès, même s'ils ne sont pas épinglés ni visibles dans la section "Explorateur". Essayez d'interroger directement l'ensemble de données NYC Collisions en tant qu'analyste de données en utilisant l'ID du projet.

  • Ajoutez la requête ci-dessous, que vous avez déjà utilisée, et remplacez le préfixe de l'ID du projet avec celui du projet NYC Motor Vehicle Collisions Project :
SELECT contributing_factor_vehicle_1 AS collision_factor, COUNT(*) AS num_collisions FROM `qwiklabs-gcp-REPLACE-HERE.new_york_mv_collisions.nypd_mv_collisions` WHERE contributing_factor_vehicle_1 != "Unspecified" AND contributing_factor_vehicle_1 != "" GROUP BY collision_factor ORDER BY num_collisions DESC LIMIT 10;

Un message d'erreur "Accès refusé" confirme votre niveau d'accès Analyste de données.

Vous venez de passer en revue les différents droits et accès accordés aux rôles Propriétaire (groupe d'autorisations le plus vaste) et Analystes de données (groupe d'autorisations le plus restrictif) pour l'accès aux projets, ensembles de données et requêtes.

Maintenant, vous allez essayer de trouver un ensemble de données masqué à l'aide de la fonctionnalité de recherche de Data Catalog. Pensez-vous que les analystes de données pourront le voir si BigQuery vous empêche d'y accéder ?

Partie 3 : Utiliser Data Catalog pour ajouter des tags aux ensembles de données dans les projets

Maintenant que vous connaissez mieux les ensembles de données et les niveaux d'accès accordés en fonction des rôles, vous allez résoudre les difficultés soulevées plus tôt dans l'exemple de scénario :

Difficultés :

  • Certains de vos ensembles de données contiennent des informations sensibles pour lesquelles vous souhaitez contrôler les accès.
  • Votre équipe se plaint d'avoir des difficultés à localiser le bon ensemble de données parmi tous ceux auxquels elle a accès.

Pour vous conformer aux dernières exigences réglementaires, vous devez trouver un moyen clair de signaler tous les ensembles de données contenant des informations permettant d'identifier personnellement les utilisateurs. Pour résoudre ces problèmes et réaliser cette tâche, vous allez utiliser le service Data Catalog.

  1. Dans le menu de navigation, cliquez sur Data Catalog.
Remarque : Si le message "Travail non enregistré" s'affiche, cliquez sur QUITTER. Remarque : Si un message vous demande d'activer l'API, vous devrez vous connecter à nouveau avec le rôle Propriétaire pour le faire (une étape vue plus tôt dans l'atelier).
  1. Sur la page d'accueil de Data Catalog, sous Systèmes, appliquez le filtre BigQuery.
Remarque : Vous verrez peut-être également des lignes concernant le projet "qwiklabs-resources", mais vous pouvez les ignorer. Ce projet fournit des éléments partagés dans tous les ateliers.
  1. Saisissez qwiklabs-gcp dans la barre de recherche de Data Catalog pour exclure les ressources Qwiklabs externes.

  2. Vérifiez que la vue à laquelle vous avez accès en tant qu'analyste de données ressemble à celle-ci :

Quel que soit le projet auquel vous êtes connecté, Data Catalog affiche TOUS les ensembles de données BigQuery auxquels votre rôle a accès.

En tant qu'analyste de données, vous ne verrez pas l'ensemble de données new_york_mv_collisions dans Data Catalog, même s'il existe (nous l'avons interrogé avec le rôle Propriétaire).

Pourquoi ? Découvrez-le en explorant le fonctionnement du contrôle des accès dans Data Catalog.

Comment Data Catalog affiche les métadonnées

Avant de rechercher, découvrir ou afficher des ressources Google Cloud, Data Catalog vérifie que l'utilisateur dispose d'un rôle IAM avec les autorisations de lecture des métadonnées requises par BigQuery, Pub/Sub ou tout autre système source permettant d'accéder à la ressource.

Exemple : Data Catalog vérifie que l'utilisateur s'est vu attribuer un rôle doté de l'autorisation bigquery.tables.get avant d'afficher les métadonnées de la table BigQuery.

Tâche 5 : Créer un modèle de tag Data Catalog à partir d'un ensemble de données BigQuery

  1. Cliquez sur le nom de la table new_york_citibike. Il s'agit d'une sous-tâche de l'ensemble de données Bike Share auquel vous avez accès.

Au niveau des tables BigQuery, Data Catalog vous permet d'ajouter des tags aux éléments suivants :

  • L'ensemble de données même
  • La table
  • Les colonnes individuelles
  1. Essayez de cliquer sur le bouton Associer des tags :

  2. Vérifiez qu'un message d'erreur semblable à celui-ci s'affiche :

  1. Dans cette boîte de dialogue, pointez sur En savoir plus pour comprendre pourquoi cette fonctionnalité n'est pas disponible.

Le rôle Analyste de données permet de rechercher des métadonnées dans Data Catalog, mais pas d'ajouter des tags.

Maintenant, découvrez comment fonctionnent les autorisations d'ajout de tag et les modèles de tag dans Data Catalog.

Modèles, tags et autorisations Data Catalog

Les modèles de tag Data Catalog vous aident à créer et à gérer des métadonnées communes sur les éléments de données dans un emplacement unique. Les tags sont associés à l'élément de données, qui est donc visible dans le système Data Catalog. Cette fonctionnalité vous permet également de créer d'autres applications qui utilisent ces métadonnées contextuelles associées à un élément de données.

À quoi ressemble un modèle de tag ?

Qui peut créer un modèle de tag ?

Pour créer des modèles de tag, l'utilisateur doit au moins disposer d'un accès en modification à la ressource concernée (dans cet atelier, BigQuery) ET du rôle datacatalog.tagTemplateUser (sous réserve qu'un modèle ait déjà été créé). Pour en savoir plus, consultez le Guide IAM pour Data Catalog.

Et si vous avez besoin de créer un modèle de tag ? Pour cela, vous devez disposer au minimum d'un rôle datacatalog.tagTemplateCreator ou roles/datacatalog.tagTemplateOwner. Le rôle Propriétaire vous permet de supprimer les modèles existants et d'autres droits d'administrateur.

Les rôles Cloud IAM les plus souvent prédéfinis dans Data Catalog sont les suivants :

  • roles/datacatalog.tagTemplateViewer
  • roles/datacatalog.tagTemplateUser
  • roles/datacatalog.tagTemplateCreator
  • roles/datacatalog.tagTemplateOwner
  • Pour obtenir la liste complète des rôles, consultez Rôles Data Catalog

Tâche 6 : Créer un modèle Data Catalog

  1. Connectez-vous avec le rôle Propriétaire, qui dispose de l'autorisation roles/datacatalog.tagTemplateOwner.

  2. Sélectionnez le projet NYC Bike Share utilisé précédemment.

Remarque : Si une erreur d'autorisation s'affiche, reconnectez-vous avec les bons identifiants. Il se peut que vous ayez sélectionné le mauvais propriétaire.
  1. Accédez à Data Catalog.

  2. Créez un modèle de tag en cliquant sur Modèles de tag > Créer un modèle de tag.

  3. Saisissez les informations générales du nouveau modèle et nommez-le Ensembles de données New York.

  4. Sélectionnez l'emplacement .

  1. Cliquez sur Ajouter un champ.

  2. Nommez le nouveau champ Contient des infos personnelles, Cochez la case Rendre ce champ obligatoire, sélectionnez le type Booléen, puis cliquez sur OK.

  3. Cliquez sur Ajouter un champ.

  4. Nommez le champ Type d'infos personnelles, sélectionnez le type Énuméré, ajoutez les valeurs indiquées ci-dessous, puis cliquez sur OK une fois que vous avez terminé :

  • Valeur 1 : Aucun
  • Valeur 2 : Date de naissance
  • Valeur 3 : Genre
  • Valeur 4 : Zone géographique
  1. Cliquez sur Ajouter un champ.

  2. Nommez le champ Équipe propriétaire des données, cochez la case Rendre ce champ obligatoire, sélectionnez le type Énuméré, ajoutez les valeurs indiquées ci-dessous, puis cliquez sur OK une fois que vous avez terminé :

  • Valeur 1 : Marketing
  • Valeur 2 : Data science
  • Valeur 3 : Ventes
  • Valeur 4 : Ingénierie
  1. Cliquez sur Créer.

Ajouter des tags au niveau de l'ensemble de données

  1. Cliquez sur Rechercher les entrées qui n'utilisent pas ce modèle.

  2. Cliquez sur l'ensemble de données new_york_mv_collisions.

  3. Vous verrez qu'il n'y a aucun tag sous le nom de l'ensemble de données. Cliquez sur Associer des tags.

  4. Sélectionnez le modèle que vous avez créé précédemment, puis cliquez sur OK.

  5. À l'aide des menus déroulants, indiquez les valeurs ci-dessous pour les champs du modèle, puis cliquez sur Enregistrer.

  • Contient des infos personnelles : Vrai
  • Type d'infos personnelles : Zone géographique
  • Équipe propriétaire des données : Ingénierie
  1. Affichez les tags au niveau de l'ensemble de données.

Ajouter des tags au niveau des tables et des colonnes

Pour plus de précision, vous pouvez appliquer des tags au niveau des tables et des colonnes.

  1. Retournez aux éléments de notre précédente recherche, puis cliquez sur la table nypd_mv_collisions.

  2. Cliquez sur Associer des tags et définissez les champs suivants pour les tags de colonne et de schéma :

  • Table : nypd_mv_collisions

  • Colonne : Emplacement

  • Modèle de tag : Ensembles de données New York

  • Valeurs des tags :

    • Contient des infos personnelles : Vrai
    • Type d'infos personnelles : Zone géographique
    • Équipe propriétaire des données : Ingénierie
  1. Ensuite, cliquez sur Enregistrer.

  2. Ajoutez au champ un tag d'informations permettant d'identifier personnellement l'utilisateur en termes de géolocalisation, puis assurez-vous qu'il s'affiche lorsque vous cliquez sur le nom du modèle.

Cliquez sur Vérifier ma progression pour valider l'objectif. Créer un modèle de tag Data Catalog

Rechercher des ensembles de données par tag et clé de tag

Maintenant que vous avez ajouté des tags, vous pouvez les utiliser pour effectuer des recherches dans votre catalogue.

  1. Dans la barre de recherche, copiez et collez tag:qwiklabs-VOTRE-PROJET-ICI.ensembles_de_données_new_york.contient_des_infos_personnelles, puis remplacez le préfixe de l'ID de projet par l'ID de votre projet Qwiklabs en cours.

  1. Pour obtenir d'autres exemples de recherche rapide dans le catalogue, consultez Rechercher et afficher des éléments de données avec Data Catalog.

Félicitations !

Vous vous êtes familiarisé avec Data Catalog. Pour cela, vous avez effectué les tâches suivantes :

  • Explorer un environnement d'entreprise simulé associé à deux projets, deux ensembles de données et deux comptes utilisateur
  • Exécuter des requêtes pour mieux comprendre les colonnes de données sensibles auxquelles ajouter des tags par la suite
  • Utiliser Data Catalog pour rechercher des ensembles de données dans un projet
  • Utiliser les modèles de tag Data Catalog pour ajouter des tags de métadonnées enrichies aux éléments

Étapes suivantes et informations supplémentaires

Formations et certifications Google Cloud

Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.

Dernière mise à jour du manuel : 30 avril 2024

Dernier test de l'atelier : 30 avril 2024

Copyright 2025 Google LLC. Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.

Before you begin

  1. Labs create a Google Cloud project and resources for a fixed time
  2. Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
  3. On the top left of your screen, click Start lab to begin

Ce contenu n'est pas disponible pour le moment

Nous vous préviendrons par e-mail lorsqu'il sera disponible

Parfait !

Nous vous contacterons par e-mail s'il devient disponible

One lab at a time

Confirm to end all existing labs and start this one

Use private browsing to run the lab

Use an Incognito or private browser window to run this lab. This prevents any conflicts between your personal account and the Student account, which may cause extra charges incurred to your personal account.