
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Run a query (dataset: samples, table: shakespeare, substring: raisin)
/ 10
Run a query (dataset: samples, table: shakespeare, substring: huzzah)
/ 10
Create a new dataset (name: babynames)
/ 20
Load the data into a new table
/ 20
Run queries against your dataset table
/ 20
Remove the babynames dataset
/ 20
Sans le matériel et l'infrastructure adaptés, stocker et interroger des ensembles de données volumineux peut s'avérer chronophage et coûteux. BigQuery est un entrepôt de données cloud sans serveur hautement évolutif qui résout ce problème en permettant d'effectuer des requêtes SQL ultra-rapides grâce à la puissance de traitement de l'infrastructure de Google. Il vous suffit de transférer vos données dans BigQuery. Nous nous chargeons du reste. Vous pouvez contrôler l'accès au projet et à vos données en fonction des besoins de votre entreprise, par exemple en autorisant d'autres personnes à afficher vos données ou à les interroger.
Vous pouvez accéder à BigQuery via la console, l'interface utilisateur Web ou un outil de ligne de commande en utilisant diverses bibliothèques clientes telles que Java, .NET ou Python. Plusieurs fournisseurs de solutions permettent également d'interagir avec BigQuery.
Dans cet atelier pratique, vous allez apprendre à utiliser bq
, l'outil de ligne de commande basé sur Python pour BigQuery, afin d'interroger des tables publiques et de charger des exemples de données dans BigQuery.
Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.
Cet atelier pratique vous permet de suivre les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Des identifiants temporaires vous sont fournis pour vous permettre de vous connecter à Google Cloud le temps de l'atelier.
Pour réaliser cet atelier :
Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, une boîte de dialogue s'affiche pour vous permettre de sélectionner un mode de paiement. Sur la gauche, vous trouverez le panneau "Détails concernant l'atelier", qui contient les éléments suivants :
Cliquez sur Ouvrir la console Google Cloud (ou effectuez un clic droit et sélectionnez Ouvrir le lien dans la fenêtre de navigation privée si vous utilisez le navigateur Chrome).
L'atelier lance les ressources, puis ouvre la page "Se connecter" dans un nouvel onglet.
Conseil : Réorganisez les onglets dans des fenêtres distinctes, placées côte à côte.
Si nécessaire, copiez le nom d'utilisateur ci-dessous et collez-le dans la boîte de dialogue Se connecter.
Vous trouverez également le nom d'utilisateur dans le panneau "Détails concernant l'atelier".
Cliquez sur Suivant.
Copiez le mot de passe ci-dessous et collez-le dans la boîte de dialogue Bienvenue.
Vous trouverez également le mot de passe dans le panneau "Détails concernant l'atelier".
Cliquez sur Suivant.
Accédez aux pages suivantes :
Après quelques instants, la console Cloud s'ouvre dans cet onglet.
Cloud Shell est une machine virtuelle qui contient de nombreux outils pour les développeurs. Elle comprend un répertoire d'accueil persistant de 5 Go et s'exécute sur Google Cloud. Cloud Shell vous permet d'accéder via une ligne de commande à vos ressources Google Cloud.
Une fois connecté, vous êtes en principe authentifié et le projet est défini sur votre ID_PROJET. Le résultat contient une ligne qui déclare YOUR_PROJECT_ID (VOTRE_ID_PROJET) pour cette session :
gcloud
est l'outil de ligne de commande pour Google Cloud. Il est préinstallé sur Cloud Shell et permet la complétion par tabulation.
Cliquez sur Autoriser.
Vous devez à présent obtenir le résultat suivant :
Résultat :
Résultat :
Exemple de résultat :
gcloud
, dans Google Cloud, accédez au guide de présentation de la gcloud CLI.
BigQuery propose plusieurs exemples de tables sur lesquels vous pouvez exécuter des requêtes. Dans cet atelier, vous allez exécuter des requêtes sur la table shakespeare
, qui contient une entrée pour chaque mot apparaissant dans les pièces de l'auteur.
Pour examiner le schéma de la table Shakespeare dans l'ensemble de données "samples", exécutez la commande suivante :
Dans cette commande :
bq
appelle l'outil de ligne de commande de BigQuery.show
est l'action.project:public dataset.table
).Résultat :
Lorsque vous incluez le nom d'une commande dans les commandes help, vous obtenez des informations la concernant.
bq help
présenté ci-dessous permet de récupérer des informations relatives à la commande query
:bq
, il suffit d'exécuter bq help
.Vous allez maintenant exécuter une requête pour savoir combien de fois la sous-chaîne "raisin" apparaît dans les œuvres de Shakespeare.
bq query "[SQL_STATEMENT]"
:Échappez les éventuels guillemets utilisés dans l'instruction [SQL_STATEMENT] à l'aide du symbole \.
Utilisez un type de guillemets autre que celui servant à englober l'instruction (' au lieu de ").
Dans cette commande :
--use_legacy_sql=false
fait du langage SQL standard la syntaxe de requête par défaut.Résultat :
La table indique que le mot raisin n'apparaît jamais en entier. Cependant, les lettres qui le composent apparaissent dans l'ordre dans plusieurs œuvres de Shakespeare.
Cliquez sur Vérifier ma progression pour valider la tâche exécutée. Si vous avez réussi à exécuter une requête sur un ensemble de données public, vous verrez une note d'évaluation s'afficher.
Si vous recherchez un mot qui ne figure pas dans les œuvres de Shakespeare, aucun résultat n'est renvoyé.
Cliquez sur Vérifier ma progression pour valider la tâche exécutée. Si vous avez réussi à exécuter une requête sur un ensemble de données public, vous verrez une note d'évaluation s'afficher.
Maintenant, créez votre propre table. Chaque table est stockée dans un ensemble de données. Un ensemble de données correspond à un groupe de ressources telles que des tables et des vues.
bq ls
pour afficher les ensembles de données existants dans votre projet :Vous êtes redirigé vers la ligne de commande, car votre projet ne comporte encore aucun ensemble de données.
bq ls
avec l'ID de projet bigquery-public-data
suivi d'un deux-points (:) pour afficher les ensembles de données de ce projet en particulier :Résultat :
Maintenant, créez un ensemble de données. Le nom de l'ensemble de données doit comporter 1 024 caractères maximum et contenir uniquement des lettres (A-Z, a-z), des chiffres (0-9) et des traits de soulignement. Il ne doit pas commencer par un nombre ou un trait de soulignement ni comporter d'espaces.
bq mk
pour créer un ensemble de données nommé babynames
dans votre projet :Exemple de résultat :
Cliquez sur Vérifier ma progression pour valider la tâche exécutée. Si vous avez réussi à créer un ensemble de données BigQuery nommé babynames, vous verrez une note d'évaluation s'afficher.
bq ls
pour vérifier que l'ensemble de données apparaît désormais dans votre projet :Exemple de résultat :
Avant de pouvoir créer la table, vous devez ajouter l'ensemble de données à votre projet. Le fichier de données personnalisées que vous utiliserez contient environ 7 Mo de données correspondant aux prénoms populaires donnés aux bébés. Il est fourni par l'Administration de la sécurité sociale des États-Unis.
Le nom du fichier apparaît désormais dans votre projet.
La commande bq load
crée ou met à jour une table, et y charge des données en une seule et même opération.
À l'aide de la commande bq load
, vous allez charger votre fichier source dans une nouvelle table, intitulée names2010, dans l'ensemble de données babynames que vous venez de créer. Par défaut, l'exécution de cette commande s'effectue de manière synchrone et prend quelques secondes.
Les arguments bq load
que vous allez exécuter sont :
Exemple de résultat :
Cliquez sur Vérifier ma progression pour valider la tâche exécutée. Si vous avez réussi à charger des données dans une table de l'ensemble de données, vous verrez une note d'évaluation s'afficher.
bq ls
avec babynames
pour vérifier que la table apparaît désormais dans votre ensemble de données :Résultat :
bq show
en indiquant votre ensemble de données et votre table (dataset.table
) pour afficher le schéma de la table :Résultat :
-E
. Pour en savoir plus sur l'encodage des caractères, consultez le guide Présentation du chargement des données.
Vous pouvez maintenant interroger les données pour obtenir des résultats intéressants.
Résultat :
Résultat :
Cliquez sur Vérifier ma progression pour valider la tâche exécutée. Si vous avez réussi à interroger un ensemble de données personnalisé, vous verrez une note d'évaluation s'afficher.
Voici quelques questions à choix multiples qui vous permettront de mieux maîtriser les concepts abordés lors de cet atelier. Répondez-y du mieux que vous le pouvez.
bq rm
pour supprimer l'ensemble de données babynames
, en ajoutant l'option -r
pour effacer toutes les tables de l'ensemble de données :Y
.Cliquez sur Vérifier ma progression pour valider la tâche exécutée. Si vous avez réussi à supprimer l'ensemble de données babynames, vous verrez une note d'évaluation s'afficher.
Vous pouvez maintenant utiliser la ligne de commande pour interroger des tables publiques et charger des exemples de données dans BigQuery.
Cet atelier fait partie d'une série appelée "Qwik Starts". Les ateliers de cette série sont conçus pour vous donner un aperçu des nombreuses fonctionnalités proposées par Google Cloud. Pour suivre un autre atelier, recherchez "Qwik Starts" dans le catalogue.
Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.
Dernière mise à jour du manuel : 26 janvier 2024
Dernier test de l'atelier : 24 août 2023
Copyright 2025 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.
Ce contenu n'est pas disponible pour le moment
Nous vous préviendrons par e-mail lorsqu'il sera disponible
Parfait !
Nous vous contacterons par e-mail s'il devient disponible
One lab at a time
Confirm to end all existing labs and start this one