![](https://cdn.qwiklabs.com/assets/labs/start_lab-f45aca49782d4033c3ff688160387ac98c66941d.png)
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create a BigQuery dataset
/ 20
Create a model to predict visitor transaction
/ 20
Evaluate the model
/ 20
Predict purchases per country
/ 20
Predict purchases per user
/ 20
BigQuery ML permet aux utilisateurs de créer et d'exécuter des modèles de machine learning dans BigQuery à l'aide de requêtes SQL. L'objectif est de démocratiser le machine learning en permettant aux utilisateurs de SQL de créer des modèles à l'aide de leurs propres outils et d'accélérer le rythme de développement en leur évitant d'avoir à transférer des données.
Nous mettons à votre disposition un ensemble de données d'e-commerce comprenant des millions d'enregistrements Google Analytics pour le Google Merchandise Store, qui sont chargés dans BigQuery. Dans cet atelier, vous allez utiliser ces données pour créer un modèle capable de prédire si un visiteur effectuera une transaction.
Dans cet atelier, vous allez apprendre à :
Pour exploiter pleinement cet atelier de formation, vous devez posséder des connaissances de base de SQL ou de BigQuery.
Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.
Cet atelier pratique vous permet de suivre vous-même les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Nous vous fournissons des identifiants temporaires pour vous connecter à Google Cloud le temps de l'atelier.
Pour réaliser cet atelier :
Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, un pop-up s'affiche pour vous permettre de sélectionner un mode de paiement. Sur la gauche, vous trouverez le panneau Détails concernant l'atelier, qui contient les éléments suivants :
Cliquez sur Ouvrir la console Google Cloud (ou effectuez un clic droit et sélectionnez Ouvrir le lien dans la fenêtre de navigation privée si vous utilisez le navigateur Chrome).
L'atelier lance les ressources, puis ouvre la page Se connecter dans un nouvel onglet.
Conseil : Réorganisez les onglets dans des fenêtres distinctes, placées côte à côte.
Si nécessaire, copiez le nom d'utilisateur ci-dessous et collez-le dans la boîte de dialogue Se connecter.
Vous trouverez également le nom d'utilisateur dans le panneau Détails concernant l'atelier.
Cliquez sur Suivant.
Copiez le mot de passe ci-dessous et collez-le dans la boîte de dialogue Bienvenue.
Vous trouverez également le mot de passe dans le panneau Détails concernant l'atelier.
Cliquez sur Suivant.
Accédez aux pages suivantes :
Après quelques instants, la console Cloud s'ouvre dans cet onglet.
Le message Bienvenue sur BigQuery dans Cloud Console s'affiche. Il contient un lien vers le guide de démarrage rapide et les notes de version.
La console BigQuery s'ouvre.
bqml_lab
pour l'ID de l'ensemble de données et cliquez sur Créer un ensemble de données.Cliquez sur Vérifier ma progression pour valider la tâche exécutée. Si votre tâche a bien été exécutée, vous recevez une note d'évaluation.
Entrons à présent dans le vif du sujet !
Le système d'exploitation de l'appareil utilisé par le visiteur, le type d'appareil (mobile), la situation géographique du visiteur (pays) et le nombre de pages vues figurent parmi les critères pris en compte pour déterminer si une transaction a été effectuée.
Dans ce cas précis, bqml_lab
désigne l'ensemble de données, et sample_model
le modèle (en l'occurrence, il s'agit d'un modèle de type régression logistique binaire). L'étiquette (label
) représente le résultat que vous cherchez à obtenir.
input_label_cols
.
Seules les données recueillies entre le 1er août 2016 et le 30 juin 2017 sont utilisées pour l'entraînement, ce qui permet de réserver les données du dernier mois de la période pour les prédictions. Afin de gagner du temps, le nombre de points de données est limité à 100 000.
Utilisez ensuite la commande CREATE MODEL
(Créer un modèle) pour créer une tâche de requête qui sera exécutée de façon asynchrone, ce qui vous laisse le temps de fermer ou d'actualiser la fenêtre BigQuery, par exemple.
Cliquez sur Vérifier ma progression pour valider la tâche exécutée. Si votre tâche a bien été exécutée, vous recevez une note d'évaluation.
Si cela vous intéresse, vous pouvez obtenir des informations sur le modèle en développant l'ensemble de données bqml_lab
, puis en cliquant sur le modèle sample_model
dans l'UI. Sous l'onglet Détails, vous devriez trouver des informations de base concernant le modèle ainsi que les options d'entraînement utilisées pour le créer. Sous Entraînement, vous devriez voir une table ou des graphiques, selon les paramètres Afficher en tant que que vous avez définis :
Avec un modèle de régression linéaire, la requête ci-dessus renvoie les colonnes suivantes :
mean_absolute_error
, mean_squared_error
, mean_squared_log_error
median_absolute_error
, r2_score
, explained_variance
La même requête renvoie les colonnes suivantes avec un modèle de régression logistique :
precision
, recall
accuracy
, f1_score
log_loss
, roc_auc
Pour connaître la signification de chaque métrique et leur méthode de calcul, consultez le glossaire du machine learning ou faites une recherche Google.
Comme vous pouvez le constater, les parties SELECT
et FROM
de la requête sont identiques à celles utilisées lors de l'entraînement. Par contre, la période a changé dans la partie WHERE
, et dans la partie FROM
, vous appelez ml.EVALUATE
.
Un tableau semblable à ce qui suit doit s'afficher :
Cliquez sur Vérifier ma progression pour valider la tâche exécutée. Si votre tâche a bien été exécutée, vous recevez une note d'évaluation.
Avec la requête suivante, vous allez pouvoir prédire le nombre de transactions effectuées par les visiteurs dans chaque pays, trier les résultats et établir un classement des 10 pays qui enregistreront le plus de transactions :
Cette requête ressemble beaucoup à la requête d'évaluation de la section précédente, sauf que vous utilisez ml.PREDICT
à la place de ml.EVALUATE
, et que la partie BigQuery ML de la requête a été enveloppée avec des commandes SQL standards. Pour cet atelier, nous nous intéressons aux pays et au nombre de transactions dans chacun d'eux, ce qui explique l'utilisation des commandes SELECT
, GROUP BY
et ORDER BY
. La commande LIMIT
, quant à elle, limite les résultats aux 10 pays arrivés en tête.
Un tableau semblable à ce qui suit doit s'afficher :
Cliquez sur Vérifier ma progression pour valider la tâche exécutée. Si votre tâche a bien été exécutée, vous recevez une note d'évaluation.
Considérons un autre exemple. Cette fois-ci, vous allez pouvoir prédire le nombre de transactions effectuées par chaque visiteur, trier les résultats et établir un classement des 10 visiteurs qui réaliseront le plus de transactions :
Un tableau semblable à ce qui suit doit s'afficher :
Cliquez sur Vérifier ma progression pour valider la tâche exécutée. Si votre tâche a bien été exécutée, vous recevez une note d'évaluation.
Voici quelques questions à choix multiples qui vous permettront de mieux maîtriser les concepts abordés lors de cet atelier. Répondez-y du mieux que vous le pouvez.
Vous avez utilisé BigQuery ML pour créer un modèle de régression logistique binaire, l'évaluer et l'utiliser pour effectuer des prédictions.
Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.
Dernière mise à jour du manuel : 22 février 2024
Dernier test de l'atelier : 22 février 2024
Copyright 2025 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.
Ce contenu n'est pas disponible pour le moment
Nous vous préviendrons par e-mail lorsqu'il sera disponible
Parfait !
Nous vous contacterons par e-mail s'il devient disponible
One lab at a time
Confirm to end all existing labs and start this one