arrow_back

Créer des modèles de ML avec BigQuery ML : atelier challenge

Testez vos connaissances et partagez-les avec notre communauté

Créer des modèles de ML avec BigQuery ML : atelier challenge

Atelier 1 heure 30 minutes universal_currency_alt 5 crédits show_chart Intermédiaire
info Cet atelier peut intégrer des outils d'IA pour vous accompagner dans votre apprentissage.
Testez vos connaissances et partagez-les avec notre communauté

GSP341

Présentation

Dans un atelier challenge, vous devez suivre un scénario et effectuer une série de tâches. Aucune instruction détaillée n'est fournie : vous devez utiliser les compétences acquises au cours des ateliers du cours correspondant pour déterminer comment procéder par vous-même. Vous saurez si vous avez exécuté correctement les différentes tâches grâce au score calculé automatiquement (affiché sur cette page).

Lorsque vous participez à un atelier challenge, vous n'étudiez pas de nouveaux concepts Google Cloud. Vous allez approfondir les compétences précédemment acquises. Par exemple, vous devrez modifier les valeurs par défaut ou encore examiner des messages d'erreur pour corriger vous-même les problèmes.

Pour atteindre le score de 100 %, vous devez mener à bien l'ensemble des tâches dans le délai imparti.

Cet atelier est recommandé aux participants inscrits au cours Créer des modèles de ML avec BigQuery ML et qui veulent obtenir le badge de compétence associé. Êtes-vous prêt pour le challenge ?

Préparation

Avant de cliquer sur le bouton "Démarrer l'atelier"

Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.

Cet atelier pratique vous permet de suivre les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Des identifiants temporaires vous sont fournis pour vous permettre de vous connecter à Google Cloud le temps de l'atelier.

Pour réaliser cet atelier :

  • Vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome).
Remarque : Ouvrez une fenêtre de navigateur en mode incognito (recommandé) ou de navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le compte temporaire de participant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.
  • Vous disposez d'un temps limité. N'oubliez pas qu'une fois l'atelier commencé, vous ne pouvez pas le mettre en pause.
Remarque : Utilisez uniquement le compte de participant pour cet atelier. Si vous utilisez un autre compte Google Cloud, des frais peuvent être facturés à ce compte.

Scénario du challenge

Vous venez de décrocher un poste de collaborateur junior dans le service Sciences des données. Votre équipe travaille sur différents projets de machine learning. Vous devez participer au développement et à l'évaluation d'ensembles de données et de modèles de machine learning afin de produire des insights basés sur des ensembles de données réelles.

Vous êtes censé disposer des compétences et connaissances requises pour ces tâches. Ne vous attendez donc pas à recevoir des instructions détaillées.

Les tâches suivantes de cet atelier permettront d'évaluer votre maîtrise de BigQuery et vos connaissances en machine learning.

Tâche 1 : Créer un ensemble de données et un modèle de machine learning

Un des projets sur lesquels vous travaillez vise à produire des analyses basées sur des données réelles. Votre rôle dans ce projet consiste à développer et évaluer des modèles de machine learning.

  • Dans cette tâche, vous allez créer un ensemble de données avec l'ID ecommerce dans lequel vous pourrez stocker vos modèles de machine learning.

  • Vous allez maintenant créer le modèle de machine learning customer_classification_model. Vous prédirez ensuite les performances de ce modèle. Exécutez la requête suivante pour créer le modèle customer_classification_model.

    CREATE OR REPLACE MODEL `ecommerce.customer_classification_model` OPTIONS ( model_type='logistic_reg', labels = ['will_buy_on_return_visit'] ) AS #standardSQL SELECT * EXCEPT(fullVisitorId) FROM # features (SELECT fullVisitorId, IFNULL(totals.bounces, 0) AS bounces, IFNULL(totals.timeOnSite, 0) AS time_on_site FROM `data-to-insights.ecommerce.web_analytics` WHERE totals.newVisits = 1 AND date BETWEEN '20160801' AND '20170430') # train on first 9 months JOIN (SELECT fullvisitorid, IF(COUNTIF(totals.transactions > 0 AND totals.newVisits IS NULL) > 0, 1, 0) AS will_buy_on_return_visit FROM `data-to-insights.ecommerce.web_analytics` GROUP BY fullvisitorid) USING (fullVisitorId);

Cliquez sur Vérifier ma progression pour valider l'objectif.

Vérifier qu'un ensemble de données et qu'un modèle ont été créés

Tâche 2 : Évaluer les performances du modèle de classification

Dans cette tâche, vous devez évaluer les performances du modèle customer_classification_model à partir de nouvelles données d'évaluation.

Dans BigQuery ML, roc_auc désigne simplement un champ interrogeable lors de l'évaluation du modèle de ML entraîné. Utilisez la fonction ML.EVALUATE dans la requête pour évaluer les performances du modèle.

Après avoir évalué votre modèle, examinez ses performances prédictives.

Cliquez sur Vérifier ma progression pour valider l'objectif.

Vérifier que les deux modèles de machine learning ont été évalués

Tâche 3 : Améliorer les performances du modèle par ingénierie des caractéristiques et évaluer ses nouvelles performances prédictives

Dans cette tâche, utilisez les caractéristiques de l'ensemble de données susceptibles d'aider le modèle customer_classification_model à mieux comprendre la relation entre la première session d'un visiteur et la probabilité qu'il effectue un achat lors d'une prochaine visite.

Créez un second modèle de machine learning nommé improved_customer_classification_model comprenant de nouvelles caractéristiques.

  • Étape du processus de paiement à laquelle le visiteur s'est arrêté
  • Provenance du visiteur (source du trafic : recherche naturelle, site référent, etc.)
  • Catégorie d'appareil (mobile, tablette, ordinateur de bureau)
  • Localisation géographique (pays)

Évaluez à présent les performances prédictives du nouveau modèle improved_customer_classification_model pour déterminer si elles sont meilleures que celles du modèle customer_classification_model.

Cliquez sur Vérifier ma progression pour valider l'objectif.

Améliorer et évaluer les performances du modèle

Tâche 4 : Prédire quels nouveaux visiteurs reviendront effectuer un achat

Vous allez maintenant créer le modèle de machine learning finalized_classification_model. Vous prédirez ensuite les performances de ce modèle. Exécutez la requête suivante pour créer le modèle finalized_classification_model.

CREATE OR REPLACE MODEL `ecommerce.finalized_classification_model` OPTIONS (model_type="logistic_reg", labels = ["will_buy_on_return_visit"]) AS WITH all_visitor_stats AS ( SELECT fullvisitorid, IF(COUNTIF(totals.transactions > 0 AND totals.newVisits IS NULL) > 0, 1, 0) AS will_buy_on_return_visit FROM `data-to-insights.ecommerce.web_analytics` GROUP BY fullvisitorid ) # add in new features SELECT * EXCEPT(unique_session_id) FROM ( SELECT CONCAT(fullvisitorid, CAST(visitId AS STRING)) AS unique_session_id, # labels will_buy_on_return_visit, MAX(CAST(h.eCommerceAction.action_type AS INT64)) AS latest_ecommerce_progress, # behavior on the site IFNULL(totals.bounces, 0) AS bounces, IFNULL(totals.timeOnSite, 0) AS time_on_site, IFNULL(totals.pageviews, 0) AS pageviews, # where the visitor came from trafficSource.source, trafficSource.medium, channelGrouping, # mobile or desktop device.deviceCategory, # geographic IFNULL(geoNetwork.country, "") AS country FROM `data-to-insights.ecommerce.web_analytics`, UNNEST(hits) AS h JOIN all_visitor_stats USING(fullvisitorid) WHERE 1=1 # only predict for new visits AND totals.newVisits = 1 AND date BETWEEN "20160801" AND "20170430" # train 9 months GROUP BY unique_session_id, will_buy_on_return_visit, bounces, time_on_site, totals.pageviews, trafficSource.source, trafficSource.medium, channelGrouping, device.deviceCategory, country );
  1. Rédigez une requête permettant de prédire quels nouveaux visiteurs reviendront effectuer un achat.
  2. La requête emploie le modèle finalized_classification_model afin de calculer la probabilité qu'un nouveau visiteur du Google Merchandise Store achète un produit lors d'une prochaine visite.
  3. Vous devez établir les prédictions pour le dernier mois (sur les 12 mois que compte l'ensemble de données).

Cliquez sur Vérifier ma progression pour valider l'objectif.

Prédire quels nouveaux visiteurs reviendront effectuer un achat

Félicitations !

Vous avez créé des modèles de ML avec BigQuery ML.

Gagnez un badge de compétence

Cet atelier d'auto-formation est associé au cours Créer des modèles de ML avec BigQuery ML. Si vous terminez ce cours, vous obtiendrez le badge de compétence ci-dessus attestant de votre réussite. Ajoutez votre badge à votre CV et partagez-le sur les réseaux sociaux en utilisant le hashtag #GoogleCloudBadge.

Ce badge de compétence est associé au parcours de formation Analyste de données de Google Cloud. Si vous avez déjà obtenu les autres badges de compétence de ce parcours de formation, explorez le catalogue pour vous inscrire à des cours proposant d'autres badges.

Formations et certifications Google Cloud

Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.

Dernière mise à jour du manuel : 13 février 2025

Dernier test de l'atelier : 13 février 2025

Copyright 2025 Google LLC. Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.

Before you begin

  1. Labs create a Google Cloud project and resources for a fixed time
  2. Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
  3. On the top left of your screen, click Start lab to begin

Ce contenu n'est pas disponible pour le moment

Nous vous préviendrons par e-mail lorsqu'il sera disponible

Parfait !

Nous vous contacterons par e-mail s'il devient disponible

One lab at a time

Confirm to end all existing labs and start this one

Use private browsing to run the lab

Use an Incognito or private browser window to run this lab. This prevents any conflicts between your personal account and the Student account, which may cause extra charges incurred to your personal account.