Points de contrôle
Create a Vertex AI Notebook
/ 30
Clone the lab repository
/ 30
Create a BigQuery dataset
/ 30
Create a BQML model to predict user churn
/ 30
Evaluate BQML model
/ 30
Batch predict user churn
/ 30
Déployer un classificateur BigQuery ML de perte de clients sur Vertex AI pour obtenir des prédictions en ligne
- GSP944
- Présentation
- Objectifs
- Préparation
- Tâche 1 : Activer les services Google Cloud
- Tâche 2 : Déployer une instance de notebook Vertex
- Tâche 3 : Cloner le dépôt de l'atelier
- Tâche 4 : Créer un ensemble de données BigQuery
- Tâche 5 : Créer un modèle BigQuery ML XGBoost de prédiction de perte d'utilisateurs
- Tâche 6 : Évaluer votre modèle BigQuery ML
- Tâche 7 : Générer des prédictions de perte d'utilisateurs par lot à l'aide de votre modèle BigQuery ML
- Félicitations !
GSP944
Présentation
Dans cet atelier, vous allez entraîner, régler, évaluer, expliquer et générer des prédictions par lot et en ligne avec un modèle BigQuery ML XGBoost. Vous allez vous servir de l'ensemble de données Google Analytics 4 de Flood-It!, une vraie application mobile (disponible sur Android et iOS), pour déterminer la probabilité que ses utilisateurs y reviennent. Vous allez générer des prédictions par lot à l'aide de votre modèle BigQuery ML avant de l'exporter vers Vertex AI et de le déployer afin d'obtenir des prédictions en ligne avec le SDK Vertex pour Python.
BigQuery ML vous permet d'entraîner des modèles de machine learning et d'exécuter des inférences par lot dans BigQuery plus rapidement à l'aide de requêtes SQL standards comportant moins de lignes de code, sans avoir à déplacer les données.
Vertex AI est la plate-forme nouvelle génération unifiée et sans frais de Google Cloud pour le développement du machine learning. En développant et en déployant des solutions de machine learning BigQuery ML sur Vertex AI, vous pourrez exploiter un service de prédictions en ligne évolutif ainsi que des outils MLOps pour réentraîner et surveiller vos modèles. Ainsi, vous améliorerez grandement votre productivité lors du développement (soit votre capacité à faire évoluer votre workflow et votre prise de décision à l'aide de vos données), ce qui vous permettra d'accélérer le retour sur investissement.
Remarque : BQML est désormais BigQuery ML.
Cet atelier est inspiré de l'article de blog Churn prediction for game developers using Google Analytics 4 (GA4) and BigQuery ML (Prédiction de la perte d'utilisateurs pour les développeurs de jeux vidéo à l'aide de Google Analytics 4 [GA4] et de BigQuery ML) et le complète. Lisez-le ainsi que le tutoriel associé pour en savoir plus sur ce cas d'utilisation et sur BigQuery ML.
Dans cet atelier, vous allez franchir une étape supplémentaire. En effet, vous allez découvrir en quoi Vertex AI complète les fonctionnalités de BigQuery ML grâce aux prédictions en ligne. Ainsi, vous allez pouvoir intégrer les prédictions de perte de clients dans des interfaces utilisateur facilitant la prise de décision, telles que les tableaux de bord Looker, mais aussi incorporer des prédictions en ligne directement dans des applications de clients pour permettre des interventions ciblées telles que l'affichage de programmes d'incitations.
Objectifs
Dans cet atelier, vous allez apprendre à effectuer les tâches suivantes :
- Explorer et prétraiter un échantillon de données Google Analytics 4 dans BigQuery pour le machine learning
- Entraîner un classificateur BigQuery ML XGBoost pour prédire la perte d'utilisateurs d'une application mobile de jeu vidéo
- Régler un classificateur BigQuery ML XGBoost à l'aide des fonctionnalités de réglage des hyperparamètres de BigQuery ML
- Évaluer les performances d'un classificateur BigQuery ML XGBoost
- Expliquer votre modèle XGBoost grâce aux attributions de caractéristiques globales d'Explainable AI dans BigQuery ML
- Générer des prédictions par lot avec votre modèle BigQuery ML XGBoost
- Exporter un modèle BigQuery ML XGBoost vers un bucket Google Cloud Storage
- Importer un modèle BigQuery ML XGBoost et le déployer sur un point de terminaison Vertex AI Prediction pour obtenir des prédictions en ligne
Préparation
Avant de cliquer sur le bouton "Démarrer l'atelier"
Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.
Cet atelier pratique vous permet de suivre vous-même les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Nous vous fournissons des identifiants temporaires pour vous connecter à Google Cloud le temps de l'atelier.
Pour réaliser cet atelier :
- vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome) ;
- vous disposez d'un temps limité ; une fois l'atelier commencé, vous ne pouvez pas le mettre en pause.
Activer Cloud Shell
Cloud Shell est une machine virtuelle qui contient de nombreux outils pour les développeurs. Elle comprend un répertoire d'accueil persistant de 5 Go et s'exécute sur Google Cloud. Cloud Shell vous permet d'accéder via une ligne de commande à vos ressources Google Cloud.
- Cliquez sur Activer Cloud Shell en haut de la console Google Cloud.
Une fois connecté, vous êtes en principe authentifié et le projet est défini sur votre ID_PROJET. Le résultat contient une ligne qui déclare YOUR_PROJECT_ID (VOTRE_ID_PROJET) pour cette session :
gcloud
est l'outil de ligne de commande pour Google Cloud. Il est préinstallé sur Cloud Shell et permet la complétion par tabulation.
- (Facultatif) Vous pouvez lister les noms des comptes actifs à l'aide de cette commande :
-
Cliquez sur Autoriser.
-
Vous devez à présent obtenir le résultat suivant :
Résultat :
- (Facultatif) Vous pouvez lister les ID de projet à l'aide de cette commande :
Résultat :
Exemple de résultat :
gcloud
, dans Google Cloud, accédez au guide de présentation de la gcloud CLI.
Tâche 1 : Activer les services Google Cloud
- Dans Cloud Shell, utilisez la commande
gcloud
pour activer les services requis pour l'atelier :
Tâche 2 : Déployer une instance de notebook Vertex
-
Accédez au menu de navigation () > Vertex AI > Workbench.
-
Sur la page "Instances de notebook", accédez à l'onglet Notebooks gérés par l'utilisateur et cliquez sur Créer.
-
Dans le menu de personnalisation de la nouvelle instance, sélectionnez Environnement et choisissez la version TensorFlow Enterprise 2.11.
-
Dans la boîte de dialogue Nouvelle instance, pour Région, sélectionnez
. Pour Zone, choisissez . Conservez les options par défaut pour tous les autres champs, puis cliquez sur Créer.
Après quelques minutes, la console Vertex AI affiche le nom de votre instance, suivi de Open Jupyterlab
(Ouvrir Jupyterlab).
- Cliquez sur Open JupyterLab (Ouvrir JupyterLab).
Votre notebook est maintenant configuré.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Tâche 3 : Cloner le dépôt de l'atelier
À présent, vous allez cloner le notebook training-data-analyst
dans votre instance JupyterLab.
- Dans JupyterLab, cliquez sur l'icône Terminal pour ouvrir un nouveau terminal.
Cancel
(Annuler).- Pour cloner le dépôt GitHub
training-data-analyst
, saisissez la commande suivante, puis appuyez sur Entrée :
- Pour vérifier que vous avez bien cloné le dépôt, double-cliquez sur le répertoire
training-data-analyst
et vérifiez que vous pouvez voir son contenu.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Accéder au notebook de l'atelier
-
Dans votre notebook, accédez à training-data-analyst > quests > vertex-ai> vertex-bqml, puis ouvrez le fichier lab_exercise.ipynb.
-
Continuez l'atelier dans le notebook et exécutez chaque cellule en cliquant sur l'icône Exécuter en haut de l'écran. Vous pouvez aussi exécuter le code d'une cellule en appuyant sur MAJ+ENTRÉE.
Lisez les explications et assurez-vous de bien comprendre ce qui se passe dans chaque cellule. À mesure que vous parcourez le notebook de l'atelier, référez-vous à ces instructions pour effectuer les exercices notés.
Tâche 4 : Créer un ensemble de données BigQuery
Cliquez sur Vérifier ma progression pour valider l'objectif.
Tâche 5 : Créer un modèle BigQuery ML XGBoost de prédiction de perte d'utilisateurs
Cliquez sur Vérifier ma progression pour valider l'objectif.
Tâche 6 : Évaluer votre modèle BigQuery ML
Cliquez sur Vérifier ma progression pour valider l'objectif.
Tâche 7 : Générer des prédictions de perte d'utilisateurs par lot à l'aide de votre modèle BigQuery ML
Cliquez sur Vérifier ma progression pour valider l'objectif.
Félicitations !
Dans cet atelier, vous avez entraîné, réglé, expliqué et déployé sur Vertex AI un modèle BigQuery ML pour générer des prédictions de perte d'utilisateurs par lot et en ligne critiques. Ensuite, vous avez ciblé les clients susceptibles de se désengager avec des interventions telles que l'affichage de récompenses dans le jeu et l'envoi de notifications de rappel.
Étapes suivantes et informations supplémentaires
Pour en savoir plus sur Vertex AI, consultez la documentation Vertex AI.
Formations et certifications Google Cloud
Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.
Dernière mise à jour du manuel : 17 avril 2024
Dernier test de l'atelier : 17 avril 2024
Copyright 2024 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.