Points de contrôle
Enable cloud service
/ 30
Create an instance of AI Platform Pipelines
/ 10
Create an instance of Cloud AI Platform Notebooks.
/ 10
Clone the example repo within AI Platform Notebooks instance
/ 5
Configure and run CsvExampleGen
/ 10
Create and run training component
/ 10
Présentation des composants TFX standards
- Présentation
- Préparation
- Tâche 1 : Activer les services Cloud
- Tâche 2 : Créez une instance AI Platform Pipelines
- Tâche 3 : Créer une instance de notebook Cloud AI Platform
- Tâche 4 : Cloner l'exemple de dépôt dans votre instance AI Platform Notebooks
- Tâche 5 : Exécuter le job d'entraînement dans le cloud
- Félicitations !
- Terminer l'atelier
Présentation
Dans cet atelier, vous allez utiliser TFX pour analyser, comprendre et prétraiter l'ensemble de données "Covertype" ainsi que pour entraîner, analyser, valider et déployer un modèle de classification à classes multiples permettant de prédire le type de couverture forestière d'une zone à partir de caractéristiques cartographiques.
Objectifs
- Mieux comprendre les composants des pipelines TFX
- Apprendre à utiliser un contexte interactif TFX pour développer des prototypes de pipelines TFX
- Utiliser la bibliothèque TensorFlow Data Validation (TFDV) pour explorer et analyser les données d'entrée
- Utiliser la bibliothèque Tensorflow Transform (TFT) pour prétraiter les données et transformer les caractéristiques de façon évolutive
- Utiliser la bibliothèque Tensorflow Model Analysis (TFMA) pour évaluer le modèle
Préparation
Pour chaque atelier, nous vous attribuons un nouveau projet Google Cloud et un nouvel ensemble de ressources pour une durée déterminée, sans frais.
-
Connectez-vous à Qwiklabs dans une fenêtre de navigation privée.
-
Vérifiez le temps imparti pour l'atelier (par exemple :
01:15:00
) : vous devez pouvoir le terminer dans ce délai.
Une fois l'atelier lancé, vous ne pouvez pas le mettre en pause. Si nécessaire, vous pourrez le redémarrer, mais vous devrez tout reprendre depuis le début. -
Lorsque vous êtes prêt, cliquez sur Démarrer l'atelier.
-
Notez vos identifiants pour l'atelier (Nom d'utilisateur et Mot de passe). Ils vous serviront à vous connecter à Google Cloud Console.
-
Cliquez sur Ouvrir la console Google.
-
Cliquez sur Utiliser un autre compte, puis copiez-collez les identifiants de cet atelier lorsque vous y êtes invité.
Si vous utilisez d'autres identifiants, des messages d'erreur s'afficheront ou des frais seront appliqués. -
Acceptez les conditions d'utilisation et ignorez la page concernant les ressources de récupération des données.
Activer Cloud Shell
Cloud Shell est une machine virtuelle qui contient des outils pour les développeurs. Elle comprend un répertoire d'accueil persistant de 5 Go et s'exécute sur Google Cloud. Google Cloud Shell vous permet d'accéder via une ligne de commande à vos ressources Google Cloud. gcloud
est l'outil de ligne de commande associé à Google Cloud. Il est préinstallé sur Cloud Shell et permet la saisie semi-automatique via la touche Tabulation.
-
Dans Google Cloud Console, dans le volet de navigation, cliquez sur Activer Cloud Shell ().
-
Cliquez sur Continuer.
Le provisionnement et la connexion à l'environnement prennent quelques instants. Une fois connecté, vous êtes en principe authentifié, et le projet est défini sur votre ID_PROJET. Exemple :
Exemples de commandes
-
Afficher le nom du compte actif :
(Résultat)
(Exemple de résultat)
-
Afficher l'ID du projet :
(Résultat)
(Exemple de résultat)
Tâche 1 : Activer les services Cloud
- Dans Cloud Shell, exécutez la commande suivante pour définir l'ID de votre projet Google Cloud :
- Ensuite, exécutez les commandes suivantes pour activer les services Cloud requis :
- À présent, ajoutez l'autorisation "Éditeur" à votre compte de service Cloud Build :
- Après cela, créez un compte de service personnalisé pour accorder au job d'entraînement CAIP l'accès au service AI Platform Vizier pour le réglage des hyperparamètres du pipeline :
- Accordez à votre compte de service AI Platform des droits d'accès supplémentaires au service AI Platform Vizier pour le réglage des hyperparamètres du pipeline :
- Attribuez au compte de service le rôle d'administrateur de l'espace de stockage :
- Accordez au compte de service le rôle d'administrateur AI Platform Vizier :
- Attribuez au compte de service AI Platform géré par Google de votre projet le rôle d'administrateur de compte de service pour votre compte de service AI Platform :
Cliquez sur Vérifier ma progression pour valider l'objectif.
Tâche 2 : Créez une instance AI Platform Pipelines
- Faites défiler le menu de navigation jusqu'à AI Platform, puis épinglez la section pour pouvoir y accéder plus facilement au cours de l'atelier.
- Cliquez sur Pipelines.
- Ensuite, cliquez sur Nouvelle instance.
- Cliquez sur Configurer.
- Sur la page "Kubeflow Pipelines", cochez Autoriser l'accès aux API Cloud suivantes, laissez le nom tel quel, puis cliquez sur Créer un cluster.
Cela devrait prendre deux à trois minutes. Attendez que le cluster soit créé avant de passer à l'étape suivante. Dans le premier onglet ouvert, vous pouvez afficher le cluster en cours de création dans la section GKE de Cloud Console ou voir les VM individuelles qui s'exécutent dans la section GCE de la console Cloud
- Une fois la création du cluster terminée, cochez la case Conditions d'utilisation, conservez les autres paramètres, puis cliquez sur Déployer. Vous verrez chaque service de KFP déployé sur votre cluster GKE.
Le temps de l'installation, passez à l'étape suivante.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Tâche 3 : Créer une instance de notebook Cloud AI Platform
- Dans Cloud Shell, exécutez les commandes suivantes pour créer un notebook géré par l'utilisateur :
-
Cliquez sur le menu de navigation. Cliquez sur Vertex AI, puis sur Workbench.
-
Cliquez sur NOTEBOOKS GÉRÉS PAR L'UTILISATEUR.
La création du notebook prendra deux à trois minutes.
-
Cliquez sur Ouvrir JupyterLab à côté du nom de votre notebook. Une fenêtre JupyterLab s'ouvre dans un nouvel onglet.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Tâche 4 : Cloner l'exemple de dépôt dans votre instance AI Platform Notebooks
Pour cloner le notebook mlops-on-gcp
dans votre instance JupyterLab :
-
Dans JupyterLab, cliquez sur l'icône Terminal pour ouvrir un nouveau terminal.
-
À l'invite, saisissez la commande suivante, puis appuyez sur Entrée :
git clone https://github.com/GoogleCloudPlatform/mlops-on-gcp Remarque : Si le dépôt cloné n'apparaît pas dans l'UI JupyterLab, sélectionnez Git > Clone a repository (Cloner un dépôt) dans le menu principal pour cloner le dépôt à l'aide de l'UI (https://github.com/GoogleCloudPlatform/mlops-on-gcp). -
Vérifiez que vous avez bien cloné le dépôt en double-cliquant sur le répertoire
mlops-on-gcp
. Assurez-vous de pouvoir en lire le contenu. Vous y trouverez les fichiers de tous les ateliers de ce cours basés sur des notebooks Jupyter.
Accéder à l'exemple de notebook
- Dans JupyterLab, ouvrez un terminal et exécutez la commande suivante :
-
Ensuite, dans AI Platform Notebooks, accédez à
mlops-on-gcp/workshops/tfx-caip-tf23/lab-01-tfx-walkthrough/labs
et ouvrezlab-01.ipynb
. -
Effacez toutes les cellules du notebook (Modifier > Supprimer tous les éléments de sortie), puis exécutez les cellules une par une.
-
Lorsque vous y êtes invité, revenez à ces instructions pour vérifier votre progression.
Si vous avez besoin d'aide, reportez-vous à la solution complète. Pour cela, accédez à mlops-on-gcp/workshops/tfx-caip-tf23/lab-01-tfx-walkthrough/solutions
et ouvrez lab-01.ipynb
.
Cliquez sur Vérifier ma progression pour valider l'objectif.
Tâche 5 : Exécuter le job d'entraînement dans le cloud
Tester les tâches terminées – Configurer et exécuter CsvExampleGen
Cliquez sur Vérifier ma progression pour valider l'objectif.
Tester la tâche terminée – Créer et exécuter un composant d'entraînement
Cliquez sur Vérifier ma progression pour valider l'objectif.
Félicitations !
L'atelier de présentation des composants des pipelines TFX est désormais terminé. Dans cet atelier, vous avez utilisé TFX pour analyser, comprendre et prétraiter un ensemble de données ainsi que pour entraîner, analyser, valider et déployer un modèle de classification à classes multiples permettant de prédire le type de couverture forestière d'une zone à partir de caractéristiques cartographiques.
Terminer l'atelier
Une fois l'atelier terminé, cliquez sur End Lab (Terminer l'atelier). Qwiklabs supprime les ressources que vous avez utilisées, puis efface le compte.
Si vous le souhaitez, vous pouvez noter l'atelier. Sélectionnez le nombre d'étoiles correspondant à votre note, saisissez un commentaire, puis cliquez sur Submit (Envoyer).
Le nombre d'étoiles que vous pouvez attribuer à un atelier correspond à votre degré de satisfaction :
- 1 étoile = très mécontent(e)
- 2 étoiles = insatisfait(e)
- 3 étoiles = ni insatisfait(e), ni satisfait(e)
- 4 étoiles = satisfait(e)
- 5 étoiles = très satisfait(e)
Si vous ne souhaitez pas donner votre avis, vous pouvez fermer la boîte de dialogue.
Pour soumettre des commentaires, suggestions ou corrections, veuillez utiliser l'onglet Support (Assistance).
Copyright 2020 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.