
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Dans cet atelier, vous allez utiliser Vertex AI pour entraîner et déployer un modèle de machine learning pour prédire les risques liés à un prêt à l'aide d'un ensemble de données tabulaires.
Vous allez apprendre à :
Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur le bouton "Start Lab" (Démarrer l'atelier), indique combien de temps les ressources cloud resteront accessibles.
Cet atelier pratique Qwiklabs vous permet de suivre vous-même les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Des identifiants temporaires vous sont fournis pour vous permettre de vous connecter à Google Cloud Platform le temps de l'atelier.
Pour réaliser cet atelier, vous devez remplir les conditions suivantes :
Remarque : Si vous possédez déjà un compte ou un projet GCP, veillez à ne pas l'utiliser pour réaliser cet atelier.
Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, un pop-up s'affiche pour vous permettre de sélectionner un mode de paiement. Sur la gauche, vous verrez un panneau contenant les identifiants temporaires à utiliser pour cet atelier.
Copiez le nom d'utilisateur, puis cliquez sur Ouvrir la console Google. L'atelier lance les ressources, puis la page Sélectionner un compte dans un nouvel onglet.
Sur la page "Sélectionner un compte", cliquez sur Utiliser un autre compte. La page de connexion s'affiche.
Collez le nom d'utilisateur que vous avez copié dans le panneau "Détails de connexion". Copiez et collez ensuite le mot de passe.
Après quelques instants, la console Cloud s'ouvre dans cet onglet.
Cet atelier utilise Vertex AI, la plate-forme d'IA unifiée de Google Cloud, pour entraîner et déployer un modèle de ML. La plate-forme Vertex AI regroupe deux options permettant de créer un modèle de ML : une solution sans code utilisant AutoML, et une autre basée sur du code et l'entraînement personnalisé utilisant Vertex Workbench. Cet atelier utilise AutoML.
Dans cet atelier, vous allez créer un modèle de ML pour déterminer si un client spécifique remboursera ou non un crédit.
Le tableau de bord Vertex AI affiche initialement les grandes étapes à suivre pour entraîner et déployer un modèle de ML : préparer les données d'entraînement, entraîner le modèle et obtenir des prédictions. Il affichera ensuite vos activités récentes, telles que les derniers ensembles de données, modèles, prédictions, points de terminaison et instances de notebooks.
Vous disposez de trois options pour importer des données dans Vertex AI :
Pour plus de commodité, l'ensemble de données est déjà importé dans Cloud Storage.
Pour la source de données, sélectionnez Sélectionner des fichiers CSV depuis Cloud Storage.
Dans le champ Chemin du fichier d'importation, saisissez :
Pour consulter les statistiques descriptives de chaque colonne de votre ensemble de données, cliquez sur Générer des statistiques.
Cette opération peut prendre quelques minutes, en particulier la première fois.
Lorsque les statistiques sont prêtes, cliquez sur le nom de chaque colonne pour afficher des graphiques analytiques.
Maintenant que vous avez importé un ensemble de données, vous êtes en mesure d'entraîner un modèle pour prédire si un client remboursera ou non un crédit.
L'ensemble de données est déjà nommé LoanRisk.
Dans le champ Objectif, sélectionnez Classification.
Vous devez sélectionner "Classification" plutôt que "Régression", car vous allez prédire un nombre distinct (pour déterminer si un client remboursera un crédit, avec 0 pour oui et 1 pour non) plutôt qu'un nombre continu.
Spécifiez le nom du modèle et la colonne cible.
Donnez un nom au modèle, par exemple LoanRisk.
Pour Colonne cible, sélectionnez Par défaut.
(Facultatif) Explorez la section Options avancées pour déterminer comment attribuer les données d'entraînement et de test, et spécifier le chiffrement.
Cliquez sur Continuer.
Pour "Ajouter des caractéristiques", cliquez sur Continuer.
Indiquez les colonnes que vous souhaitez inclure au modèle d'entraînement. Par exemple, l'ID client n'est pas forcément pertinent pour prédire les risques liés à un crédit.
Cliquez sur le signe moins de la ligne ClientID (ID client) pour l'exclure du modèle d'entraînement.
(Facultatif) Explorez la section Options avancées pour sélectionner différents objectifs d'optimisation.
Pour en savoir plus sur les objectifs d'optimisation des modèles AutoML tabulaires, consultez le guide sur les objectifs d'optimisation pour les modèles AutoML tabulaires.
Cliquez sur Continuer.
Dans le champ Budget, qui représente le nombre d'heures-nœud pour l'entraînement, saisissez 1.
Entraîner votre modèle AutoML pendant une heure de calcul est généralement un bon point de départ pour comprendre s'il existe une relation entre les caractéristiques et l'étiquette que vous avez sélectionnées. À partir de là, vous pouvez modifier vos caractéristiques et entraîner votre modèle plus longtemps pour améliorer ses performances.
Laissez l'option d'arrêt prématuré activée.
Cliquez sur Démarrer l'entraînement.
En fonction de la taille des données et de la méthode d'entraînement, l'opération peut durer de quelques minutes à environ deux heures. En temps normal, vous devriez recevoir un e-mail de Google Cloud une fois le job d'entraînement terminé. Cependant, dans l'environnement Qwiklabs, vous ne recevrez pas d'e-mail.
Vertex AI offre de nombreuses métriques permettant d'évaluer les performances du modèle. Vous allez en utiliser trois :
Le seuil de confiance détermine la façon dont un modèle de ML compte les cas positifs. Avec un seuil élevé, la précision augmente, mais le rappel diminue. Avec un seuil bas, la précision diminue, mais le rappel augmente.
Vous pouvez ajuster manuellement le seuil pour observer son impact sur la précision et le rappel. Vous pourrez ainsi trouver le meilleur compromis entre les deux pour répondre aux besoins de votre entreprise.
Une matrice de confusion vous indique, pour chaque classe de l'ensemble de test, le pourcentage d'exemples pour lesquels votre modèle a effectué des prédictions correctes.
La matrice de confusion indique que votre modèle initial peut prédire correctement 100 % des exemples de remboursement et 87 % des exemples de défaut de paiement pour votre ensemble de test. Ce résultat est plutôt satisfaisant.
Pour améliorer les pourcentages, vous pouvez ajouter plus d'exemples (plus de données), extraire davantage de caractéristiques, modifier la méthode d'entraînement, etc.
Dans Vertex AI, l'importance des caractéristiques est illustrée par un graphique à barres montrant la contribution de chaque caractéristique pour une prédiction. Plus la barre est longue ou plus la valeur numérique associée à une caractéristique est élevée, plus celle-ci est importante.
Les valeurs de l'importance des caractéristiques pourraient vous aider à améliorer votre modèle et renforcer votre confiance dans ses prédictions. La prochaine fois que vous entraînerez un modèle, vous pourrez choisir d'exclure les caractéristiques les moins importantes ou de combiner deux des plus importantes pour effectuer un croisement de caractéristiques, et ainsi déterminer si cela améliore les performances du modèle.
L'importance des caractéristiques n'est qu'un exemple de la fonctionnalité complète de machine learning de Vertex AI, appelée Explainable AI. Explainable AI est un ensemble d'outils et de frameworks permettant de comprendre et d'interpréter les prédictions effectuées par les modèles de machine learning.
Maintenant que vous disposez d'un modèle entraîné, l'étape suivante consiste à créer un point de terminaison dans Vertex, où une ressource de modèle peut être associée à plusieurs points de terminaison entre lesquels vous pouvez répartir le trafic.
Sur la page de votre modèle, cliquez sur Déployer et tester, puis sur Déployer sur un point de terminaison.
Dans le champ Nom du point de terminaison, saisissez LoanRisk.
Cliquez sur Continuer.
Laissez les paramètres de répartition du trafic tels quels.
Dans le champ Type de machine, sélectionnez e2-standard-8, 8 vCPU, 32 Gio de mémoire.
Dans le champ Options d'explicabilité, cliquez sur Attribution des caractéristiques.
Cliquez sur OK.
Cliquez sur Continuer.
Dans Surveillance des modèles, cliquez sur Continuer.
Dans Objectif du modèle > Source des données d'entraînement, sélectionnez Ensemble de données Vertex AI.
Sélectionnez votre ensemble de données dans le menu déroulant.
Dans Colonne cible, saisissez Par défaut.
Laissez le reste des paramètres tels quels, puis cliquez sur Déployer.
Le déploiement de votre point de terminaison va prendre quelques minutes. Quand ce sera terminé, une coche verte apparaîtra à côté du nom.
Vous pouvez maintenant obtenir des prédictions à partir de votre modèle déployé.
Dans cette section, nous allons utiliser AutoML-Gateway pour travailler avec un modèle d'entraînement existant.
VARIABLE D'ENVIRONNEMENT | VALEUR |
---|---|
Credit_Risk ENDPOINT | 1411183591831896064 |
INPUT_DATA_FILE | INPUT-JSON |
Pour utiliser le modèle entraîné, vous avez besoin de créer des variables d'environnement.
Ouvrez une fenêtre Cloud Shell.
Téléchargez les éléments de l'atelier :
INPUT_DATA_FILE
:PROJECT_NUMBER
:AUTOML_SERVICE
:Le fichier INPUT-JSON
contient les valeurs suivantes :
Résultat attendu :
L'image ci-dessous montre comment effectuer la même action dans la console Google Cloud :
Vous savez maintenant utiliser Vertex AI pour :
Pour en savoir plus sur les différents composants de Vertex AI, consultez la documentation Vertex AI.
Une fois l'atelier terminé, cliquez sur Terminer l'atelier. Google Cloud Skills Boost supprime les ressources que vous avez utilisées, puis efface le compte.
Si vous le souhaitez, vous pouvez noter l'atelier. Sélectionnez un nombre d'étoiles, saisissez un commentaire, puis cliquez sur Envoyer.
Le nombre d'étoiles correspond à votre degré de satisfaction :
Si vous ne souhaitez pas donner votre avis, vous pouvez fermer la boîte de dialogue.
Pour soumettre des commentaires, suggestions ou corrections, veuillez accéder à l'onglet Assistance.
Copyright 2020 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.
Ce contenu n'est pas disponible pour le moment
Nous vous préviendrons par e-mail lorsqu'il sera disponible
Parfait !
Nous vous contacterons par e-mail s'il devient disponible
One lab at a time
Confirm to end all existing labs and start this one