arrow_back

Vertex AI : prédire les risques liés à un prêt avec AutoML

Quick tip: Review the prerequisites before you run the lab
Use an Incognito or private browser window to run this lab. This prevents any conflicts between your personal account and the student account, which may cause extra charges incurred to your personal account.
Testez vos connaissances et partagez-les avec notre communauté
done
Accédez à plus de 700 ateliers pratiques, badges de compétence et cours

Vertex AI : prédire les risques liés à un prêt avec AutoML

Atelier 1 heure universal_currency_alt 5 crédits show_chart Débutant
info Cet atelier peut intégrer des outils d'IA pour vous accompagner dans votre apprentissage.
Testez vos connaissances et partagez-les avec notre communauté
done
Accédez à plus de 700 ateliers pratiques, badges de compétence et cours

Présentation

Dans cet atelier, vous allez utiliser Vertex AI pour entraîner et déployer un modèle de machine learning pour prédire les risques liés à un prêt à l'aide d'un ensemble de données tabulaires.

Objectifs

Vous allez apprendre à :

  • importer un ensemble de données dans Vertex AI ;
  • entraîner un modèle de machine learning à l'aide d'AutoML ;
  • évaluer les performances du modèle ;
  • déployer le modèle sur un point de terminaison ;
  • obtenir des prédictions.

Préparation

Avant de cliquer sur le bouton Start Lab (Démarrer l'atelier)

Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur le bouton "Start Lab" (Démarrer l'atelier), indique combien de temps les ressources cloud resteront accessibles.

Cet atelier pratique Qwiklabs vous permet de suivre vous-même les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Des identifiants temporaires vous sont fournis pour vous permettre de vous connecter à Google Cloud Platform le temps de l'atelier.

Conditions requises

Pour réaliser cet atelier, vous devez remplir les conditions suivantes :

  • Vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome).
  • Vous devez disposer de suffisamment de temps pour réaliser l'atelier en une fois.

Remarque : Si vous possédez déjà un compte ou un projet GCP, veillez à ne pas l'utiliser pour réaliser cet atelier.

Démarrer votre atelier et vous connecter à la console

  1. Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, un pop-up s'affiche pour vous permettre de sélectionner un mode de paiement. Sur la gauche, vous verrez un panneau contenant les identifiants temporaires à utiliser pour cet atelier.

    Panneau d'identifiants

  2. Copiez le nom d'utilisateur, puis cliquez sur Ouvrir la console Google. L'atelier lance les ressources, puis la page Sélectionner un compte dans un nouvel onglet.

    Remarque : Ouvrez les onglets dans des fenêtres distinctes, placées côte à côte.
  3. Sur la page "Sélectionner un compte", cliquez sur Utiliser un autre compte. La page de connexion s'affiche.

    Boîte de dialogue "Sélectionner un compte" avec l'option "Utiliser un autre compte" encadrée.

  4. Collez le nom d'utilisateur que vous avez copié dans le panneau "Détails de connexion". Copiez et collez ensuite le mot de passe.

Remarque : Vous devez utiliser les identifiants fournis dans le panneau "Détails de connexion", et non vos identifiants Google Cloud Skills Boost. Si vous possédez un compte Google Cloud, ne vous en servez pas pour cet atelier (vous éviterez ainsi que des frais vous soient facturés).
  1. Accédez aux pages suivantes :
  • Acceptez les conditions d'utilisation.
  • N'ajoutez pas d'options de récupération ni d'authentification à deux facteurs (ce compte est temporaire).
  • Ne vous inscrivez pas aux essais offerts.

Après quelques instants, la console Cloud s'ouvre dans cet onglet.

Remarque : Vous pouvez afficher le menu qui contient la liste des produits et services Google Cloud en cliquant sur le menu de navigation en haut à gauche. Menu de la console Cloud

Présentation de Vertex AI

Cet atelier utilise Vertex AI, la plate-forme d'IA unifiée de Google Cloud, pour entraîner et déployer un modèle de ML. La plate-forme Vertex AI regroupe deux options permettant de créer un modèle de ML : une solution sans code utilisant AutoML, et une autre basée sur du code et l'entraînement personnalisé utilisant Vertex Workbench. Cet atelier utilise AutoML.

Dans cet atelier, vous allez créer un modèle de ML pour déterminer si un client spécifique remboursera ou non un crédit.

Tâche 1 : Préparer les données d'entraînement

Le tableau de bord Vertex AI affiche initialement les grandes étapes à suivre pour entraîner et déployer un modèle de ML : préparer les données d'entraînement, entraîner le modèle et obtenir des prédictions. Il affichera ensuite vos activités récentes, telles que les derniers ensembles de données, modèles, prédictions, points de terminaison et instances de notebooks.

Créer un ensemble de données

  1. Dans la console Google Cloud, accédez au menu de navigation et cliquez sur Vertex AI > Ensembles de données.
  2. Cliquez sur Créer un ensemble de données.
  3. Nommez l'ensemble de données LoanRisk.
  4. Cliquez sur Tabulaire et Régression/Classification pour choisir respectivement le type de données et l'objectif.
  5. Cliquez sur Créer.

Importer des données

Vous disposez de trois options pour importer des données dans Vertex AI :

  • Importer des fichiers CSV depuis votre ordinateur
  • Sélectionner des fichiers CSV depuis Cloud Storage
  • Sélectionner une table ou une vue à partir de BigQuery

Pour plus de commodité, l'ensemble de données est déjà importé dans Cloud Storage.

  1. Pour la source de données, sélectionnez Sélectionner des fichiers CSV depuis Cloud Storage.

  2. Dans le champ Chemin du fichier d'importation, saisissez :

spls/cbl455/loan_risk.csv
  1. Cliquez sur Continuer.
Remarque : Vous pouvez également configurer cette page en cliquant sur Ensembles de données dans le menu de gauche, puis en sélectionnant le nom de l'ensemble de données sur la page "Ensembles de données".

(Facultatif) Générer des statistiques

  1. Pour consulter les statistiques descriptives de chaque colonne de votre ensemble de données, cliquez sur Générer des statistiques.
    Cette opération peut prendre quelques minutes, en particulier la première fois.

  2. Lorsque les statistiques sont prêtes, cliquez sur le nom de chaque colonne pour afficher des graphiques analytiques.

Tâche 2 : Entraîner le modèle

Maintenant que vous avez importé un ensemble de données, vous êtes en mesure d'entraîner un modèle pour prédire si un client remboursera ou non un crédit.

  • Cliquez sur Entraîner le nouveau modèle, puis sélectionnez Autre.

Méthode d'entraînement

  1. L'ensemble de données est déjà nommé LoanRisk.

  2. Dans le champ Objectif, sélectionnez Classification.

Vous devez sélectionner "Classification" plutôt que "Régression", car vous allez prédire un nombre distinct (pour déterminer si un client remboursera un crédit, avec 0 pour oui et 1 pour non) plutôt qu'un nombre continu.

  1. Cliquez sur Continuer.

Informations sur le modèle

Spécifiez le nom du modèle et la colonne cible.

  1. Donnez un nom au modèle, par exemple LoanRisk.

  2. Pour Colonne cible, sélectionnez Par défaut.

  3. (Facultatif) Explorez la section Options avancées pour déterminer comment attribuer les données d'entraînement et de test, et spécifier le chiffrement.

  4. Cliquez sur Continuer.

  5. Pour "Ajouter des caractéristiques", cliquez sur Continuer.

Options d'entraînement

Indiquez les colonnes que vous souhaitez inclure au modèle d'entraînement. Par exemple, l'ID client n'est pas forcément pertinent pour prédire les risques liés à un crédit.

  1. Cliquez sur le signe moins de la ligne ClientID (ID client) pour l'exclure du modèle d'entraînement.

  2. (Facultatif) Explorez la section Options avancées pour sélectionner différents objectifs d'optimisation.
    Pour en savoir plus sur les objectifs d'optimisation des modèles AutoML tabulaires, consultez le guide sur les objectifs d'optimisation pour les modèles AutoML tabulaires.

  3. Cliquez sur Continuer.

Options de calcul et tarifs

  1. Dans le champ Budget, qui représente le nombre d'heures-nœud pour l'entraînement, saisissez 1.
    Entraîner votre modèle AutoML pendant une heure de calcul est généralement un bon point de départ pour comprendre s'il existe une relation entre les caractéristiques et l'étiquette que vous avez sélectionnées. À partir de là, vous pouvez modifier vos caractéristiques et entraîner votre modèle plus longtemps pour améliorer ses performances.

  2. Laissez l'option d'arrêt prématuré activée.

  3. Cliquez sur Démarrer l'entraînement.

En fonction de la taille des données et de la méthode d'entraînement, l'opération peut durer de quelques minutes à environ deux heures. En temps normal, vous devriez recevoir un e-mail de Google Cloud une fois le job d'entraînement terminé. Cependant, dans l'environnement Qwiklabs, vous ne recevrez pas d'e-mail.

Remarque : Pour éviter d'attendre la fin de l'entraînement du modèle, qui dure généralement une heure, téléchargez un modèle pré-entraîné à la tâche 5. Ce modèle est le résultat des tâches 1 et 2. Les tâches 3 et 4 ne sont utilisées qu'à titre de démonstration et ne s'appliquent que si vous entraînez le modèle vous-même.

Tâche 3 : Évaluer les performances du modèle (démonstration uniquement)

Vertex AI offre de nombreuses métriques permettant d'évaluer les performances du modèle. Vous allez en utiliser trois :

  • Courbe de précision/rappel
  • Matrice de confusion
  • Importance des caractéristiques
Remarque : Si vous disposez d'un modèle entraîné, vous pouvez accéder à l'onglet Registre de modèles dans Vertex AI.

1. Accédez à l'onglet Registre de modèles.

2. Cliquez sur le modèle que vous venez d'entraîner.

3. Parcourez l'onglet Évaluation.

Cependant, dans cet atelier, vous pouvez ignorer cette étape, puisque vous allez utiliser un modèle pré-entraîné.

Courbe de précision/rappel

Curseur du seuil de confiance défini sur 0,5, graphiques pour la courbe de précision/rappel, courbe ROC et précision/rappel par seuil

Le seuil de confiance détermine la façon dont un modèle de ML compte les cas positifs. Avec un seuil élevé, la précision augmente, mais le rappel diminue. Avec un seuil bas, la précision diminue, mais le rappel augmente.

Vous pouvez ajuster manuellement le seuil pour observer son impact sur la précision et le rappel. Vous pourrez ainsi trouver le meilleur compromis entre les deux pour répondre aux besoins de votre entreprise.

Matrice de confusion

Une matrice de confusion vous indique, pour chaque classe de l'ensemble de test, le pourcentage d'exemples pour lesquels votre modèle a effectué des prédictions correctes.

Table de la matrice de confusion présentant l'étiquette réelle et les classifications d'étiquettes prédites

La matrice de confusion indique que votre modèle initial peut prédire correctement 100 % des exemples de remboursement et 87 % des exemples de défaut de paiement pour votre ensemble de test. Ce résultat est plutôt satisfaisant.

Pour améliorer les pourcentages, vous pouvez ajouter plus d'exemples (plus de données), extraire davantage de caractéristiques, modifier la méthode d'entraînement, etc.

Importance des caractéristiques

Dans Vertex AI, l'importance des caractéristiques est illustrée par un graphique à barres montrant la contribution de chaque caractéristique pour une prédiction. Plus la barre est longue ou plus la valeur numérique associée à une caractéristique est élevée, plus celle-ci est importante.

Graphique à barres sur l'importance des caractéristiques associées au crédit, aux revenus et à l'âge

Les valeurs de l'importance des caractéristiques pourraient vous aider à améliorer votre modèle et renforcer votre confiance dans ses prédictions. La prochaine fois que vous entraînerez un modèle, vous pourrez choisir d'exclure les caractéristiques les moins importantes ou de combiner deux des plus importantes pour effectuer un croisement de caractéristiques, et ainsi déterminer si cela améliore les performances du modèle.

L'importance des caractéristiques n'est qu'un exemple de la fonctionnalité complète de machine learning de Vertex AI, appelée Explainable AI. Explainable AI est un ensemble d'outils et de frameworks permettant de comprendre et d'interpréter les prédictions effectuées par les modèles de machine learning.

Tâche 4 : Déployer le modèle (démonstration uniquement)

Remarque : Vous n'allez pas déployer le modèle sur un point de terminaison, car l'entraînement du modèle peut prendre une heure. Ici, vous pouvez examiner les étapes que vous suivriez dans un environnement de production.

Maintenant que vous disposez d'un modèle entraîné, l'étape suivante consiste à créer un point de terminaison dans Vertex, où une ressource de modèle peut être associée à plusieurs points de terminaison entre lesquels vous pouvez répartir le trafic.

Créer et définir un point de terminaison

  1. Sur la page de votre modèle, cliquez sur Déployer et tester, puis sur Déployer sur un point de terminaison.

  2. Dans le champ Nom du point de terminaison, saisissez LoanRisk.

  3. Cliquez sur Continuer.

Surveillance et paramètres du modèle

  1. Laissez les paramètres de répartition du trafic tels quels.

  2. Dans le champ Type de machine, sélectionnez e2-standard-8, 8 vCPU, 32 Gio de mémoire.

  3. Dans le champ Options d'explicabilité, cliquez sur Attribution des caractéristiques.

  4. Cliquez sur OK.

  5. Cliquez sur Continuer.

  6. Dans Surveillance des modèles, cliquez sur Continuer.

  7. Dans Objectif du modèle > Source des données d'entraînement, sélectionnez Ensemble de données Vertex AI.

  8. Sélectionnez votre ensemble de données dans le menu déroulant.

  9. Dans Colonne cible, saisissez Par défaut.

  10. Laissez le reste des paramètres tels quels, puis cliquez sur Déployer.

Le déploiement de votre point de terminaison va prendre quelques minutes. Quand ce sera terminé, une coche verte apparaîtra à côté du nom.

Vous pouvez maintenant obtenir des prédictions à partir de votre modèle déployé.

Tâche 5 : Obtenir des prédictions

Dans cette section, nous allons utiliser AutoML-Gateway pour travailler avec un modèle d'entraînement existant.

VARIABLE D'ENVIRONNEMENT VALEUR
Credit_Risk ENDPOINT 1411183591831896064
INPUT_DATA_FILE INPUT-JSON

Pour utiliser le modèle entraîné, vous avez besoin de créer des variables d'environnement.

  1. Ouvrez une fenêtre Cloud Shell.

  2. Téléchargez les éléments de l'atelier :

gcloud storage cp gs://cloud-training/CBL455/INPUT-JSON .
  1. Créez une variable d'environnement INPUT_DATA_FILE :
export INPUT_DATA_FILE="INPUT-JSON"
  1. Créez une variable d'environnement PROJECT_NUMBER :
export PROJECT_NUMBER=$(gcloud projects describe $(gcloud config get-value project) --format="value(projectNumber)")
  1. Créez une variable d'environnement AUTOML_SERVICE :
export AUTOML_SERVICE="https://automl-proxy-$PROJECT_NUMBER.us-central1.run.app/v1" Remarque  : Une fois l'extraction des éléments de l'atelier terminée, prenez un moment pour en examiner le contenu.

Le fichier INPUT-JSON est utilisé pour fournir à Vertex AI les données nécessaires du modèle. Modifiez-le pour générer des prédictions personnalisées.

Le fichier INPUT-JSON contient les valeurs suivantes :

{ "instances": [ { "age": 40.77430558, "ClientID": "997", "income": 44964.0106, "loan": 3944.219318 } ] }
  1. Saisissez la commande suivante pour demander une prédiction :
curl -X POST -H "Content-Type: application/json" $AUTOML_SERVICE -d "@${INPUT_DATA_FILE}" -s | jq

Résultat attendu :

{ "predictions": [ { "scores": [ 0.9999980926513672, 0.000001897001311590429 ], "classes": [ "0", "1" ] } ], "deployedModelId": "3093594712003575808", "model": "projects/1030115194620/locations/us-central1/models/4831874217005809664", "modelDisplayName": "credit_risk_20211119212817", "modelVersionId": "1" }

L'image ci-dessous montre comment effectuer la même action dans la console Google Cloud :

Étapes de prédiction en surbrillance dans les sections pertinentes

Félicitations !

Vous savez maintenant utiliser Vertex AI pour :

  • importer un ensemble de données ;
  • entraîner un modèle à l'aide d'AutoML ;
  • évaluer les performances du modèle ;
  • déployer le modèle AutoML entraîné sur un point de terminaison ;
  • obtenir des prédictions.

Pour en savoir plus sur les différents composants de Vertex AI, consultez la documentation Vertex AI.

Terminer l'atelier

Une fois l'atelier terminé, cliquez sur Terminer l'atelier. Google Cloud Skills Boost supprime les ressources que vous avez utilisées, puis efface le compte.

Si vous le souhaitez, vous pouvez noter l'atelier. Sélectionnez un nombre d'étoiles, saisissez un commentaire, puis cliquez sur Envoyer.

Le nombre d'étoiles correspond à votre degré de satisfaction :

  • 1 étoile = très insatisfait(e)
  • 2 étoiles = insatisfait(e)
  • 3 étoiles = ni insatisfait(e), ni satisfait(e)
  • 4 étoiles = satisfait(e)
  • 5 étoiles = très satisfait(e)

Si vous ne souhaitez pas donner votre avis, vous pouvez fermer la boîte de dialogue.

Pour soumettre des commentaires, suggestions ou corrections, veuillez accéder à l'onglet Assistance.

Copyright 2020 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.

Before you begin

  1. Labs create a Google Cloud project and resources for a fixed time
  2. Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
  3. On the top left of your screen, click Start lab to begin

Use private browsing

  1. Copy the provided Username and Password for the lab
  2. Click Open console in private mode

Sign in to the Console

  1. Sign in using your lab credentials. Using other credentials might cause errors or incur charges.
  2. Accept the terms, and skip the recovery resource page
  3. Don't click End lab unless you've finished the lab or want to restart it, as it will clear your work and remove the project

Ce contenu n'est pas disponible pour le moment

Nous vous préviendrons par e-mail lorsqu'il sera disponible

Parfait !

Nous vous contacterons par e-mail s'il devient disponible

One lab at a time

Confirm to end all existing labs and start this one

Setup your console before you begin

Use an Incognito or private browser window to run this lab. This prevents any conflicts between your personal account and the Student account, which may cause extra charges incurred to your personal account.