Accédez à plus de 700 ateliers et cours

Vertex AI : prédire les risques liés à un prêt avec AutoML

Atelier 1 heure universal_currency_alt 5 crédits show_chart Débutant

info Cet atelier peut intégrer des outils d'IA pour vous accompagner dans votre apprentissage.

Présentation
Préparation
Présentation de Vertex AI
Tâche 1 : Préparer les données d'entraînement
Tâche 2 : Entraîner le modèle
Tâche 3 : Évaluer les performances du modèle (démonstration uniquement)
Tâche 4 : Déployer le modèle (démonstration uniquement)
Tâche 5 : Obtenir des prédictions
Félicitations !
Terminer l'atelier

Accédez à plus de 700 ateliers et cours

Présentation

Dans cet atelier, vous allez utiliser Vertex AI pour entraîner et déployer un modèle de machine learning pour prédire les risques liés à un prêt à l'aide d'un ensemble de données tabulaires.

Objectifs

Vous allez apprendre à :

importer un ensemble de données dans Vertex AI ;
entraîner un modèle de machine learning à l'aide d'AutoML ;
évaluer les performances du modèle ;
déployer le modèle sur un point de terminaison ;
obtenir des prédictions.

Préparation

Avant de cliquer sur le bouton Start Lab (Démarrer l'atelier)

Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur le bouton "Start Lab" (Démarrer l'atelier), indique combien de temps les ressources cloud resteront accessibles.

Cet atelier pratique Qwiklabs vous permet de suivre vous-même les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Des identifiants temporaires vous sont fournis pour vous permettre de vous connecter à Google Cloud Platform le temps de l'atelier.

Conditions requises

Pour réaliser cet atelier, vous devez remplir les conditions suivantes :

Vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome).
Vous devez disposer de suffisamment de temps pour réaliser l'atelier en une fois.

Remarque : Si vous possédez déjà un compte ou un projet GCP, veillez à ne pas l'utiliser pour réaliser cet atelier.

Démarrer votre atelier et vous connecter à la console

Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, un pop-up s'affiche pour vous permettre de sélectionner un mode de paiement. Sur la gauche, vous verrez un panneau contenant les identifiants temporaires à utiliser pour cet atelier.
Copiez le nom d'utilisateur, puis cliquez sur Ouvrir la console Google. L'atelier lance les ressources, puis la page Sélectionner un compte dans un nouvel onglet.
Remarque : Ouvrez les onglets dans des fenêtres distinctes, placées côte à côte.
Sur la page "Sélectionner un compte", cliquez sur Utiliser un autre compte. La page de connexion s'affiche.
Collez le nom d'utilisateur que vous avez copié dans le panneau "Détails de connexion". Copiez et collez ensuite le mot de passe.

Remarque : Vous devez utiliser les identifiants fournis dans le panneau "Détails de connexion", et non vos identifiants Google Cloud Skills Boost. Si vous possédez un compte Google Cloud, ne vous en servez pas pour cet atelier (vous éviterez ainsi que des frais vous soient facturés).

Accédez aux pages suivantes :

Acceptez les conditions d'utilisation.
N'ajoutez pas d'options de récupération ni d'authentification à deux facteurs (ce compte est temporaire).
Ne vous inscrivez pas aux essais offerts.

Après quelques instants, la console Cloud s'ouvre dans cet onglet.

Remarque : Vous pouvez afficher le menu qui contient la liste des produits et services Google Cloud en cliquant sur le menu de navigation en haut à gauche.

Présentation de Vertex AI

Cet atelier utilise Vertex AI, la plate-forme d'IA unifiée de Google Cloud, pour entraîner et déployer un modèle de ML. La plate-forme Vertex AI regroupe deux options permettant de créer un modèle de ML : une solution sans code utilisant AutoML, et une autre basée sur du code et l'entraînement personnalisé utilisant Vertex Workbench. Cet atelier utilise AutoML.

Dans cet atelier, vous allez créer un modèle de ML pour déterminer si un client spécifique remboursera ou non un crédit.

Tâche 1 : Préparer les données d'entraînement

Le tableau de bord Vertex AI affiche initialement les grandes étapes à suivre pour entraîner et déployer un modèle de ML : préparer les données d'entraînement, entraîner le modèle et obtenir des prédictions. Il affichera ensuite vos activités récentes, telles que les derniers ensembles de données, modèles, prédictions, points de terminaison et instances de notebooks.

Créer un ensemble de données

Dans la console Google Cloud, accédez au menu de navigation et cliquez sur Vertex AI > Ensembles de données.
Cliquez sur Créer un ensemble de données.
Nommez l'ensemble de données LoanRisk.
Cliquez sur Tabulaire et Régression/Classification pour choisir respectivement le type de données et l'objectif.
Cliquez sur Créer.

Importer des données

Vous disposez de trois options pour importer des données dans Vertex AI :

Importer des fichiers CSV depuis votre ordinateur
Sélectionner des fichiers CSV depuis Cloud Storage
Sélectionner une table ou une vue à partir de BigQuery

Pour plus de commodité, l'ensemble de données est déjà importé dans Cloud Storage.

Pour la source de données, sélectionnez Sélectionner des fichiers CSV depuis Cloud Storage.
Dans le champ Chemin du fichier d'importation, saisissez :

spls/cbl455/loan_risk.csv

Cliquez sur Continuer.

Remarque : Vous pouvez également configurer cette page en cliquant sur Ensembles de données dans le menu de gauche, puis en sélectionnant le nom de l'ensemble de données sur la page "Ensembles de données".

(Facultatif) Générer des statistiques

Pour consulter les statistiques descriptives de chaque colonne de votre ensemble de données, cliquez sur Générer des statistiques.
Cette opération peut prendre quelques minutes, en particulier la première fois.
Lorsque les statistiques sont prêtes, cliquez sur le nom de chaque colonne pour afficher des graphiques analytiques.

Tâche 2 : Entraîner le modèle

Maintenant que vous avez importé un ensemble de données, vous êtes en mesure d'entraîner un modèle pour prédire si un client remboursera ou non un crédit.

Cliquez sur Entraîner le nouveau modèle, puis sélectionnez Autre.

Méthode d'entraînement

L'ensemble de données est déjà nommé LoanRisk.
Dans le champ Objectif, sélectionnez Classification.

Vous devez sélectionner "Classification" plutôt que "Régression", car vous allez prédire un nombre distinct (pour déterminer si un client remboursera un crédit, avec 0 pour oui et 1 pour non) plutôt qu'un nombre continu.

Cliquez sur Continuer.

Informations sur le modèle

Spécifiez le nom du modèle et la colonne cible.

Donnez un nom au modèle, par exemple LoanRisk.
Pour Colonne cible, sélectionnez Par défaut.
(Facultatif) Explorez la section Options avancées pour déterminer comment attribuer les données d'entraînement et de test, et spécifier le chiffrement.
Cliquez sur Continuer.
Pour "Ajouter des caractéristiques", cliquez sur Continuer.

Options d'entraînement

Indiquez les colonnes que vous souhaitez inclure au modèle d'entraînement. Par exemple, l'ID client n'est pas forcément pertinent pour prédire les risques liés à un crédit.

Cliquez sur le signe moins de la ligne ClientID (ID client) pour l'exclure du modèle d'entraînement.
(Facultatif) Explorez la section Options avancées pour sélectionner différents objectifs d'optimisation.
Pour en savoir plus sur les objectifs d'optimisation des modèles AutoML tabulaires, consultez le guide sur les objectifs d'optimisation pour les modèles AutoML tabulaires.
Cliquez sur Continuer.

Options de calcul et tarifs

Dans le champ Budget, qui représente le nombre d'heures-nœud pour l'entraînement, saisissez 1.
Entraîner votre modèle AutoML pendant une heure de calcul est généralement un bon point de départ pour comprendre s'il existe une relation entre les caractéristiques et l'étiquette que vous avez sélectionnées. À partir de là, vous pouvez modifier vos caractéristiques et entraîner votre modèle plus longtemps pour améliorer ses performances.
Laissez l'option d'arrêt prématuré activée.
Cliquez sur Démarrer l'entraînement.

En fonction de la taille des données et de la méthode d'entraînement, l'opération peut durer de quelques minutes à environ deux heures. En temps normal, vous devriez recevoir un e-mail de Google Cloud une fois le job d'entraînement terminé. Cependant, dans l'environnement Qwiklabs, vous ne recevrez pas d'e-mail.

Remarque : Pour éviter d'attendre la fin de l'entraînement du modèle, qui dure généralement une heure, téléchargez un modèle pré-entraîné à la tâche 5. Ce modèle est le résultat des tâches 1 et 2. Les tâches 3 et 4 ne sont utilisées qu'à titre de démonstration et ne s'appliquent que si vous entraînez le modèle vous-même.

Tâche 3 : Évaluer les performances du modèle (démonstration uniquement)

Vertex AI offre de nombreuses métriques permettant d'évaluer les performances du modèle. Vous allez en utiliser trois :

Courbe de précision/rappel
Matrice de confusion
Importance des caractéristiques

Remarque : Si vous disposez d'un modèle entraîné, vous pouvez accéder à l'onglet Registre de modèles dans Vertex AI.

1. Accédez à l'onglet Registre de modèles.

2. Cliquez sur le modèle que vous venez d'entraîner.

3. Parcourez l'onglet Évaluation.

Cependant, dans cet atelier, vous pouvez ignorer cette étape, puisque vous allez utiliser un modèle pré-entraîné.

Courbe de précision/rappel

Le seuil de confiance détermine la façon dont un modèle de ML compte les cas positifs. Avec un seuil élevé, la précision augmente, mais le rappel diminue. Avec un seuil bas, la précision diminue, mais le rappel augmente.

Vous pouvez ajuster manuellement le seuil pour observer son impact sur la précision et le rappel. Vous pourrez ainsi trouver le meilleur compromis entre les deux pour répondre aux besoins de votre entreprise.

Matrice de confusion

Une matrice de confusion vous indique, pour chaque classe de l'ensemble de test, le pourcentage d'exemples pour lesquels votre modèle a effectué des prédictions correctes.

La matrice de confusion indique que votre modèle initial peut prédire correctement 100 % des exemples de remboursement et 87 % des exemples de défaut de paiement pour votre ensemble de test. Ce résultat est plutôt satisfaisant.

Pour améliorer les pourcentages, vous pouvez ajouter plus d'exemples (plus de données), extraire davantage de caractéristiques, modifier la méthode d'entraînement, etc.

Importance des caractéristiques

Dans Vertex AI, l'importance des caractéristiques est illustrée par un graphique à barres montrant la contribution de chaque caractéristique pour une prédiction. Plus la barre est longue ou plus la valeur numérique associée à une caractéristique est élevée, plus celle-ci est importante.

Les valeurs de l'importance des caractéristiques pourraient vous aider à améliorer votre modèle et renforcer votre confiance dans ses prédictions. La prochaine fois que vous entraînerez un modèle, vous pourrez choisir d'exclure les caractéristiques les moins importantes ou de combiner deux des plus importantes pour effectuer un croisement de caractéristiques, et ainsi déterminer si cela améliore les performances du modèle.

L'importance des caractéristiques n'est qu'un exemple de la fonctionnalité complète de machine learning de Vertex AI, appelée Explainable AI. Explainable AI est un ensemble d'outils et de frameworks permettant de comprendre et d'interpréter les prédictions effectuées par les modèles de machine learning.

Tâche 4 : Déployer le modèle (démonstration uniquement)

Remarque : Vous n'allez pas déployer le modèle sur un point de terminaison, car l'entraînement du modèle peut prendre une heure. Ici, vous pouvez examiner les étapes que vous suivriez dans un environnement de production.

Maintenant que vous disposez d'un modèle entraîné, l'étape suivante consiste à créer un point de terminaison dans Vertex, où une ressource de modèle peut être associée à plusieurs points de terminaison entre lesquels vous pouvez répartir le trafic.

Créer et définir un point de terminaison

Sur la page de votre modèle, cliquez sur Déployer et tester, puis sur Déployer sur un point de terminaison.
Dans le champ Nom du point de terminaison, saisissez LoanRisk.
Cliquez sur Continuer.

Surveillance et paramètres du modèle

Laissez les paramètres de répartition du trafic tels quels.
Dans le champ Type de machine, sélectionnez e2-standard-8, 8 vCPU, 32 Gio de mémoire.
Dans le champ Options d'explicabilité, cliquez sur Attribution des caractéristiques.
Cliquez sur OK.
Cliquez sur Continuer.
Dans Surveillance des modèles, cliquez sur Continuer.
Dans Objectif du modèle > Source des données d'entraînement, sélectionnez Ensemble de données Vertex AI.
Sélectionnez votre ensemble de données dans le menu déroulant.
Dans Colonne cible, saisissez Par défaut.
Laissez le reste des paramètres tels quels, puis cliquez sur Déployer.

Le déploiement de votre point de terminaison va prendre quelques minutes. Quand ce sera terminé, une coche verte apparaîtra à côté du nom.

Vous pouvez maintenant obtenir des prédictions à partir de votre modèle déployé.

Tâche 5 : Obtenir des prédictions

Dans cette section, nous allons utiliser AutoML-Gateway pour travailler avec un modèle d'entraînement existant.

VARIABLE D'ENVIRONNEMENT	VALEUR
Credit_Risk ENDPOINT	1411183591831896064
INPUT_DATA_FILE	INPUT-JSON

Pour utiliser le modèle entraîné, vous avez besoin de créer des variables d'environnement.

Ouvrez une fenêtre Cloud Shell.
Téléchargez les éléments de l'atelier :

gcloud storage cp gs://cloud-training/CBL455/INPUT-JSON .

Créez une variable d'environnement INPUT_DATA_FILE :

export INPUT_DATA_FILE="INPUT-JSON"

Créez une variable d'environnement PROJECT_NUMBER :

export PROJECT_NUMBER=$(gcloud projects describe $(gcloud config get-value project) --format="value(projectNumber)")

Créez une variable d'environnement AUTOML_SERVICE :

export AUTOML_SERVICE="https://automl-proxy-$PROJECT_NUMBER.us-central1.run.app/v1"

Remarque : Une fois l'extraction des éléments de l'atelier terminée, prenez un moment pour en examiner le contenu.

Le fichier INPUT-JSON est utilisé pour fournir à Vertex AI les données nécessaires du modèle. Modifiez-le pour générer des prédictions personnalisées.

Le fichier INPUT-JSON contient les valeurs suivantes :

{ "instances": [ { "age": 40.77430558, "ClientID": "997", "income": 44964.0106, "loan": 3944.219318 } ] }

Saisissez la commande suivante pour demander une prédiction :

curl -X POST -H "Content-Type: application/json" $AUTOML_SERVICE -d "@${INPUT_DATA_FILE}" -s | jq

Résultat attendu :

{ "predictions": [ { "scores": [ 0.9999980926513672, 0.000001897001311590429 ], "classes": [ "0", "1" ] } ], "deployedModelId": "3093594712003575808", "model": "projects/1030115194620/locations/us-central1/models/4831874217005809664", "modelDisplayName": "credit_risk_20211119212817", "modelVersionId": "1" }

L'image ci-dessous montre comment effectuer la même action dans la console Google Cloud :

Félicitations !

Vous savez maintenant utiliser Vertex AI pour :

importer un ensemble de données ;
entraîner un modèle à l'aide d'AutoML ;
évaluer les performances du modèle ;
déployer le modèle AutoML entraîné sur un point de terminaison ;
obtenir des prédictions.

Pour en savoir plus sur les différents composants de Vertex AI, consultez la documentation Vertex AI.

Terminer l'atelier

Une fois l'atelier terminé, cliquez sur Terminer l'atelier. Google Cloud Skills Boost supprime les ressources que vous avez utilisées, puis efface le compte.

Si vous le souhaitez, vous pouvez noter l'atelier. Sélectionnez un nombre d'étoiles, saisissez un commentaire, puis cliquez sur Envoyer.

Le nombre d'étoiles correspond à votre degré de satisfaction :

1 étoile = très insatisfait(e)
2 étoiles = insatisfait(e)
3 étoiles = ni insatisfait(e), ni satisfait(e)
4 étoiles = satisfait(e)
5 étoiles = très satisfait(e)

Si vous ne souhaitez pas donner votre avis, vous pouvez fermer la boîte de dialogue.

Pour soumettre des commentaires, suggestions ou corrections, veuillez accéder à l'onglet Assistance.

Copyright 2020 Google LLC Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.

Vertex AI : prédire les risques liés à un prêt avec AutoML

Vertex AI : prédire les risques liés à un prêt avec AutoML

Présentation

Objectifs

Préparation

Avant de cliquer sur le bouton Start Lab (Démarrer l'atelier)

Conditions requises

Démarrer votre atelier et vous connecter à la console

Présentation de Vertex AI

Tâche 1 : Préparer les données d'entraînement

Créer un ensemble de données

Importer des données

(Facultatif) Générer des statistiques

Tâche 2 : Entraîner le modèle

Méthode d'entraînement

Informations sur le modèle

Options d'entraînement

Options de calcul et tarifs

Tâche 3 : Évaluer les performances du modèle (démonstration uniquement)

Courbe de précision/rappel

Matrice de confusion

Importance des caractéristiques

Tâche 4 : Déployer le modèle (démonstration uniquement)

Créer et définir un point de terminaison

Surveillance et paramètres du modèle

Tâche 5 : Obtenir des prédictions

Félicitations !

Terminer l'atelier

Avant de commencer

Utilisez la navigation privée

Connectez-vous à la console

Utilisez la navigation privée pour effectuer l'atelier