arrow_back

Vertex AI: previsione del rischio di prestito con AutoML

Accedi Partecipa
Metti alla prova le tue conoscenze e condividile con la nostra community.
done
Accedi a oltre 700 lab pratici, badge delle competenze e corsi

Vertex AI: previsione del rischio di prestito con AutoML

Lab 2 ore 30 minuti universal_currency_alt 5 crediti show_chart Introduttivi
info Questo lab potrebbe incorporare strumenti di AI a supporto del tuo apprendimento.
Metti alla prova le tue conoscenze e condividile con la nostra community.
done
Accedi a oltre 700 lab pratici, badge delle competenze e corsi

Panoramica

In questo lab userai Vertex AI per addestrare e gestire un modello di machine learning per prevedere il rischio di prestito con un set di dati tabulare.

Obiettivi

Imparerai a:

  • Caricare un set di dati in Vertex AI.
  • Addestrare un modello di machine learning con AutoML.
  • Valutare le prestazioni del modello.
  • Eseguire il deployment del modello su un endpoint.
  • Ottenere previsioni.

Configurazione

Prima di fare clic sul pulsante Avvia lab

Leggi le seguenti istruzioni. I lab sono a tempo e non possono essere messi in pausa. Il timer si avvia quando fai clic su Avvia lab e ti mostra per quanto tempo avrai a disposizione le risorse Google Cloud.

Con questo lab pratico Qwiklabs avrai la possibilità di completare le attività in prima persona, in un ambiente cloud reale e non di simulazione o demo. Riceverai delle nuove credenziali temporanee che potrai utilizzare per accedere a Google Cloud per la durata del lab.

Cosa serve

Per completare il lab, avrai bisogno di:

  • Accesso a un browser Internet standard (Chrome è il browser consigliato).
  • Tempo a disposizione per completare il lab.

Nota: se hai già un account o un progetto Google Cloud personale, non utilizzarli per questo lab.

Nota: se utilizzi un Pixelbook, apri una finestra di navigazione in incognito per avviare questo lab.

Come avviare il lab e accedere alla console

  1. Fai clic sul pulsante Avvia lab. Se devi effettuare il pagamento per il lab, si apre una finestra popup per permetterti di selezionare il metodo di pagamento. Sul lato sinistro trovi un riquadro con le credenziali temporanee da utilizzare per il lab.

    Riquadro delle credenziali

  2. Copia il nome utente, quindi fai clic su Apri console Google. Il lab avvia le risorse e apre un'altra scheda che mostra la pagina Scegli un account.

    Nota: apri le schede in finestre separate posizionate fianco a fianco.
  3. Nella pagina Scegli un account, fai clic su Utilizza un altro account. Si apre la pagina di accesso.

    Scegli una finestra di dialogo dell'account con l'opzione Utilizza un altro account evidenziata

  4. Qui incolla il nome utente che hai copiato dal riquadro Dettagli connessione, quindi copia e incolla la password.

Nota: devi utilizzare le credenziali presenti nel riquadro Dettagli connessione. Non utilizzare le tue credenziali Google Cloud Skills Boost. Se hai un account Google Cloud, non usarlo per questo lab per evitare che ti vengano addebitati dei costi.
  1. Fai clic nelle pagine successive:
  • Accetta i termini e le condizioni.
  • Non inserire opzioni di recupero o l'autenticazione a due fattori, perché si tratta di un account temporaneo.
  • Non registrarti per le prove gratuite.

Dopo qualche istante, la console Cloud si apre in questa scheda.

Nota: puoi visualizzare il menu con un elenco di prodotti e servizi Google Cloud facendo clic sul menu di navigazione in alto a sinistra. Menu della console Cloud

Introduzione a Vertex AI

Questo lab utilizza Vertex AI, la piattaforma IA unificata su Google Cloud per addestrare un modello ML ed eseguirne il deployment. Vertex AI offre due opzioni su un'unica piattaforma per creare un modello ML: una soluzione senza codice con AutoML e una soluzione basata su codice con Addestramento personalizzato utilizzando Vertex Workbench. In questo lab userai AutoML.

In questo lab creerai un modello ML per determinare se un determinato cliente restituirà un prestito.

Attività 1: prepara i dati di addestramento

La dashboard iniziale di Vertex AI illustra le fasi principali dell'addestramento e del deployment di un modello ML: preparare i dati di addestramento, addestrare il modello e ottenere previsioni. Dopodiché, la dashboard mostra le attività recenti, ad esempio set di dati, modelli, previsioni, endpoint e istanze blocco note.

Crea un set di dati

  1. Nella console Google Cloud, nel menu di navigazione, fai clic su Vertex AI > Set di dati.
  2. Fai clic su Crea set di dati.
  3. Assegna il nome LoanRisk al set di dati.
  4. Per il tipo di dati e l'obiettivo, fai clic su Tabulare e poi seleziona Regressione/classificazione.
  5. Fai clic su Crea.

Carica dati

Esistono tre modi per importare dati in Vertex AI:

  • Carica file CSV dal tuo computer.
  • Seleziona file CSV da Cloud Storage.
  • Seleziona una tabella o una vista da BigQuery.

Per praticità, il set di dati è già caricato in Cloud Storage.

  1. Per l'origine dati, scegli Seleziona file CSV da Cloud Storage

  2. Per Percorso file di importazione, digita:

spls/cbl455/loan_risk.csv
  1. Fai clic su Continua.
Nota: puoi anche configurare questa pagina facendo clic su Set di dati nel menu a sinistra e selezionando quindi il nome del set di dati nella pagina Set di dati.

(Facoltativo) Genera le statistiche

  1. Per visualizzare le statistiche descrittive per ciascuna colonna del set di dati, fai clic su Genera statistiche.
    La generazione delle statistiche potrebbe richiedere alcuni minuti, soprattutto la prima volta.

  2. Quando le statistiche sono pronte, fai clic sul nome di ciascuna colonna per visualizzare i grafici analitici.

Attività 2: addestra il modello

Una volta caricato un set di dati, è tutto pronto per addestrare un modello e prevedere se un cliente restituirà il prestito.

  • Fai clic su Addestra nuovo modello e seleziona Altro.

Metodo di addestramento

  1. Il set di dati è già denominato LoanRisk.

  2. Per Obiettivo, seleziona Classificazione.

Selezioni la classificazione anziché la regressione perché vuoi prevedere un numero distinto (se un cliente restituirà un prestito: 0 per la restituzione, 1 per l'inadempienza/non restituzione) anziché un numero continuo.

  1. Fai clic su Continua.

Dettagli del modello

Specifica il nome del modello e della colonna di destinazione.

  1. Assegna un nome al modello, ad esempio LoanRisk.

  2. Per Colonna di destinazione, seleziona Predefinita.

  3. (Facoltativo) Esplora Opzioni avanzate per definire in che modo assegnare i dati di addestramento rispetto a quelli di test e specificare la crittografia.

  4. Fai clic su Continua.

  5. Per Aggiungi caratteristiche, fai clic su Continua.

Opzioni di addestramento

Specifica quali colonne vuoi includere nel modello di addestramento. Ad esempio, IDCliente potrebbe non essere pertinente per prevedere il rischio di prestito.

  1. Fai clic sul segno meno sulla riga IDCliente per escluderla dal modello di addestramento.

  2. (Facoltativo) Esplora Opzioni avanzate per selezionare altri obiettivi di ottimizzazione.
    Per ulteriori informazioni sugli obiettivi di ottimizzazione per i modelli AutoML tabulari, consulta la guida Obiettivi di ottimizzazione per i modelli AutoML tabulari.

  3. Fai clic su Continua.

Calcolo e prezzi

  1. Per Budget, che rappresenta il numero di ore nodo per l'addestramento, inserisci 1.
    L'addestramento del modello AutoML per 1 ora di calcolo è in genere un buon inizio per comprendere se esiste una relazione tra le caratteristiche e l'etichetta che hai selezionato. In seguito puoi modificare le caratteristiche e dedicare più tempo all'addestramento per migliorare le prestazioni del modello.

  2. Lascia l'interruzione anticipata impostata su Abilitata.

  3. Fai clic su Inizia addestramento.

A seconda della quantità di dati e del metodo, l'addestramento può richiedere da pochi minuti a un paio d'ore. Di norma, Google Cloud ti invia un'email al termine del job di addestramento. Tuttavia, nell'ambiente Qwiklabs, non riceverai alcuna email.

Per non dover attendere l'addestramento del modello, scarica un modello preaddestrato nell'Attività 5 per ottenere previsioni nell'Attività 6. Questo modello preaddestrato è il risultato dell'addestramento che segue gli stessi passaggi dell'Attività 1 e dell'Attività 2.

Attività 3: valuta le prestazioni del modello (solo a scopo dimostrativo)

Vertex AI fornisce molte metriche per valutare le prestazioni del modello; ti concentrerai su tre:

  • Curva di precisione-richiamo
  • Matrice di confusione
  • Importanza delle caratteristiche
Nota: se avessi addestrato un modello, potresti accedere alla scheda Model Registry in Vertex AI.

1. Vai a Model Registry.

2. Fai clic sul modello appena addestrato.

3. Esplora la scheda Valuta.

Tuttavia, in questo lab puoi saltare questo passaggio poiché utilizzi un modello preaddestrato.

La curva di precisione-richiamo

Dispositivo di scorrimento della soglia di affidabilità impostato su 0,5 e grafici per Curva di precisione-richiamo, Curva ROC e Precisione-richiamo per soglia

La soglia di affidabilità determina il modo in cui un modello ML conta i casi positivi. Con una soglia più alta aumenta la precisione, ma diminuisce il richiamo. Con una soglia più bassa diminuisce la precisione, ma aumenta il richiamo.

Puoi regolare manualmente la soglia per osservarne l'impatto su precisione e richiamo e trovare il miglior punto di compromesso tra i due per soddisfare le tue esigenze aziendali.

La matrice di confusione

Una matrice di confusione indica la percentuale di esempi di ciascuna classe nel set di test che il tuo modello ha previsto correttamente.

Tabella della matrice di confusione che mostra le classificazioni Etichetta effettiva ed Etichetta prevista

La matrice di confusione mostra che il tuo modello iniziale è in grado di prevedere correttamente il 100% degli esempi di restituzione e l'87% degli esempi predefiniti nel tuo set di test, il che non è poi così male.

Puoi migliorare la percentuale aggiungendo più esempi (più dati), progettando nuove caratteristiche, modificando il metodo di formazione ecc.

L'importanza delle caratteristiche

In Vertex AI, l'importanza delle caratteristiche viene mostrata tramite un grafico a barre che illustra come ciascuna caratteristica contribuisce a una previsione. Più lunga è la barra, o maggiore è il valore numerico associato a una caratteristica, più importante è quest'ultima.

Grafico a barre dell'importanza delle caratteristiche per prestito, reddito ed età

Questi valori di importanza delle caratteristiche potrebbero essere utilizzati per aiutarti a migliorare il tuo modello e avere maggiore fiducia nelle sue previsioni. Ad esempio, la prossima volta che addestri un modello, potresti decidere di rimuovere le caratteristiche meno importanti o di combinare due delle caratteristiche più significative in un incrocio di caratteristiche per vedere se ciò migliora le prestazioni del modello.

L’importanza delle caratteristiche è solo un esempio della funzionalità completa di machine learning di Vertex AI chiamata Explainable AI. Explainable AI è costituito da una serie di strumenti e framework per aiutarti a comprendere e interpretare le previsioni dei modelli di machine learning.

Attività 4: esegui il deployment del modello (solo a scopo dimostrativo)

Nota: non eseguirai il deployment del modello su un endpoint perché l'addestramento del modello può richiedere un'ora. Qui puoi rivedere i passaggi che eseguiresti in un ambiente di produzione.

Ora che hai un modello addestrato, il passaggio successivo è creare un endpoint in Vertex. A una risorsa modello in Vertex possono essere associati più endpoint ed è possibile suddividere il traffico tra endpoint.

Crea e definisci un endpoint

  1. Sulla pagina del tuo modello, fai clic su Deployment e test e quindi su Deployment su endpoint.

  2. Per Nome endpoint, digita LoanRisk

  3. Fai clic su Continua.

Impostazioni e monitoraggio del modello

  1. Lascia invariate le impostazioni di suddivisione del traffico.

  2. Per Tipo di macchina, seleziona e2-standard-8, 8 vCPU, 32 GiB di memoria.

  3. Per Opzioni di spiegabilità, fai clic su Attribuzione delle caratteristiche.

  4. Fai clic su Fine.

  5. Fai clic su Continua.

  6. In Monitoraggio del modello, fai clic su Continua.

  7. In Obiettivi del modello > Origine dati di addestramento, seleziona Set di dati Vertex AI.

  8. Seleziona il tuo set di dati dal menu a discesa.

  9. In Colonna di destinazione, digita Default

  10. Lascia invariate le restanti impostazioni e fai clic su Esegui il deployment.

Il deployment dell'endpoint richiederà alcuni minuti. Una volta completato, accanto al nome comparirà un segno di spunta verde.

Ora è tutto pronto per ottenere previsioni sul modello di cui hai eseguito il deployment.

Attività 5: token di connessione SML

Recupera il tuo token di connessione

Per consentire alla pipeline di eseguire l'autenticazione e di ricevere l'autorizzazione a chiamare l'endpoint per ottenere le previsioni, devi fornire il tuo token di connessione.

Attieniti alle istruzioni riportate di seguito per ottenere il tuo token. Se hai problemi a ottenere il token di connessione, ciò può essere dovuto ai cookie nella finestra di navigazione in incognito. Se succede, prova a eseguire questo passaggio in una finestra non in incognito.

  1. Accedi a https://gsp-auth-kjyo252taq-uc.a.run.app/

  2. Al momento dell'accesso, utilizza il tuo indirizzo email e la tua password di studente.

  3. Fai clic sul pulsante Copia. Verrà copiato negli appunti un token molto lungo.

bearer-login.png

Questo token sarà disponibile solo per circa 60 secondi, quindi copialo ed esegui i passaggi successivi.

Se hai problemi a ottenere il token di connessione, ciò può essere dovuto ai cookie nella finestra di navigazione in incognito; prova in una finestra non in incognito.

Attività 6: ottieni previsioni

In questa sezione utilizzerai il servizio SML (Shared Machine Learning) per lavorare con un modello addestrato esistente.

VARIABILE DI AMBIENTE VALORE
AUTH_TOKEN Utilizza il valore della sezione precedente
ENDPOINT https://sml-api-vertex-kjyo252taq-uc.a.run.app/vertex/predict/tabular_classification
INPUT_DATA_FILE INPUT-JSON

Per utilizzare il modello addestrato, dovrai creare alcune variabili di ambiente.

  1. Apri una finestra di Cloud Shell.

  2. Sostituisci INSERT_SML_BEARER_TOKEN con il valore del token di connessione della sezione precedente:

export AUTH_TOKEN="INSERT_SML_BEARER_TOKEN"
  1. Scarica gli asset del lab:
gcloud storage cp gs://spls/cbl455/cbl455.tar.gz.
  1. Estrai gli asset del lab:
tar -xvf cbl455.tar.gz
  1. Crea una variabile di ambiente ENDPOINT:
export ENDPOINT="https://sml-api-vertex-kjyo252taq-uc.a.run.app/vertex/predict/tabular_classification"
  1. Crea una variabile di ambiente INPUT_DATA_FILE:
export INPUT_DATA_FILE="INPUT-JSON" Nota: dopo aver estratto gli asset del lab, dedica un momento alla revisione dei contenuti.

Il file INPUT-JSON viene utilizzato per fornire a Vertex AI i dati del modello richiesti. Modifica questo file per generare previsioni personalizzate.

L'applicazione smlproxy viene utilizzata per comunicare con il backend.

Il file INPUT-JSON è composto dai seguenti valori:

età IDCliente reddito prestito
40.77 997 44964.01 3944.22
  1. Testa il servizio SML trasmettendo i parametri specificati nelle variabili di ambiente.

  2. Effettua una richiesta al servizio SML:

./smlproxy tabular \ -a $AUTH_TOKEN \ -e $ENDPOINT \ -d $INPUT_DATA_FILE

Questa query dovrebbe generare una risposta simile a questa:

SML Tabular HTTP Response: 2022/01/10 15:04:45 {"model_class":"0","model_score":0.9999981}
  1. Modifica il file INPUT-JSON per testare un nuovo scenario:
età IDCliente reddito prestito
30.00 998 50000.00 20000.00
  1. Modifica il file INPUT-JSON e sostituisci i valori originali. Puoi utilizzare l'editor che preferisci (vim, nano, emacs) o l'editor di codice Cloud Shell.

  2. Testa il servizio SML trasmettendo i parametri specificati nelle variabili di ambiente.

  3. Effettua una richiesta al servizio SML:

./smlproxy tabular \ -a $AUTH_TOKEN \ -e $ENDPOINT \ -d $INPUT_DATA_FILE

In questo caso, presupponendo che il reddito della persona sia di 50.000, che abbia 30 anni e che il prestito sia di 20.000, il modello prevede che questa persona restituirà il prestito.

Questa query dovrebbe generare una risposta simile a questa:

SML Tabular HTTP Response: 2022/01/10 15:04:45 {"model_class":"0","model_score":1.0322887E-5}

Se utilizzi la console Google Cloud, la seguente immagine illustra come potrebbe essere eseguita la stessa azione:

Passaggi della previsione evidenziati nelle sezioni pertinenti

Complimenti!

Ora puoi utilizzare Vertex AI per:

  • Caricare un set di dati.
  • Addestrare un modello con AutoML.
  • Valutare le prestazioni del modello.
  • Eseguire il deployment del modello AutoML addestrato su un endpoint.
  • Ottenere previsioni.

Per saperne di più sulle diverse parti di Vertex AI, consulta la documentazione di Vertex AI.

Termina il lab

Una volta completato il lab, fai clic su Termina lab. Google Cloud Skills Boost rimuove le risorse che hai utilizzato ed esegue la pulizia dell'account.

Avrai la possibilità di inserire una valutazione in merito alla tua esperienza. Seleziona il numero di stelle applicabile, inserisci un commento, quindi fai clic su Invia.

Il numero di stelle corrisponde alle seguenti valutazioni:

  • 1 stella = molto insoddisfatto
  • 2 stelle = insoddisfatto
  • 3 stelle = esperienza neutra
  • 4 stelle = soddisfatto
  • 5 stelle = molto soddisfatto

Se non vuoi lasciare un feedback, chiudi la finestra di dialogo.

Per feedback, suggerimenti o correzioni, utilizza la scheda Assistenza.

Copyright 2020 Google LLC Tutti i diritti riservati. Google e il logo Google sono marchi di Google LLC. Tutti gli altri nomi di società e prodotti sono marchi delle rispettive società a cui sono associati.

Questi contenuti non sono al momento disponibili

Ti invieremo una notifica via email quando sarà disponibile

Bene.

Ti contatteremo via email non appena sarà disponibile