Vertex AI: previsione del rischio di prestito con AutoML
- Panoramica
- Configurazione
- Introduzione a Vertex AI
- Attività 1: prepara i dati di addestramento
- Attività 2: addestra il modello
- Attività 3: valuta le prestazioni del modello (solo a scopo dimostrativo)
- Attività 4: esegui il deployment del modello (solo a scopo dimostrativo)
- Attività 5: token di connessione SML
- Attività 6: ottieni previsioni
- Complimenti!
- Termina il lab
Panoramica
In questo lab userai Vertex AI per addestrare e gestire un modello di machine learning per prevedere il rischio di prestito con un set di dati tabulare.
Obiettivi
Imparerai a:
- Caricare un set di dati in Vertex AI.
- Addestrare un modello di machine learning con AutoML.
- Valutare le prestazioni del modello.
- Eseguire il deployment del modello su un endpoint.
- Ottenere previsioni.
Configurazione
Prima di fare clic sul pulsante Avvia lab
Leggi le seguenti istruzioni. I lab sono a tempo e non possono essere messi in pausa. Il timer si avvia quando fai clic su Avvia lab e ti mostra per quanto tempo avrai a disposizione le risorse Google Cloud.
Con questo lab pratico Qwiklabs avrai la possibilità di completare le attività in prima persona, in un ambiente cloud reale e non di simulazione o demo. Riceverai delle nuove credenziali temporanee che potrai utilizzare per accedere a Google Cloud per la durata del lab.
Cosa serve
Per completare il lab, avrai bisogno di:
- Accesso a un browser Internet standard (Chrome è il browser consigliato).
- Tempo a disposizione per completare il lab.
Nota: se hai già un account o un progetto Google Cloud personale, non utilizzarli per questo lab.
Nota: se utilizzi un Pixelbook, apri una finestra di navigazione in incognito per avviare questo lab.
Come avviare il lab e accedere alla console
-
Fai clic sul pulsante Avvia lab. Se devi effettuare il pagamento per il lab, si apre una finestra popup per permetterti di selezionare il metodo di pagamento. Sul lato sinistro trovi un riquadro con le credenziali temporanee da utilizzare per il lab.
-
Copia il nome utente, quindi fai clic su Apri console Google. Il lab avvia le risorse e apre un'altra scheda che mostra la pagina Scegli un account.
Nota: apri le schede in finestre separate posizionate fianco a fianco. -
Nella pagina Scegli un account, fai clic su Utilizza un altro account. Si apre la pagina di accesso.
-
Qui incolla il nome utente che hai copiato dal riquadro Dettagli connessione, quindi copia e incolla la password.
- Fai clic nelle pagine successive:
- Accetta i termini e le condizioni.
- Non inserire opzioni di recupero o l'autenticazione a due fattori, perché si tratta di un account temporaneo.
- Non registrarti per le prove gratuite.
Dopo qualche istante, la console Cloud si apre in questa scheda.
Introduzione a Vertex AI
Questo lab utilizza Vertex AI, la piattaforma IA unificata su Google Cloud per addestrare un modello ML ed eseguirne il deployment. Vertex AI offre due opzioni su un'unica piattaforma per creare un modello ML: una soluzione senza codice con AutoML e una soluzione basata su codice con Addestramento personalizzato utilizzando Vertex Workbench. In questo lab userai AutoML.
In questo lab creerai un modello ML per determinare se un determinato cliente restituirà un prestito.
Attività 1: prepara i dati di addestramento
La dashboard iniziale di Vertex AI illustra le fasi principali dell'addestramento e del deployment di un modello ML: preparare i dati di addestramento, addestrare il modello e ottenere previsioni. Dopodiché, la dashboard mostra le attività recenti, ad esempio set di dati, modelli, previsioni, endpoint e istanze blocco note.
Crea un set di dati
- Nella console Google Cloud, nel menu di navigazione, fai clic su Vertex AI > Set di dati.
- Fai clic su Crea set di dati.
- Assegna il nome LoanRisk al set di dati.
- Per il tipo di dati e l'obiettivo, fai clic su Tabulare e poi seleziona Regressione/classificazione.
- Fai clic su Crea.
Carica dati
Esistono tre modi per importare dati in Vertex AI:
- Carica file CSV dal tuo computer.
- Seleziona file CSV da Cloud Storage.
- Seleziona una tabella o una vista da BigQuery.
Per praticità, il set di dati è già caricato in Cloud Storage.
-
Per l'origine dati, scegli Seleziona file CSV da Cloud Storage
-
Per Percorso file di importazione, digita:
- Fai clic su Continua.
(Facoltativo) Genera le statistiche
-
Per visualizzare le statistiche descrittive per ciascuna colonna del set di dati, fai clic su Genera statistiche.
La generazione delle statistiche potrebbe richiedere alcuni minuti, soprattutto la prima volta. -
Quando le statistiche sono pronte, fai clic sul nome di ciascuna colonna per visualizzare i grafici analitici.
Attività 2: addestra il modello
Una volta caricato un set di dati, è tutto pronto per addestrare un modello e prevedere se un cliente restituirà il prestito.
- Fai clic su Addestra nuovo modello e seleziona Altro.
Metodo di addestramento
-
Il set di dati è già denominato LoanRisk.
-
Per Obiettivo, seleziona Classificazione.
Selezioni la classificazione anziché la regressione perché vuoi prevedere un numero distinto (se un cliente restituirà un prestito: 0 per la restituzione, 1 per l'inadempienza/non restituzione) anziché un numero continuo.
- Fai clic su Continua.
Dettagli del modello
Specifica il nome del modello e della colonna di destinazione.
-
Assegna un nome al modello, ad esempio LoanRisk.
-
Per Colonna di destinazione, seleziona Predefinita.
-
(Facoltativo) Esplora Opzioni avanzate per definire in che modo assegnare i dati di addestramento rispetto a quelli di test e specificare la crittografia.
-
Fai clic su Continua.
-
Per Aggiungi caratteristiche, fai clic su Continua.
Opzioni di addestramento
Specifica quali colonne vuoi includere nel modello di addestramento. Ad esempio, IDCliente potrebbe non essere pertinente per prevedere il rischio di prestito.
-
Fai clic sul segno meno sulla riga IDCliente per escluderla dal modello di addestramento.
-
(Facoltativo) Esplora Opzioni avanzate per selezionare altri obiettivi di ottimizzazione.
Per ulteriori informazioni sugli obiettivi di ottimizzazione per i modelli AutoML tabulari, consulta la guida Obiettivi di ottimizzazione per i modelli AutoML tabulari. -
Fai clic su Continua.
Calcolo e prezzi
-
Per Budget, che rappresenta il numero di ore nodo per l'addestramento, inserisci 1.
L'addestramento del modello AutoML per 1 ora di calcolo è in genere un buon inizio per comprendere se esiste una relazione tra le caratteristiche e l'etichetta che hai selezionato. In seguito puoi modificare le caratteristiche e dedicare più tempo all'addestramento per migliorare le prestazioni del modello. -
Lascia l'interruzione anticipata impostata su Abilitata.
-
Fai clic su Inizia addestramento.
A seconda della quantità di dati e del metodo, l'addestramento può richiedere da pochi minuti a un paio d'ore. Di norma, Google Cloud ti invia un'email al termine del job di addestramento. Tuttavia, nell'ambiente Qwiklabs, non riceverai alcuna email.
Per non dover attendere l'addestramento del modello, scarica un modello preaddestrato nell'Attività 5 per ottenere previsioni nell'Attività 6. Questo modello preaddestrato è il risultato dell'addestramento che segue gli stessi passaggi dell'Attività 1 e dell'Attività 2.
Attività 3: valuta le prestazioni del modello (solo a scopo dimostrativo)
Vertex AI fornisce molte metriche per valutare le prestazioni del modello; ti concentrerai su tre:
- Curva di precisione-richiamo
- Matrice di confusione
- Importanza delle caratteristiche
La curva di precisione-richiamo
La soglia di affidabilità determina il modo in cui un modello ML conta i casi positivi. Con una soglia più alta aumenta la precisione, ma diminuisce il richiamo. Con una soglia più bassa diminuisce la precisione, ma aumenta il richiamo.
Puoi regolare manualmente la soglia per osservarne l'impatto su precisione e richiamo e trovare il miglior punto di compromesso tra i due per soddisfare le tue esigenze aziendali.
La matrice di confusione
Una matrice di confusione indica la percentuale di esempi di ciascuna classe nel set di test che il tuo modello ha previsto correttamente.
La matrice di confusione mostra che il tuo modello iniziale è in grado di prevedere correttamente il 100% degli esempi di restituzione e l'87% degli esempi predefiniti nel tuo set di test, il che non è poi così male.
Puoi migliorare la percentuale aggiungendo più esempi (più dati), progettando nuove caratteristiche, modificando il metodo di formazione ecc.
L'importanza delle caratteristiche
In Vertex AI, l'importanza delle caratteristiche viene mostrata tramite un grafico a barre che illustra come ciascuna caratteristica contribuisce a una previsione. Più lunga è la barra, o maggiore è il valore numerico associato a una caratteristica, più importante è quest'ultima.
Questi valori di importanza delle caratteristiche potrebbero essere utilizzati per aiutarti a migliorare il tuo modello e avere maggiore fiducia nelle sue previsioni. Ad esempio, la prossima volta che addestri un modello, potresti decidere di rimuovere le caratteristiche meno importanti o di combinare due delle caratteristiche più significative in un incrocio di caratteristiche per vedere se ciò migliora le prestazioni del modello.
L’importanza delle caratteristiche è solo un esempio della funzionalità completa di machine learning di Vertex AI chiamata Explainable AI. Explainable AI è costituito da una serie di strumenti e framework per aiutarti a comprendere e interpretare le previsioni dei modelli di machine learning.
Attività 4: esegui il deployment del modello (solo a scopo dimostrativo)
Ora che hai un modello addestrato, il passaggio successivo è creare un endpoint in Vertex. A una risorsa modello in Vertex possono essere associati più endpoint ed è possibile suddividere il traffico tra endpoint.
Crea e definisci un endpoint
-
Sulla pagina del tuo modello, fai clic su Deployment e test e quindi su Deployment su endpoint.
-
Per Nome endpoint, digita LoanRisk
-
Fai clic su Continua.
Impostazioni e monitoraggio del modello
-
Lascia invariate le impostazioni di suddivisione del traffico.
-
Per Tipo di macchina, seleziona e2-standard-8, 8 vCPU, 32 GiB di memoria.
-
Per Opzioni di spiegabilità, fai clic su Attribuzione delle caratteristiche.
-
Fai clic su Fine.
-
Fai clic su Continua.
-
In Monitoraggio del modello, fai clic su Continua.
-
In Obiettivi del modello > Origine dati di addestramento, seleziona Set di dati Vertex AI.
-
Seleziona il tuo set di dati dal menu a discesa.
-
In Colonna di destinazione, digita Default
-
Lascia invariate le restanti impostazioni e fai clic su Esegui il deployment.
Il deployment dell'endpoint richiederà alcuni minuti. Una volta completato, accanto al nome comparirà un segno di spunta verde.
Ora è tutto pronto per ottenere previsioni sul modello di cui hai eseguito il deployment.
Attività 5: token di connessione SML
Recupera il tuo token di connessione
Per consentire alla pipeline di eseguire l'autenticazione e di ricevere l'autorizzazione a chiamare l'endpoint per ottenere le previsioni, devi fornire il tuo token di connessione.
Attieniti alle istruzioni riportate di seguito per ottenere il tuo token. Se hai problemi a ottenere il token di connessione, ciò può essere dovuto ai cookie nella finestra di navigazione in incognito. Se succede, prova a eseguire questo passaggio in una finestra non in incognito.
-
Al momento dell'accesso, utilizza il tuo indirizzo email e la tua password di studente.
-
Fai clic sul pulsante Copia. Verrà copiato negli appunti un token molto lungo.
Questo token sarà disponibile solo per circa 60 secondi, quindi copialo ed esegui i passaggi successivi.
Attività 6: ottieni previsioni
In questa sezione utilizzerai il servizio SML (Shared Machine Learning) per lavorare con un modello addestrato esistente.
VARIABILE DI AMBIENTE | VALORE |
---|---|
AUTH_TOKEN | Utilizza il valore della sezione precedente |
ENDPOINT | https://sml-api-vertex-kjyo252taq-uc.a.run.app/vertex/predict/tabular_classification |
INPUT_DATA_FILE | INPUT-JSON |
Per utilizzare il modello addestrato, dovrai creare alcune variabili di ambiente.
-
Apri una finestra di Cloud Shell.
-
Sostituisci
INSERT_SML_BEARER_TOKEN
con il valore del token di connessione della sezione precedente:
- Scarica gli asset del lab:
- Estrai gli asset del lab:
- Crea una variabile di ambiente ENDPOINT:
- Crea una variabile di ambiente
INPUT_DATA_FILE
:
Il file INPUT-JSON
è composto dai seguenti valori:
età | IDCliente | reddito | prestito |
---|---|---|---|
40.77 | 997 | 44964.01 | 3944.22 |
-
Testa il servizio SML trasmettendo i parametri specificati nelle variabili di ambiente.
-
Effettua una richiesta al servizio SML:
Questa query dovrebbe generare una risposta simile a questa:
- Modifica il file
INPUT-JSON
per testare un nuovo scenario:
età | IDCliente | reddito | prestito |
---|---|---|---|
30.00 | 998 | 50000.00 | 20000.00 |
-
Modifica il file
INPUT-JSON
e sostituisci i valori originali. Puoi utilizzare l'editor che preferisci (vim
,nano
,emacs
) o l'editor di codice Cloud Shell. -
Testa il servizio SML trasmettendo i parametri specificati nelle variabili di ambiente.
-
Effettua una richiesta al servizio SML:
In questo caso, presupponendo che il reddito della persona sia di 50.000, che abbia 30 anni e che il prestito sia di 20.000, il modello prevede che questa persona restituirà il prestito.
Questa query dovrebbe generare una risposta simile a questa:
Se utilizzi la console Google Cloud, la seguente immagine illustra come potrebbe essere eseguita la stessa azione:
Complimenti!
Ora puoi utilizzare Vertex AI per:
- Caricare un set di dati.
- Addestrare un modello con AutoML.
- Valutare le prestazioni del modello.
- Eseguire il deployment del modello AutoML addestrato su un endpoint.
- Ottenere previsioni.
Per saperne di più sulle diverse parti di Vertex AI, consulta la documentazione di Vertex AI.
Termina il lab
Una volta completato il lab, fai clic su Termina lab. Google Cloud Skills Boost rimuove le risorse che hai utilizzato ed esegue la pulizia dell'account.
Avrai la possibilità di inserire una valutazione in merito alla tua esperienza. Seleziona il numero di stelle applicabile, inserisci un commento, quindi fai clic su Invia.
Il numero di stelle corrisponde alle seguenti valutazioni:
- 1 stella = molto insoddisfatto
- 2 stelle = insoddisfatto
- 3 stelle = esperienza neutra
- 4 stelle = soddisfatto
- 5 stelle = molto soddisfatto
Se non vuoi lasciare un feedback, chiudi la finestra di dialogo.
Per feedback, suggerimenti o correzioni, utilizza la scheda Assistenza.
Copyright 2020 Google LLC Tutti i diritti riservati. Google e il logo Google sono marchi di Google LLC. Tutti gli altri nomi di società e prodotti sono marchi delle rispettive società a cui sono associati.