Vertex AI: Kreditrisiken mit AutoML vorhersagen
- Übersicht
- Einrichtung
- Einführung in Vertex AI
- Aufgabe 1: Trainingsdaten vorbereiten
- Aufgabe 2: Modell trainieren
- Aufgabe 3: Modellleistung bewerten (nur Demonstration)
- Aufgabe 4: Modell bereitstellen (nur Demonstration)
- Aufgabe 5: SML-Inhabertoken
- Aufgabe 6: Vorhersagen abrufen
- Das wars! Sie haben das Lab erfolgreich abgeschlossen.
- Lab beenden
Übersicht
In diesem Lab verwenden Sie Vertex AI, um ein Machine-Learning-Modell zur Vorhersage des Kreditrisikos anhand eines tabellarischen Datensatzes zu trainieren und einzusetzen.
Ziele
Nach Abschluss können Sie:
- Ein Dataset in Vertex AI hochladen
- Ein Machine-Learning-Modell mit AutoML trainieren
- Die Modellleistung bewerten
- Modell auf einem Endpunkt bereitstellen
- Vorhersagen abrufen
Einrichtung
Vor dem Klick auf "Start Lab" (Lab starten)
Lesen Sie diese Anleitung. Labs sind zeitlich begrenzt und können nicht pausiert werden. Der Timer, der mit dem Klick auf "Start Lab" (Lab starten) gestartet wird, gibt an, wie lange die Ressourcen für das Lab verfügbar sind.
In diesem praxisorientierten Qwiklabs-Lab können Sie die Lab-Aktivitäten selbst in einer echten Cloud-Umgebung durchführen, nicht in einer Simulations- oder Demo-Umgebung. Dazu erhalten Sie neue, temporäre Anmeldedaten, mit denen Sie für die Dauer des Labs auf die Google Cloud Platform zugreifen können.
Voraussetzungen
Für dieses Lab benötigen Sie Folgendes:
- Einen Standardbrowser (empfohlen wird Chrome)
- Genügend Zeit, um das Lab abzuschließen
Hinweis: Auch wenn Sie bereits ein eigenes GCP-Konto oder -Projekt haben, sollten Sie es nicht für das Lab verwenden.
So starten Sie Ihr Lab und melden sich bei der Console an
-
Klicken Sie auf Start Lab (Lab starten). Wenn Sie für das Lab bezahlen müssen, wird ein Pop-up-Fenster geöffnet, in dem Sie Ihre Zahlungsmethode auswählen können. Auf der linken Seite sehen Sie ein Feld, in dem Ihre temporären Anmeldedaten für dieses Lab angezeigt werden.
-
Kopieren Sie den Nutzernamen und klicken Sie dann auf Open Google Console (Google Console öffnen). Das Lab aktiviert Ressourcen und öffnet dann einen weiteren Tab mit der Seite Choose an account (Konto auswählen).
Tipp: Öffnen Sie die Tabs nebeneinander in separaten Fenstern.
-
Klicken Sie auf der Seite "Choose an account" (Konto auswählen) auf Use Another Account (Anderes Konto verwenden).
-
Die Anmeldeseite wird geöffnet. Fügen Sie den Namen ein, den Sie aus dem Bereich "Connection Details" (Verbindungsdetails) kopiert haben. Kopieren Sie dann das Passwort und fügen Sie es ein.
Wichtig: Sie müssen sich mit dem Nutzernamen und Passwort aus dem Bereich "Connection Details" (Verbindungsdetails) anmelden. Verwenden Sie nicht Ihre Qwiklabs-Anmeldedaten. Auch wenn Sie bereits ein eigenes GCP-Konto haben, sollten Sie es nicht für dieses Lab verwenden (so vermeiden Sie Gebühren).
-
Klicken Sie sich durch die nachfolgenden Seiten:
- Akzeptieren Sie die Nutzungsbedingungen.
- Fügen Sie keine Wiederherstellungsoptionen oder Zwei-Faktor-Authentifizierung hinzu (da dies ein temporäres Konto ist).
- Melden Sie sich nicht für kostenlose Tests an.
Nach wenigen Augenblicken wird die GCP Console in diesem Tab geöffnet.
Einführung in Vertex AI
In diesem Lab kommt Vertex AI zum Einsatz, die einheitliche KI-Plattform in Google Cloud. Damit werden Sie ein ML-Modell trainieren und bereitstellen. Mit Vertex AI haben Sie auf nur einer Plattform zwei Optionen zum Erstellen eines ML-Modells: eine Lösung ohne Code mit AutoML und eine codebasierte Lösung mit benutzerdefiniertem Training über Vertex Workbench. Hier verwenden Sie AutoML.
In diesem Lab erstellen Sie ein ML-Modell, um zu ermitteln, ob ein bestimmter Kunde seinen Kredit zurückzahlen wird.
Aufgabe 1: Trainingsdaten vorbereiten
Der Startbildschirm des Vertex AI-Dashboards veranschaulicht die wichtigsten Schritte zum Trainieren und Bereitstellen eines ML-Modells: Trainingsdaten vorbereiten, Modell trainieren und Vorhersagen abrufen. Später zeigt das Dashboard Ihre jüngsten Aktivitäten an, z. B. die letzten Datensätze, Modelle, Vorhersagen, Endpunkte und Notebook-Instanzen.
Dataset erstellen
- Klicken Sie in der Google Cloud Console im Navigationsmenü auf Vertex AI > Datasets.
- Klicken Sie auf Dataset erstellen.
- Nennen Sie das Dataset LoanRisk.
- Wählen Sie als Datentyp und Ziel die Option Tabelle und wählen Sie dann Regression/Klassifizierung.
- Klicken Sie auf Erstellen.
Daten hochladen
Es gibt drei Möglichkeiten, Daten in Vertex AI zu importieren:
- CSV-Dateien von Ihrem Computer hochladen
- CSV-Dateien aus Cloud Storage auswählen
- Tabelle oder Ansicht aus BigQuery auswählen
Der Einfachheit halber wurde das Dataset schon in Cloud Storage hochgeladen.
-
Wählen Sie für die Datenquelle die Option CSV-Dateien aus Cloud Storage auswählen aus.
-
Geben Sie unter Importdateipfad Folgendes ein:
- Klicken Sie auf Weiter.
(Optional) Statistiken erstellen
-
Klicken Sie auf Statistiken erstellen, um die beschreibenden Statistiken für jede Spalte Ihres Datasets anzuzeigen.
Das Erstellen der Statistiken kann einige Minuten dauern, vor allem beim ersten Mal. -
Wenn die Statistiken fertig sind, können Sie durch Klicken auf die einzelnen Spaltennamen die analytischen Diagramme anzeigen.
Aufgabe 2: Modell trainieren
Nachdem Sie ein Dataset hochgeladen haben, können Sie ein Modell trainieren, um vorherzusagen, ob ein Kunde einen Kredit zurückzahlen wird.
- Klicken Sie auf Neues Modell trainieren und wählen Sie Anderes.
Trainingsmethode
-
Das Dataset hat schon den Namen LoanRisk.
-
Wählen Sie als Ziel die Option Klassifizierung aus.
Sie wählen Klassifizierung statt Regression aus, weil Sie eine konkrete Zahl vorhersagen (ob ein Kunde einen Kredit zurückzahlen wird: 0 für Rückzahlung, 1 für Zahlungsausfall/Keine Rückzahlung) und nicht eine kontinuierliche Zahl.
- Klicken Sie auf Weiter.
Modelldetails
Geben Sie den Namen des Modells und die Zielspalte an.
-
Geben Sie dem Modell einen Namen, beispielsweise LoanRisk.
-
Wählen Sie für Zielspalte die Option Standard.
-
(Optional) Unter Erweiterte Optionen können Sie festlegen, wie Trainings- und Testdaten zugewiesen werden, und Verschlüsselungsoptionen wählen.
-
Klicken Sie auf Weiter.
-
Klicken Sie auf Weiter, um Features hinzuzufügen.
Trainingsoptionen
Geben Sie an, welche Spalten Sie in das Trainingsmodell aufnehmen möchten. Zum Beispiel spielt die ClientID für die Vorhersage des Kreditrisikos wahrscheinlich keine Rolle.
-
Klicken Sie auf das Minus in der Zeile ClientID, um diese aus dem Modelltraining auszuschließen.
-
(Optional) Unter Erweiterte Optionen können Sie verschiedene Optimierungsziele auswählen.
Weitere Informationen zu Optimierungszielen für tabellarische AutoML-Modelle finden Sie in der entsprechenden Anleitung. -
Klicken Sie auf Weiter.
Computing und Preise
-
Der Wert unter Budget steht für die Knotenstunden für das Training. Geben Sie hier 1 ein.
Das Training Ihres AutoML-Modells für eine Rechenstunde ist meist ein guter Ausgangspunkt, um festzustellen, ob es eine Beziehung zwischen den von Ihnen ausgewählten Features und Labels gibt. Ausgehend davon können Sie Features anpassen und das Modell für weitere Stunden trainieren, um die Modellleistung zu verbessern. -
Vorzeitiges Beenden sollte aktiviert bleiben.
-
Klicken Sie auf Training starten.
Abhängig von der Datenmenge und der Trainingsmethode kann das Training zwischen einigen Minuten und einigen Stunden dauern. Normalerweise erhalten Sie eine E-Mail von Google Cloud, wenn das Training abgeschlossen ist. In der Qwiklabs-Umgebung geschieht das jedoch nicht.
Um nicht das gesamte Modelltraining abwarten zu müssen, laden Sie in Aufgabe 5 ein vortrainiertes Modell herunter, für welches Sie in Aufgabe 6 Vorhersagen abrufen. Dieses vortrainierte Modell wurde mit denselben Schritten trainiert, die Sie in Aufgabe 1 und Aufgabe 2 ausgeführt haben.
Aufgabe 3: Modellleistung bewerten (nur Demonstration)
Vertex AI bietet zahlreiche Messwerte zur Bewertung der Modellleistung. Wir konzentrieren uns auf drei davon:
- Precision-/Recall-Kurve
- Wahrheitsmatrix
- Featurewichtigkeit
Precision-/Recall-Kurve
Der Konfidenzschwellenwert bestimmt, wie ein ML-Modell die positiven Fälle zählt. Ein höherer Schwellenwert erhöht den Precision-Wert, verringert aber den Recall-Wert. Ein niedrigerer Schwellenwert verringert den Precision-Wert, erhöht aber den Recall-Wert.
Sie können den Schwellenwert manuell anpassen, um die Auswirkungen auf Precision und Recall zu beobachten und den besten Kompromiss zwischen beiden Werten gemäß Ihren geschäftlichen Anforderungen zu ermitteln.
Wahrheitsmatrix
Eine Wahrheitsmatrix gibt den Prozentsatz der Beispiele jeder Klasse in einem Testsatz an, den das Modell korrekt vorhergesagt hat.
Die Wahrheitsmatrix zeigt, dass Ihr anfängliches Modell 100 % der Rückzahlungsbeispiele und 87 % der Standardbeispiele in Ihrem Testsatz richtig vorhersagen konnte, was nicht schlecht ist.
Sie können den Prozentsatz mit weiteren Beispielen (mehr Daten) erhöhen oder indem Sie neue Merkmale entwickeln, die Trainingsmethode ändern usw.
Featurewichtigkeit
In Vertex AI wird die Featurewichtigkeit in einem Balkendiagramm dargestellt, das veranschaulicht, wie jedes Feature sich auf die Vorhersage auswirkt. Je länger der Balken bzw. je größer der Zahlenwert eines Feature ist, desto wichtiger ist es.
Diese Featurewichtigkeitswerte können Ihnen helfen, Ihr Modell zu verbessern und mehr Vertrauen in seine Vorhersagen zu gewinnen. Es kann sinnvoll sein, beim nächsten Modelltraining die Features mit der geringsten Wichtigkeit zu entfernen oder zwei der wichtigeren Features zu einer Featureverknüpfung zu kombinieren und zu prüfen, ob das die Modellleistung verbessert.
Featurewichtigkeit ist nur ein Beispiel für die umfassenden Machine-Learning-Funktionen von Vertex AI, die als Explainable AI bezeichnet werden. Explainable AI umfasst eine Reihe von Tools und Frameworks, mit deren Hilfe Sie durch Ihre ML-Modelle generierte Vorhersagen verstehen und interpretieren können.
Aufgabe 4: Modell bereitstellen (nur Demonstration)
Nachdem Sie nun ein trainiertes Modell haben, ist der nächste Schritt, einen Endpunkt in Vertex AI zu erstellen. Einer Modellressource in Vertex AI können mehrere Endpunkte zugeordnet sein. Sie können den Traffic auch zwischen Endpunkten aufteilen.
Endpunkt erstellen und definieren
-
Klicken Sie auf der Modellseite auf Bereitstellen und Testen und anschließend auf Auf Endpunkt bereitstellen.
-
Geben Sie als Endpunktnamen die Bezeichnung LoanRisk ein.
-
Klicken Sie auf Weiter.
Modelleinstellungen und Monitoring
-
Belassen Sie die Einstellungen zur Aufteilung des Traffics wie sie sind.
-
Wählen Sie als Maschinentyp die Option e2-standard-8, 8 vCPUs, 32 GiB Arbeitsspeicher.
-
Klicken Sie unter Optionen für Erklärbarkeit auf Featureattribution.
-
Klicken Sie auf Fertig.
-
Klicken Sie auf Weiter.
-
Klicken Sie unter Modellmonitoring auf Weiter.
-
Wählen Sie unter Modellziele > Trainingsdatenquelle die Option Vertex AI-Dataset.
-
Wählen Sie Ihr Dataset aus dem Drop-down-Menü aus.
-
Geben Sie unter Zielspalte den Wert Standard ein.
-
Lassen Sie die übrigen Einstellungen unverändert und klicken Sie auf Bereitstellen.
Die Bereitstellung des Endpunkts dauert einige Minuten. Sobald sie abgeschlossen ist, wird ein grünes Häkchen neben dem Namen angezeigt.
Jetzt können Sie Vorhersagen von Ihrem bereitgestellten Modell abrufen.
Aufgabe 5: SML-Inhabertoken
Inhabertoken abrufen
Sie müssen Ihr Inhabertoken angeben, damit sich die Pipeline authentifizieren kann und autorisiert ist, den Endpunkt zum Abrufen der Vorhersagen aufzurufen.
-
Melden Sie sich bei gsp-auth-kjyo252taq-uc.a.run.app an.
-
Verwenden Sie dabei Ihre E-Mail-Adresse und Ihr Passwort als Kursteilnehmer.
-
Klicken Sie auf die Schaltfläche Kopieren. Dadurch wird ein langes Token in die Zwischenablage kopiert.
Aufgabe 6: Vorhersagen abrufen
In diesem Abschnitt verwenden Sie den Service Shared Machine Learning (SML), um mit einem vortrainierten Modell zu arbeiten.
UMGEBUNGSVARIABLE | WERT |
---|---|
AUTH_TOKEN | Verwenden Sie den Wert aus dem vorherigen Abschnitt |
ENDPOINT | https://sml-api-vertex-kjyo252taq-uc.a.run.app/vertex/predict/tabular_classification |
INPUT_DATA_FILE | INPUT-JSON |
Damit Sie das trainierte Modell verwenden können, müssen Sie einige Umgebungsvariablen erstellen.
-
Öffnen Sie ein Cloud Shell-Fenster.
-
Ersetzen Sie
INSERT_SML_BEARER_TOKEN
durch den Wert des Inhabertokens im vorherigen Abschnitt:
- Laden Sie die Lab-Assets herunter:
- Entpacken Sie die Lab-Assets:
- Erstellen Sie die Umgebungsvariable ENDPOINT:
- Erstellen Sie die Umgebungsvariable
INPUT_DATA_FILE
:
Die Datei INPUT-JSON
enthält folgende Werte:
Alter | ClientID | Einkommen | Kredit |
---|---|---|---|
40.77 | 997 | 44964.01 | 3944.22 |
-
Sie können den SML-Service durch Übergabe der in den Umgebungsvariablen angegebenen Parametern testen.
-
Senden Sie eine Anfrage an den SML-Service:
Diese Anfrage sollte eine Antwort ähnlich dieser ergeben:
- Bearbeiten Sie die Datei
INPUT-JSON
zum Testen eines neuen Szenarios:
Alter | ClientID | Einkommen | Kredit |
---|---|---|---|
30.00 | 998 | 50000.00 | 20000.00 |
-
Bearbeiten Sie die Datei
INPUT-JSON
und ersetzen Sie die ursprünglichen Werte. (Sie können einen Editor nach Wahl verwenden,vim
,nano
,emacs
oder den Cloud Shell Code-Editor) -
Sie können den SML-Service durch Übergabe der in den Umgebungsvariablen angegebenen Parametern testen.
-
Senden Sie eine Anfrage an den SML-Service:
In diesem Fall sagt das Modell bei einem Einkommen von 50.000, einem Alter von 30 Jahren und einem Kredit von 20.000 vorher, dass die Person den Kredit zurückzahlen wird.
Diese Anfrage sollte eine Antwort ähnlich dieser ergeben:
Wenn Sie die Google Cloud Console verwenden, sehen Sie im folgenden Bild, wie diese Aktion durchgeführt werden könnte:
Das wars! Sie haben das Lab erfolgreich abgeschlossen.
Sie können jetzt mit Vertex AI:
- Ein Dataset hochladen
- Ein Modell mit AutoML trainieren
- Die Modellleistung bewerten
- Das trainierte Modell auf einem Endpunkt bereitstellen
- Vorhersagen abrufen
Weitere Informationen zu den verschiedenen Bereichen von Vertex AI finden Sie in der Vertex AI-Dokumentation.
Lab beenden
Wenn Sie das Lab abgeschlossen haben, klicken Sie auf Lab beenden. Google Cloud Skills Boost entfernt daraufhin die von Ihnen genutzten Ressourcen und bereinigt das Konto.
Anschließend erhalten Sie die Möglichkeit, das Lab zu bewerten. Wählen Sie die entsprechende Anzahl von Sternen aus, schreiben Sie einen Kommentar und klicken Sie anschließend auf Senden.
Die Anzahl der Sterne hat folgende Bedeutung:
- 1 Stern = Sehr unzufrieden
- 2 Sterne = Unzufrieden
- 3 Sterne = Neutral
- 4 Sterne = Zufrieden
- 5 Sterne = Sehr zufrieden
Wenn Sie kein Feedback geben möchten, können Sie das Dialogfeld einfach schließen.
Verwenden Sie für Feedback, Vorschläge oder Korrekturen den Tab Support.
© 2021 Google LLC. Alle Rechte vorbehalten. Google und das Google-Logo sind Marken von Google LLC. Alle anderen Unternehmens- und Produktnamen können Marken der jeweils mit ihnen verbundenen Unternehmen sein.