arrow_back

Vertex AI: Kreditrisiken mit AutoML vorhersagen

Anmelden Teilnehmen
Testen und teilen Sie Ihr Wissen mit unserer Community.
done
Sie erhalten Zugriff auf über 700 praxisorientierte Labs, Skill-Logos und Kurse

Vertex AI: Kreditrisiken mit AutoML vorhersagen

Lab 2 Stunden 30 Minuten universal_currency_alt 5 Guthabenpunkte show_chart Einsteiger
info Dieses Lab kann KI-Tools enthalten, die den Lernprozess unterstützen.
Testen und teilen Sie Ihr Wissen mit unserer Community.
done
Sie erhalten Zugriff auf über 700 praxisorientierte Labs, Skill-Logos und Kurse

Übersicht

In diesem Lab verwenden Sie Vertex AI, um ein Machine-Learning-Modell zur Vorhersage des Kreditrisikos anhand eines tabellarischen Datensatzes zu trainieren und einzusetzen.

Ziele

Nach Abschluss können Sie:

  • Ein Dataset in Vertex AI hochladen
  • Ein Machine-Learning-Modell mit AutoML trainieren
  • Die Modellleistung bewerten
  • Modell auf einem Endpunkt bereitstellen
  • Vorhersagen abrufen

Einrichtung

Vor dem Klick auf "Start Lab" (Lab starten)

Lesen Sie diese Anleitung. Labs sind zeitlich begrenzt und können nicht pausiert werden. Der Timer, der mit dem Klick auf "Start Lab" (Lab starten) gestartet wird, gibt an, wie lange die Ressourcen für das Lab verfügbar sind.

In diesem praxisorientierten Qwiklabs-Lab können Sie die Lab-Aktivitäten selbst in einer echten Cloud-Umgebung durchführen, nicht in einer Simulations- oder Demo-Umgebung. Dazu erhalten Sie neue, temporäre Anmeldedaten, mit denen Sie für die Dauer des Labs auf die Google Cloud Platform zugreifen können.

Voraussetzungen

Für dieses Lab benötigen Sie Folgendes:

  • Einen Standardbrowser (empfohlen wird Chrome)
  • Genügend Zeit, um das Lab abzuschließen

Hinweis: Auch wenn Sie bereits ein eigenes GCP-Konto oder -Projekt haben, sollten Sie es nicht für das Lab verwenden.

So starten Sie Ihr Lab und melden sich bei der Console an

  1. Klicken Sie auf Start Lab (Lab starten). Wenn Sie für das Lab bezahlen müssen, wird ein Pop-up-Fenster geöffnet, in dem Sie Ihre Zahlungsmethode auswählen können. Auf der linken Seite sehen Sie ein Feld, in dem Ihre temporären Anmeldedaten für dieses Lab angezeigt werden.

    Google Console öffnen

  2. Kopieren Sie den Nutzernamen und klicken Sie dann auf Open Google Console (Google Console öffnen). Das Lab aktiviert Ressourcen und öffnet dann einen weiteren Tab mit der Seite Choose an account (Konto auswählen).

    Tipp: Öffnen Sie die Tabs nebeneinander in separaten Fenstern.

  3. Klicken Sie auf der Seite "Choose an account" (Konto auswählen) auf Use Another Account (Anderes Konto verwenden).

    Konto auswählen

  4. Die Anmeldeseite wird geöffnet. Fügen Sie den Namen ein, den Sie aus dem Bereich "Connection Details" (Verbindungsdetails) kopiert haben. Kopieren Sie dann das Passwort und fügen Sie es ein.

    Wichtig: Sie müssen sich mit dem Nutzernamen und Passwort aus dem Bereich "Connection Details" (Verbindungsdetails) anmelden. Verwenden Sie nicht Ihre Qwiklabs-Anmeldedaten. Auch wenn Sie bereits ein eigenes GCP-Konto haben, sollten Sie es nicht für dieses Lab verwenden (so vermeiden Sie Gebühren).

  5. Klicken Sie sich durch die nachfolgenden Seiten:

    • Akzeptieren Sie die Nutzungsbedingungen.
    • Fügen Sie keine Wiederherstellungsoptionen oder Zwei-Faktor-Authentifizierung hinzu (da dies ein temporäres Konto ist).
    • Melden Sie sich nicht für kostenlose Tests an.

Nach wenigen Augenblicken wird die GCP Console in diesem Tab geöffnet.

Einführung in Vertex AI

In diesem Lab kommt Vertex AI zum Einsatz, die einheitliche KI-Plattform in Google Cloud. Damit werden Sie ein ML-Modell trainieren und bereitstellen. Mit Vertex AI haben Sie auf nur einer Plattform zwei Optionen zum Erstellen eines ML-Modells: eine Lösung ohne Code mit AutoML und eine codebasierte Lösung mit benutzerdefiniertem Training über Vertex Workbench. Hier verwenden Sie AutoML.

In diesem Lab erstellen Sie ein ML-Modell, um zu ermitteln, ob ein bestimmter Kunde seinen Kredit zurückzahlen wird.

Aufgabe 1: Trainingsdaten vorbereiten

Der Startbildschirm des Vertex AI-Dashboards veranschaulicht die wichtigsten Schritte zum Trainieren und Bereitstellen eines ML-Modells: Trainingsdaten vorbereiten, Modell trainieren und Vorhersagen abrufen. Später zeigt das Dashboard Ihre jüngsten Aktivitäten an, z. B. die letzten Datensätze, Modelle, Vorhersagen, Endpunkte und Notebook-Instanzen.

Dataset erstellen

  1. Klicken Sie in der Google Cloud Console im Navigationsmenü auf Vertex AI > Datasets.
  2. Klicken Sie auf Dataset erstellen.
  3. Nennen Sie das Dataset LoanRisk.
  4. Wählen Sie als Datentyp und Ziel die Option Tabelle und wählen Sie dann Regression/Klassifizierung.
  5. Klicken Sie auf Erstellen.

Daten hochladen

Es gibt drei Möglichkeiten, Daten in Vertex AI zu importieren:

  • CSV-Dateien von Ihrem Computer hochladen
  • CSV-Dateien aus Cloud Storage auswählen
  • Tabelle oder Ansicht aus BigQuery auswählen

Der Einfachheit halber wurde das Dataset schon in Cloud Storage hochgeladen.

  1. Wählen Sie für die Datenquelle die Option CSV-Dateien aus Cloud Storage auswählen aus.

  2. Geben Sie unter Importdateipfad Folgendes ein:

spls/cbl455/loan_risk.csv
  1. Klicken Sie auf Weiter.
Hinweis: Sie können diese Seite auch konfigurieren, indem Sie im Menü auf der linken Seite auf Datasets klicken und dann den Namen des Datasets auf der Seite „Datasets“ auswählen.

(Optional) Statistiken erstellen

  1. Klicken Sie auf Statistiken erstellen, um die beschreibenden Statistiken für jede Spalte Ihres Datasets anzuzeigen.
    Das Erstellen der Statistiken kann einige Minuten dauern, vor allem beim ersten Mal.

  2. Wenn die Statistiken fertig sind, können Sie durch Klicken auf die einzelnen Spaltennamen die analytischen Diagramme anzeigen.

Aufgabe 2: Modell trainieren

Nachdem Sie ein Dataset hochgeladen haben, können Sie ein Modell trainieren, um vorherzusagen, ob ein Kunde einen Kredit zurückzahlen wird.

  • Klicken Sie auf Neues Modell trainieren und wählen Sie Anderes.

Trainingsmethode

  1. Das Dataset hat schon den Namen LoanRisk.

  2. Wählen Sie als Ziel die Option Klassifizierung aus.

Sie wählen Klassifizierung statt Regression aus, weil Sie eine konkrete Zahl vorhersagen (ob ein Kunde einen Kredit zurückzahlen wird: 0 für Rückzahlung, 1 für Zahlungsausfall/Keine Rückzahlung) und nicht eine kontinuierliche Zahl.

  1. Klicken Sie auf Weiter.

Modelldetails

Geben Sie den Namen des Modells und die Zielspalte an.

  1. Geben Sie dem Modell einen Namen, beispielsweise LoanRisk.

  2. Wählen Sie für Zielspalte die Option Standard.

  3. (Optional) Unter Erweiterte Optionen können Sie festlegen, wie Trainings- und Testdaten zugewiesen werden, und Verschlüsselungsoptionen wählen.

  4. Klicken Sie auf Weiter.

  5. Klicken Sie auf Weiter, um Features hinzuzufügen.

Trainingsoptionen

Geben Sie an, welche Spalten Sie in das Trainingsmodell aufnehmen möchten. Zum Beispiel spielt die ClientID für die Vorhersage des Kreditrisikos wahrscheinlich keine Rolle.

  1. Klicken Sie auf das Minus in der Zeile ClientID, um diese aus dem Modelltraining auszuschließen.

  2. (Optional) Unter Erweiterte Optionen können Sie verschiedene Optimierungsziele auswählen.
    Weitere Informationen zu Optimierungszielen für tabellarische AutoML-Modelle finden Sie in der entsprechenden Anleitung.

  3. Klicken Sie auf Weiter.

Computing und Preise

  1. Der Wert unter Budget steht für die Knotenstunden für das Training. Geben Sie hier 1 ein.
    Das Training Ihres AutoML-Modells für eine Rechenstunde ist meist ein guter Ausgangspunkt, um festzustellen, ob es eine Beziehung zwischen den von Ihnen ausgewählten Features und Labels gibt. Ausgehend davon können Sie Features anpassen und das Modell für weitere Stunden trainieren, um die Modellleistung zu verbessern.

  2. Vorzeitiges Beenden sollte aktiviert bleiben.

  3. Klicken Sie auf Training starten.

Abhängig von der Datenmenge und der Trainingsmethode kann das Training zwischen einigen Minuten und einigen Stunden dauern. Normalerweise erhalten Sie eine E-Mail von Google Cloud, wenn das Training abgeschlossen ist. In der Qwiklabs-Umgebung geschieht das jedoch nicht.

Um nicht das gesamte Modelltraining abwarten zu müssen, laden Sie in Aufgabe 5 ein vortrainiertes Modell herunter, für welches Sie in Aufgabe 6 Vorhersagen abrufen. Dieses vortrainierte Modell wurde mit denselben Schritten trainiert, die Sie in Aufgabe 1 und Aufgabe 2 ausgeführt haben.

Aufgabe 3: Modellleistung bewerten (nur Demonstration)

Vertex AI bietet zahlreiche Messwerte zur Bewertung der Modellleistung. Wir konzentrieren uns auf drei davon:

  • Precision-/Recall-Kurve
  • Wahrheitsmatrix
  • Featurewichtigkeit
Hinweis: Bei einem trainierten Modell können Sie den Tab Model Registry in Vertex AI aufrufen.

1. Öffnen Sie Model Registry.

2. Klicken Sie auf das Modell, das Sie gerade trainiert haben.

3. Rufen Sie den Tab Bewerten auf.

In dieser Übung können Sie diesen Schritt überspringen, da Sie ein vortrainiertes Modell verwenden.

Precision-/Recall-Kurve

Schieberegler für den Konfidenzschwellenwert ist auf 0,5 gesetzt und Diagramme für Precision-/Recall-Kurve, ROC-Kurve und Precision-Recall werden nach Schwellenwert angezeigt

Der Konfidenzschwellenwert bestimmt, wie ein ML-Modell die positiven Fälle zählt. Ein höherer Schwellenwert erhöht den Precision-Wert, verringert aber den Recall-Wert. Ein niedrigerer Schwellenwert verringert den Precision-Wert, erhöht aber den Recall-Wert.

Sie können den Schwellenwert manuell anpassen, um die Auswirkungen auf Precision und Recall zu beobachten und den besten Kompromiss zwischen beiden Werten gemäß Ihren geschäftlichen Anforderungen zu ermitteln.

Wahrheitsmatrix

Eine Wahrheitsmatrix gibt den Prozentsatz der Beispiele jeder Klasse in einem Testsatz an, den das Modell korrekt vorhergesagt hat.

Wahrheitsmatrix-Tabelle mit der Klassifizierung des richtigen und des vorhergesagten Labels

Die Wahrheitsmatrix zeigt, dass Ihr anfängliches Modell 100 % der Rückzahlungsbeispiele und 87 % der Standardbeispiele in Ihrem Testsatz richtig vorhersagen konnte, was nicht schlecht ist.

Sie können den Prozentsatz mit weiteren Beispielen (mehr Daten) erhöhen oder indem Sie neue Merkmale entwickeln, die Trainingsmethode ändern usw.

Featurewichtigkeit

In Vertex AI wird die Featurewichtigkeit in einem Balkendiagramm dargestellt, das veranschaulicht, wie jedes Feature sich auf die Vorhersage auswirkt. Je länger der Balken bzw. je größer der Zahlenwert eines Feature ist, desto wichtiger ist es.

Featurewichtigkeit als Balkendiagramm für Kredit, Einkommen und Alter

Diese Featurewichtigkeitswerte können Ihnen helfen, Ihr Modell zu verbessern und mehr Vertrauen in seine Vorhersagen zu gewinnen. Es kann sinnvoll sein, beim nächsten Modelltraining die Features mit der geringsten Wichtigkeit zu entfernen oder zwei der wichtigeren Features zu einer Featureverknüpfung zu kombinieren und zu prüfen, ob das die Modellleistung verbessert.

Featurewichtigkeit ist nur ein Beispiel für die umfassenden Machine-Learning-Funktionen von Vertex AI, die als Explainable AI bezeichnet werden. Explainable AI umfasst eine Reihe von Tools und Frameworks, mit deren Hilfe Sie durch Ihre ML-Modelle generierte Vorhersagen verstehen und interpretieren können.

Aufgabe 4: Modell bereitstellen (nur Demonstration)

Hinweis: Sie werden das Modell nicht an einem Endpunkt bereitstellen, da das Modelltraining eine Stunde dauern kann. Hier sehen Sie die Schritte, die Sie in einer Produktionsumgebung ausführen würden.

Nachdem Sie nun ein trainiertes Modell haben, ist der nächste Schritt, einen Endpunkt in Vertex AI zu erstellen. Einer Modellressource in Vertex AI können mehrere Endpunkte zugeordnet sein. Sie können den Traffic auch zwischen Endpunkten aufteilen.

Endpunkt erstellen und definieren

  1. Klicken Sie auf der Modellseite auf Bereitstellen und Testen und anschließend auf Auf Endpunkt bereitstellen.

  2. Geben Sie als Endpunktnamen die Bezeichnung LoanRisk ein.

  3. Klicken Sie auf Weiter.

Modelleinstellungen und Monitoring

  1. Belassen Sie die Einstellungen zur Aufteilung des Traffics wie sie sind.

  2. Wählen Sie als Maschinentyp die Option e2-standard-8, 8 vCPUs, 32 GiB Arbeitsspeicher.

  3. Klicken Sie unter Optionen für Erklärbarkeit auf Featureattribution.

  4. Klicken Sie auf Fertig.

  5. Klicken Sie auf Weiter.

  6. Klicken Sie unter Modellmonitoring auf Weiter.

  7. Wählen Sie unter Modellziele > Trainingsdatenquelle die Option Vertex AI-Dataset.

  8. Wählen Sie Ihr Dataset aus dem Drop-down-Menü aus.

  9. Geben Sie unter Zielspalte den Wert Standard ein.

  10. Lassen Sie die übrigen Einstellungen unverändert und klicken Sie auf Bereitstellen.

Die Bereitstellung des Endpunkts dauert einige Minuten. Sobald sie abgeschlossen ist, wird ein grünes Häkchen neben dem Namen angezeigt.

Jetzt können Sie Vorhersagen von Ihrem bereitgestellten Modell abrufen.

Aufgabe 5: SML-Inhabertoken

Inhabertoken abrufen

Sie müssen Ihr Inhabertoken angeben, damit sich die Pipeline authentifizieren kann und autorisiert ist, den Endpunkt zum Abrufen der Vorhersagen aufzurufen.

Hinweis: Folgen Sie den Schritten unten, um das Token zu erhalten. Wenn dabei Probleme auftreten, kann das an den Cookie-Einstellungen im Inkognitofenster liegen. Sollte das der Fall sein, verlassen Sie den Inkognitomodus.
  1. Melden Sie sich bei gsp-auth-kjyo252taq-uc.a.run.app an.

  2. Verwenden Sie dabei Ihre E-Mail-Adresse und Ihr Passwort als Kursteilnehmer.

  3. Klicken Sie auf die Schaltfläche Kopieren. Dadurch wird ein langes Token in die Zwischenablage kopiert.

Anmeldeseite für Inhaber mit langem Token

Wichtig: Dieses Token ist nur etwa 60 Sekunden lang verfügbar. Kopieren Sie es und fahren Sie fort. Wichtig: Falls beim Abrufen des Inhabertokens Probleme auftreten, kann das an den Cookie-Einstellungen im Inkognitofenster liegen. Wir empfehlen Ihnen in so einem Fall, den Inkognitomodus zu verlassen.

Aufgabe 6: Vorhersagen abrufen

In diesem Abschnitt verwenden Sie den Service Shared Machine Learning (SML), um mit einem vortrainierten Modell zu arbeiten.

UMGEBUNGSVARIABLE WERT
AUTH_TOKEN Verwenden Sie den Wert aus dem vorherigen Abschnitt
ENDPOINT https://sml-api-vertex-kjyo252taq-uc.a.run.app/vertex/predict/tabular_classification
INPUT_DATA_FILE INPUT-JSON

Damit Sie das trainierte Modell verwenden können, müssen Sie einige Umgebungsvariablen erstellen.

  1. Öffnen Sie ein Cloud Shell-Fenster.

  2. Ersetzen Sie INSERT_SML_BEARER_TOKEN durch den Wert des Inhabertokens im vorherigen Abschnitt:

export AUTH_TOKEN="INSERT_SML_BEARER_TOKEN"
  1. Laden Sie die Lab-Assets herunter:
gcloud storage cp gs://spls/cbl455/cbl455.tar.gz .
  1. Entpacken Sie die Lab-Assets:
tar -xvf cbl455.tar.gz
  1. Erstellen Sie die Umgebungsvariable ENDPOINT:
export ENDPOINT="https://sml-api-vertex-kjyo252taq-uc.a.run.app/vertex/predict/tabular_classification"
  1. Erstellen Sie die Umgebungsvariable INPUT_DATA_FILE:
export INPUT_DATA_FILE="INPUT-JSON" Hinweis: Nehmen Sie sich nach dem Entpacken der Lab-Assets einen Moment Zeit, um den Inhalt zu überprüfen.

Die Datei INPUT-JSON wird verwendet, um Vertex AI mit den erforderlichen Modelldaten zu versorgen. Ändern Sie diese Datei, um eigene Vorhersagen zu erstellen.

Die App smlproxy wird zur Kommunikation mit dem Backend verwendet.

Die Datei INPUT-JSON enthält folgende Werte:

Alter ClientID Einkommen Kredit
40.77 997 44964.01 3944.22
  1. Sie können den SML-Service durch Übergabe der in den Umgebungsvariablen angegebenen Parametern testen.

  2. Senden Sie eine Anfrage an den SML-Service:

./smlproxy tabular \ -a $AUTH_TOKEN \ -e $ENDPOINT \ -d $INPUT_DATA_FILE

Diese Anfrage sollte eine Antwort ähnlich dieser ergeben:

SML Tabular HTTP Response: 2022/01/10 15:04:45 {"model_class":"0","model_score":0.9999981}
  1. Bearbeiten Sie die Datei INPUT-JSON zum Testen eines neuen Szenarios:
Alter ClientID Einkommen Kredit
30.00 998 50000.00 20000.00
  1. Bearbeiten Sie die Datei INPUT-JSON und ersetzen Sie die ursprünglichen Werte. (Sie können einen Editor nach Wahl verwenden, vim, nano, emacs oder den Cloud Shell Code-Editor)

  2. Sie können den SML-Service durch Übergabe der in den Umgebungsvariablen angegebenen Parametern testen.

  3. Senden Sie eine Anfrage an den SML-Service:

./smlproxy tabular \ -a $AUTH_TOKEN \ -e $ENDPOINT \ -d $INPUT_DATA_FILE

In diesem Fall sagt das Modell bei einem Einkommen von 50.000, einem Alter von 30 Jahren und einem Kredit von 20.000 vorher, dass die Person den Kredit zurückzahlen wird.

Diese Anfrage sollte eine Antwort ähnlich dieser ergeben:

SML Tabular HTTP Response: 2022/01/10 15:04:45 {"model_class":"0","model_score":1.0322887E-5}

Wenn Sie die Google Cloud Console verwenden, sehen Sie im folgenden Bild, wie diese Aktion durchgeführt werden könnte:

Vorhersageschritte sind in den entsprechenden Abschnitten hervorgehoben

Das wars! Sie haben das Lab erfolgreich abgeschlossen.

Sie können jetzt mit Vertex AI:

  • Ein Dataset hochladen
  • Ein Modell mit AutoML trainieren
  • Die Modellleistung bewerten
  • Das trainierte Modell auf einem Endpunkt bereitstellen
  • Vorhersagen abrufen

Weitere Informationen zu den verschiedenen Bereichen von Vertex AI finden Sie in der Vertex AI-Dokumentation.

Lab beenden

Wenn Sie das Lab abgeschlossen haben, klicken Sie auf Lab beenden. Google Cloud Skills Boost entfernt daraufhin die von Ihnen genutzten Ressourcen und bereinigt das Konto.

Anschließend erhalten Sie die Möglichkeit, das Lab zu bewerten. Wählen Sie die entsprechende Anzahl von Sternen aus, schreiben Sie einen Kommentar und klicken Sie anschließend auf Senden.

Die Anzahl der Sterne hat folgende Bedeutung:

  • 1 Stern = Sehr unzufrieden
  • 2 Sterne = Unzufrieden
  • 3 Sterne = Neutral
  • 4 Sterne = Zufrieden
  • 5 Sterne = Sehr zufrieden

Wenn Sie kein Feedback geben möchten, können Sie das Dialogfeld einfach schließen.

Verwenden Sie für Feedback, Vorschläge oder Korrekturen den Tab Support.

© 2021 Google LLC. Alle Rechte vorbehalten. Google und das Google-Logo sind Marken von Google LLC. Alle anderen Unternehmens- und Produktnamen können Marken der jeweils mit ihnen verbundenen Unternehmen sein.

Diese Inhalte sind derzeit nicht verfügbar

Bei Verfügbarkeit des Labs benachrichtigen wir Sie per E-Mail

Sehr gut!

Bei Verfügbarkeit kontaktieren wir Sie per E-Mail