arrow_back

Vertex AI: Kreditrisiken mit AutoML vorhersagen

Anmelden Teilnehmen
Quick tip: Review the prerequisites before you run the lab
Use an Incognito or private browser window to run this lab. This prevents any conflicts between your personal account and the student account, which may cause extra charges incurred to your personal account.
Testen und teilen Sie Ihr Wissen mit unserer Community.
done
Sie erhalten Zugriff auf über 700 praxisorientierte Labs, Skill-Logos und Kurse

Vertex AI: Kreditrisiken mit AutoML vorhersagen

Lab 1 Stunde universal_currency_alt 5 Guthabenpunkte show_chart Einsteiger
info Dieses Lab kann KI-Tools enthalten, die den Lernprozess unterstützen.
Testen und teilen Sie Ihr Wissen mit unserer Community.
done
Sie erhalten Zugriff auf über 700 praxisorientierte Labs, Skill-Logos und Kurse

Übersicht

In diesem Lab verwenden Sie Vertex AI, um ein Machine-Learning-Modell zur Vorhersage des Kreditrisikos anhand eines tabellarischen Datensatzes zu trainieren und einzusetzen.

Ziele

Nach Abschluss können Sie:

  • Ein Dataset in Vertex AI hochladen
  • Ein Machine-Learning-Modell mit AutoML trainieren
  • Die Modellleistung bewerten
  • Modell auf einem Endpunkt bereitstellen
  • Vorhersagen abrufen

Einrichtung

Vor dem Klick auf "Start Lab" (Lab starten)

Lesen Sie diese Anleitung. Labs sind zeitlich begrenzt und können nicht pausiert werden. Der Timer, der mit dem Klick auf "Start Lab" (Lab starten) gestartet wird, gibt an, wie lange die Ressourcen für das Lab verfügbar sind.

In diesem praxisorientierten Qwiklabs-Lab können Sie die Lab-Aktivitäten selbst in einer echten Cloud-Umgebung durchführen, nicht in einer Simulations- oder Demo-Umgebung. Dazu erhalten Sie neue, temporäre Anmeldedaten, mit denen Sie für die Dauer des Labs auf die Google Cloud Platform zugreifen können.

Voraussetzungen

Für dieses Lab benötigen Sie Folgendes:

  • Einen Standardbrowser (empfohlen wird Chrome)
  • Genügend Zeit, um das Lab abzuschließen

Hinweis: Auch wenn Sie bereits ein eigenes GCP-Konto oder -Projekt haben, sollten Sie es nicht für das Lab verwenden.

So starten Sie Ihr Lab und melden sich bei der Console an

  1. Klicken Sie auf Start Lab (Lab starten). Wenn Sie für das Lab bezahlen müssen, wird ein Pop-up-Fenster geöffnet, in dem Sie Ihre Zahlungsmethode auswählen können. Auf der linken Seite sehen Sie ein Feld, in dem Ihre temporären Anmeldedaten für dieses Lab angezeigt werden.

    Google Console öffnen

  2. Kopieren Sie den Nutzernamen und klicken Sie dann auf Open Google Console (Google Console öffnen). Das Lab aktiviert Ressourcen und öffnet dann einen weiteren Tab mit der Seite Choose an account (Konto auswählen).

    Tipp: Öffnen Sie die Tabs nebeneinander in separaten Fenstern.

  3. Klicken Sie auf der Seite "Choose an account" (Konto auswählen) auf Use Another Account (Anderes Konto verwenden).

    Konto auswählen

  4. Die Anmeldeseite wird geöffnet. Fügen Sie den Namen ein, den Sie aus dem Bereich "Connection Details" (Verbindungsdetails) kopiert haben. Kopieren Sie dann das Passwort und fügen Sie es ein.

    Wichtig: Sie müssen sich mit dem Nutzernamen und Passwort aus dem Bereich "Connection Details" (Verbindungsdetails) anmelden. Verwenden Sie nicht Ihre Qwiklabs-Anmeldedaten. Auch wenn Sie bereits ein eigenes GCP-Konto haben, sollten Sie es nicht für dieses Lab verwenden (so vermeiden Sie Gebühren).

  5. Klicken Sie sich durch die nachfolgenden Seiten:

    • Akzeptieren Sie die Nutzungsbedingungen.
    • Fügen Sie keine Wiederherstellungsoptionen oder Zwei-Faktor-Authentifizierung hinzu (da dies ein temporäres Konto ist).
    • Melden Sie sich nicht für kostenlose Tests an.

Nach wenigen Augenblicken wird die GCP Console in diesem Tab geöffnet.

Einführung in Vertex AI

In diesem Lab kommt Vertex AI zum Einsatz, die einheitliche KI-Plattform in Google Cloud. Damit werden Sie ein ML-Modell trainieren und bereitstellen. Mit Vertex AI haben Sie auf nur einer Plattform zwei Optionen zum Erstellen eines ML-Modells: eine Lösung ohne Code mit AutoML und eine codebasierte Lösung mit benutzerdefiniertem Training über Vertex Workbench. Hier verwenden Sie AutoML.

In diesem Lab erstellen Sie ein ML-Modell, um zu ermitteln, ob ein bestimmter Kunde seinen Kredit zurückzahlen wird.

Aufgabe 1: Trainingsdaten vorbereiten

Der Startbildschirm des Vertex AI-Dashboards veranschaulicht die wichtigsten Schritte zum Trainieren und Bereitstellen eines ML-Modells: Trainingsdaten vorbereiten, Modell trainieren und Vorhersagen abrufen. Später zeigt das Dashboard Ihre jüngsten Aktivitäten an, z. B. die letzten Datensätze, Modelle, Vorhersagen, Endpunkte und Notebook-Instanzen.

Dataset erstellen

  1. Klicken Sie in der Google Cloud Console im Navigationsmenü auf Vertex AI > Datasets.
  2. Klicken Sie auf Dataset erstellen.
  3. Nennen Sie das Dataset LoanRisk.
  4. Wählen Sie als Datentyp und Ziel die Option Tabelle und wählen Sie dann Regression/Klassifizierung.
  5. Klicken Sie auf Erstellen.

Daten hochladen

Es gibt drei Möglichkeiten, Daten in Vertex AI zu importieren:

  • CSV-Dateien von Ihrem Computer hochladen
  • CSV-Dateien aus Cloud Storage auswählen
  • Tabelle oder Ansicht aus BigQuery auswählen

Der Einfachheit halber wurde das Dataset schon in Cloud Storage hochgeladen.

  1. Wählen Sie für die Datenquelle die Option CSV-Dateien aus Cloud Storage auswählen aus.

  2. Geben Sie unter Importdateipfad Folgendes ein:

spls/cbl455/loan_risk.csv
  1. Klicken Sie auf Weiter.
Hinweis: Sie können diese Seite auch konfigurieren, indem Sie im Menü auf der linken Seite auf Datasets klicken und dann den Namen des Datasets auf der Seite „Datasets“ auswählen.

(Optional) Statistiken erstellen

  1. Klicken Sie auf Statistiken erstellen, um die beschreibenden Statistiken für jede Spalte Ihres Datasets anzuzeigen.
    Das Erstellen der Statistiken kann einige Minuten dauern, vor allem beim ersten Mal.

  2. Wenn die Statistiken fertig sind, können Sie durch Klicken auf die einzelnen Spaltennamen die analytischen Diagramme anzeigen.

Aufgabe 2: Modell trainieren

Nachdem Sie ein Dataset hochgeladen haben, können Sie ein Modell trainieren, um vorherzusagen, ob ein Kunde einen Kredit zurückzahlen wird.

  • Klicken Sie auf Neues Modell trainieren und wählen Sie Anderes.

Trainingsmethode

  1. Das Dataset hat schon den Namen LoanRisk.

  2. Wählen Sie als Ziel die Option Klassifizierung aus.

Sie wählen Klassifizierung statt Regression aus, weil Sie eine konkrete Zahl vorhersagen (ob ein Kunde einen Kredit zurückzahlen wird: 0 für Rückzahlung, 1 für Zahlungsausfall/Keine Rückzahlung) und nicht eine kontinuierliche Zahl.

  1. Klicken Sie auf Weiter.

Modelldetails

Geben Sie den Namen des Modells und die Zielspalte an.

  1. Geben Sie dem Modell einen Namen, beispielsweise LoanRisk.

  2. Wählen Sie für Zielspalte die Option Standard.

  3. (Optional) Unter Erweiterte Optionen können Sie festlegen, wie Trainings- und Testdaten zugewiesen werden, und Verschlüsselungsoptionen wählen.

  4. Klicken Sie auf Weiter.

  5. Klicken Sie auf Weiter, um Features hinzuzufügen.

Trainingsoptionen

Geben Sie an, welche Spalten Sie in das Trainingsmodell aufnehmen möchten. Zum Beispiel spielt die ClientID für die Vorhersage des Kreditrisikos wahrscheinlich keine Rolle.

  1. Klicken Sie auf das Minus in der Zeile ClientID, um diese aus dem Modelltraining auszuschließen.

  2. (Optional) Unter Erweiterte Optionen können Sie verschiedene Optimierungsziele auswählen.
    Weitere Informationen zu Optimierungszielen für tabellarische AutoML-Modelle finden Sie in der entsprechenden Anleitung.

  3. Klicken Sie auf Weiter.

Computing und Preise

  1. Der Wert unter Budget steht für die Knotenstunden für das Training. Geben Sie hier 1 ein.
    Das Training Ihres AutoML-Modells für eine Rechenstunde ist meist ein guter Ausgangspunkt, um festzustellen, ob es eine Beziehung zwischen den von Ihnen ausgewählten Features und Labels gibt. Ausgehend davon können Sie Features anpassen und das Modell für weitere Stunden trainieren, um die Modellleistung zu verbessern.

  2. Vorzeitiges Beenden sollte aktiviert bleiben.

  3. Klicken Sie auf Training starten.

Abhängig von der Datenmenge und der Trainingsmethode kann das Training zwischen einigen Minuten und einigen Stunden dauern. Normalerweise erhalten Sie eine E-Mail von Google Cloud, wenn das Training abgeschlossen ist. In der Qwiklabs-Umgebung geschieht das jedoch nicht.

Hinweis: Um die typische Wartezeit von einer Stunde beim Modelltraining zu vermeiden, laden Sie in Aufgabe 5 ein vortrainiertes Modell herunter. Dieses Modell ist das Ergebnis von Aufgabe 1 und 2. Aufgaben 3 und 4 dienen nur zu Demonstrationszwecken und sind relevant, wenn Sie das Modell selbst trainieren.

Aufgabe 3: Modellleistung bewerten (nur Demonstration)

Vertex AI bietet zahlreiche Messwerte zur Bewertung der Modellleistung. Wir konzentrieren uns auf drei davon:

  • Precision-/Recall-Kurve
  • Wahrheitsmatrix
  • Featurewichtigkeit
Hinweis: Bei einem trainierten Modell können Sie den Tab Model Registry in Vertex AI aufrufen.

1. Öffnen Sie Model Registry.

2. Klicken Sie auf das Modell, das Sie gerade trainiert haben.

3. Rufen Sie den Tab Bewerten auf.

In dieser Übung können Sie diesen Schritt überspringen, da Sie ein vortrainiertes Modell verwenden.

Precision-/Recall-Kurve

Schieberegler für den Konfidenzschwellenwert ist auf 0,5 gesetzt und Diagramme für Precision-/Recall-Kurve, ROC-Kurve und Precision-Recall werden nach Schwellenwert angezeigt

Der Konfidenzschwellenwert bestimmt, wie ein ML-Modell die positiven Fälle zählt. Ein höherer Schwellenwert erhöht den Precision-Wert, verringert aber den Recall-Wert. Ein niedrigerer Schwellenwert verringert den Precision-Wert, erhöht aber den Recall-Wert.

Sie können den Schwellenwert manuell anpassen, um die Auswirkungen auf Precision und Recall zu beobachten und den besten Kompromiss zwischen beiden Werten gemäß Ihren geschäftlichen Anforderungen zu ermitteln.

Wahrheitsmatrix

Eine Wahrheitsmatrix gibt den Prozentsatz der Beispiele jeder Klasse in einem Testsatz an, den das Modell korrekt vorhergesagt hat.

Wahrheitsmatrix-Tabelle mit der Klassifizierung des richtigen und des vorhergesagten Labels

Die Wahrheitsmatrix zeigt, dass Ihr anfängliches Modell 100 % der Rückzahlungsbeispiele und 87 % der Standardbeispiele in Ihrem Testsatz richtig vorhersagen konnte, was nicht schlecht ist.

Sie können den Prozentsatz mit weiteren Beispielen (mehr Daten) erhöhen oder indem Sie neue Merkmale entwickeln, die Trainingsmethode ändern usw.

Featurewichtigkeit

In Vertex AI wird die Featurewichtigkeit in einem Balkendiagramm dargestellt, das veranschaulicht, wie jedes Feature sich auf die Vorhersage auswirkt. Je länger der Balken bzw. je größer der Zahlenwert eines Feature ist, desto wichtiger ist es.

Featurewichtigkeit als Balkendiagramm für Kredit, Einkommen und Alter

Diese Featurewichtigkeitswerte können Ihnen helfen, Ihr Modell zu verbessern und mehr Vertrauen in seine Vorhersagen zu gewinnen. Es kann sinnvoll sein, beim nächsten Modelltraining die Features mit der geringsten Wichtigkeit zu entfernen oder zwei der wichtigeren Features zu einer Featureverknüpfung zu kombinieren und zu prüfen, ob das die Modellleistung verbessert.

Featurewichtigkeit ist nur ein Beispiel für die umfassenden Machine-Learning-Funktionen von Vertex AI, die als Explainable AI bezeichnet werden. Explainable AI umfasst eine Reihe von Tools und Frameworks, mit deren Hilfe Sie durch Ihre ML-Modelle generierte Vorhersagen verstehen und interpretieren können.

Aufgabe 4: Modell bereitstellen (nur Demonstration)

Hinweis: Sie werden das Modell nicht an einem Endpunkt bereitstellen, da das Modelltraining eine Stunde dauern kann. Hier sehen Sie die Schritte, die Sie in einer Produktionsumgebung ausführen würden.

Nachdem Sie nun ein trainiertes Modell haben, ist der nächste Schritt, einen Endpunkt in Vertex AI zu erstellen. Einer Modellressource in Vertex AI können mehrere Endpunkte zugeordnet sein. Sie können den Traffic auch zwischen Endpunkten aufteilen.

Endpunkt erstellen und definieren

  1. Klicken Sie auf der Modellseite auf Bereitstellen und Testen und anschließend auf Auf Endpunkt bereitstellen.

  2. Geben Sie als Endpunktnamen die Bezeichnung LoanRisk ein.

  3. Klicken Sie auf Weiter.

Modelleinstellungen und Monitoring

  1. Belassen Sie die Einstellungen zur Aufteilung des Traffics wie sie sind.

  2. Wählen Sie als Maschinentyp die Option e2-standard-8, 8 vCPUs, 32 GiB Arbeitsspeicher.

  3. Klicken Sie unter Optionen für Erklärbarkeit auf Featureattribution.

  4. Klicken Sie auf Fertig.

  5. Klicken Sie auf Weiter.

  6. Klicken Sie unter Modellmonitoring auf Weiter.

  7. Wählen Sie unter Modellziele > Trainingsdatenquelle die Option Vertex AI-Dataset.

  8. Wählen Sie Ihr Dataset aus dem Drop-down-Menü aus.

  9. Geben Sie unter Zielspalte den Wert Standard ein.

  10. Lassen Sie die übrigen Einstellungen unverändert und klicken Sie auf Bereitstellen.

Die Bereitstellung des Endpunkts dauert einige Minuten. Sobald sie abgeschlossen ist, wird ein grünes Häkchen neben dem Namen angezeigt.

Jetzt können Sie Vorhersagen von Ihrem bereitgestellten Modell abrufen.

Aufgabe 5: Vorhersagen abrufen

In diesem Abschnitt verwenden Sie das AutoML-Gateway, um mit einem vortrainierten Modell zu arbeiten.

UMGEBUNGSVARIABLE WERT
Credit_Risk ENDPUNKT 1411183591831896064
INPUT_DATA_FILE INPUT-JSON

Damit Sie das trainierte Modell verwenden können, müssen Sie einige Umgebungsvariablen erstellen.

  1. Öffnen Sie ein Cloud Shell-Fenster.

  2. Laden Sie die Lab-Assets herunter:

gcloud storage cp gs://cloud-training/CBL455/INPUT-JSON .
  1. Erstellen Sie die Umgebungsvariable INPUT_DATA_FILE:
export INPUT_DATA_FILE="INPUT-JSON"
  1. Erstellen Sie die Umgebungsvariable PROJECT_NUMBER:
export PROJECT_NUMBER=$(gcloud projects describe $(gcloud config get-value project) --format="value(projectNumber)")
  1. Erstellen Sie die Umgebungsvariable AUTOML_SERVICE:
export AUTOML_SERVICE="https://automl-proxy-$PROJECT_NUMBER.us-central1.run.app/v1" Hinweis: Nehmen Sie sich nach dem Entpacken der Lab-Assets einen Moment Zeit, um den Inhalt zu überprüfen.

Die Datei INPUT-JSON wird verwendet, um Vertex AI mit den erforderlichen Modelldaten zu versorgen. Ändern Sie diese Datei, um eigene Vorhersagen zu erstellen.

Die Datei INPUT-JSON enthält folgende Werte:

{ "instances": [ { "age": 40.77430558, "ClientID": "997", "income": 44964.0106, "loan": 3944.219318 } ] }
  1. Geben Sie den folgenden Befehl ein, um eine Vorhersage anzufordern:
curl -X POST -H "Content-Type: application/json" $AUTOML_SERVICE -d "@${INPUT_DATA_FILE}" -s | jq

Erwartete Ausgabe:

{ "predictions": [ { "scores": [ 0.9999980926513672, 0.000001897001311590429 ], "classes": [ "0", "1" ] } ], "deployedModelId": "3093594712003575808", "model": "projects/1030115194620/locations/us-central1/models/4831874217005809664", "modelDisplayName": "credit_risk_20211119212817", "modelVersionId": "1" }

Wenn Sie die Google Cloud Console verwenden, sehen Sie im folgenden Bild, wie diese Aktion durchgeführt werden könnte:

Vorhersageschritte sind in den entsprechenden Abschnitten hervorgehoben

Das wars! Sie haben das Lab erfolgreich abgeschlossen.

Sie können jetzt mit Vertex AI:

  • Ein Dataset hochladen
  • Ein Modell mit AutoML trainieren
  • Die Modellleistung bewerten
  • Das trainierte Modell auf einem Endpunkt bereitstellen
  • Vorhersagen abrufen

Weitere Informationen zu den verschiedenen Bereichen von Vertex AI finden Sie in der Vertex AI-Dokumentation.

Lab beenden

Wenn Sie das Lab abgeschlossen haben, klicken Sie auf Lab beenden. Google Cloud Skills Boost entfernt daraufhin die von Ihnen genutzten Ressourcen und bereinigt das Konto.

Anschließend erhalten Sie die Möglichkeit, das Lab zu bewerten. Wählen Sie die entsprechende Anzahl von Sternen aus, schreiben Sie einen Kommentar und klicken Sie anschließend auf Senden.

Die Anzahl der Sterne hat folgende Bedeutung:

  • 1 Stern = Sehr unzufrieden
  • 2 Sterne = Unzufrieden
  • 3 Sterne = Neutral
  • 4 Sterne = Zufrieden
  • 5 Sterne = Sehr zufrieden

Wenn Sie kein Feedback geben möchten, können Sie das Dialogfeld einfach schließen.

Verwenden Sie für Feedback, Vorschläge oder Korrekturen den Tab Support.

© 2021 Google LLC. Alle Rechte vorbehalten. Google und das Google-Logo sind Marken von Google LLC. Alle anderen Unternehmens- und Produktnamen können Marken der jeweils mit ihnen verbundenen Unternehmen sein.

Before you begin

  1. Labs create a Google Cloud project and resources for a fixed time
  2. Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
  3. On the top left of your screen, click Start lab to begin

Use private browsing

  1. Copy the provided Username and Password for the lab
  2. Click Open console in private mode

Sign in to the Console

  1. Sign in using your lab credentials. Using other credentials might cause errors or incur charges.
  2. Accept the terms, and skip the recovery resource page
  3. Don't click End lab unless you've finished the lab or want to restart it, as it will clear your work and remove the project

Diese Inhalte sind derzeit nicht verfügbar

Bei Verfügbarkeit des Labs benachrichtigen wir Sie per E-Mail

Sehr gut!

Bei Verfügbarkeit kontaktieren wir Sie per E-Mail

One lab at a time

Confirm to end all existing labs and start this one

Setup your console before you begin

Use an Incognito or private browser window to run this lab. This prevents any conflicts between your personal account and the Student account, which may cause extra charges incurred to your personal account.