In diesem Lab verwenden Sie Vertex AI, um ein Machine-Learning-Modell zur Vorhersage des Kreditrisikos anhand eines tabellarischen Datensatzes zu trainieren und einzusetzen.
Ziele
Nach Abschluss können Sie:
Ein Dataset in Vertex AI hochladen
Ein Machine-Learning-Modell mit AutoML trainieren
Die Modellleistung bewerten
Modell auf einem Endpunkt bereitstellen
Vorhersagen abrufen
Einrichtung
Vor dem Klick auf "Start Lab" (Lab starten)
Lesen Sie diese Anleitung. Labs sind zeitlich begrenzt und können nicht pausiert werden. Der Timer, der mit dem Klick auf "Start Lab" (Lab starten) gestartet wird, gibt an, wie lange die Ressourcen für das Lab verfügbar sind.
In diesem praxisorientierten Qwiklabs-Lab können Sie die Lab-Aktivitäten selbst in einer echten Cloud-Umgebung durchführen, nicht in einer Simulations- oder Demo-Umgebung. Dazu erhalten Sie neue, temporäre Anmeldedaten, mit denen Sie für die Dauer des Labs auf die Google Cloud Platform zugreifen können.
Voraussetzungen
Für dieses Lab benötigen Sie Folgendes:
Einen Standardbrowser (empfohlen wird Chrome)
Genügend Zeit, um das Lab abzuschließen
Hinweis: Auch wenn Sie bereits ein eigenes GCP-Konto oder -Projekt haben, sollten Sie es nicht für das Lab verwenden.
So starten Sie Ihr Lab und melden sich bei der Console an
Klicken Sie auf Start Lab (Lab starten). Wenn Sie für das Lab bezahlen müssen, wird ein Pop-up-Fenster geöffnet, in dem Sie Ihre Zahlungsmethode auswählen können.
Auf der linken Seite sehen Sie ein Feld, in dem Ihre temporären Anmeldedaten für dieses Lab angezeigt werden.
Kopieren Sie den Nutzernamen und klicken Sie dann auf Open Google Console (Google Console öffnen).
Das Lab aktiviert Ressourcen und öffnet dann einen weiteren Tab mit der Seite Choose an account (Konto auswählen).
Tipp: Öffnen Sie die Tabs nebeneinander in separaten Fenstern.
Klicken Sie auf der Seite "Choose an account" (Konto auswählen) auf Use Another Account (Anderes Konto verwenden).
Die Anmeldeseite wird geöffnet. Fügen Sie den Namen ein, den Sie aus dem Bereich "Connection Details" (Verbindungsdetails) kopiert haben. Kopieren Sie dann das Passwort und fügen Sie es ein.
Wichtig: Sie müssen sich mit dem Nutzernamen und Passwort aus dem Bereich "Connection Details" (Verbindungsdetails) anmelden. Verwenden Sie nicht Ihre Qwiklabs-Anmeldedaten. Auch wenn Sie bereits ein eigenes GCP-Konto haben, sollten Sie es nicht für dieses Lab verwenden (so vermeiden Sie Gebühren).
Klicken Sie sich durch die nachfolgenden Seiten:
Akzeptieren Sie die Nutzungsbedingungen.
Fügen Sie keine Wiederherstellungsoptionen oder Zwei-Faktor-Authentifizierung hinzu (da dies ein temporäres Konto ist).
Melden Sie sich nicht für kostenlose Tests an.
Nach wenigen Augenblicken wird die GCP Console in diesem Tab geöffnet.
Einführung in Vertex AI
In diesem Lab kommt Vertex AI zum Einsatz, die einheitliche KI-Plattform in Google Cloud. Damit werden Sie ein ML-Modell trainieren und bereitstellen. Mit Vertex AI haben Sie auf nur einer Plattform zwei Optionen zum Erstellen eines ML-Modells: eine Lösung ohne Code mit AutoML und eine codebasierte Lösung mit benutzerdefiniertem Training über Vertex Workbench. Hier verwenden Sie AutoML.
In diesem Lab erstellen Sie ein ML-Modell, um zu ermitteln, ob ein bestimmter Kunde seinen Kredit zurückzahlen wird.
Aufgabe 1: Trainingsdaten vorbereiten
Der Startbildschirm des Vertex AI-Dashboards veranschaulicht die wichtigsten Schritte zum Trainieren und Bereitstellen eines ML-Modells: Trainingsdaten vorbereiten, Modell trainieren und Vorhersagen abrufen. Später zeigt das Dashboard Ihre jüngsten Aktivitäten an, z. B. die letzten Datensätze, Modelle, Vorhersagen, Endpunkte und Notebook-Instanzen.
Dataset erstellen
Klicken Sie in der Google Cloud Console im Navigationsmenü auf Vertex AI > Datasets.
Klicken Sie auf Dataset erstellen.
Nennen Sie das Dataset LoanRisk.
Wählen Sie als Datentyp und Ziel die Option Tabelle und wählen Sie dann Regression/Klassifizierung.
Klicken Sie auf Erstellen.
Daten hochladen
Es gibt drei Möglichkeiten, Daten in Vertex AI zu importieren:
CSV-Dateien von Ihrem Computer hochladen
CSV-Dateien aus Cloud Storage auswählen
Tabelle oder Ansicht aus BigQuery auswählen
Der Einfachheit halber wurde das Dataset schon in Cloud Storage hochgeladen.
Wählen Sie für die Datenquelle die Option CSV-Dateien aus Cloud Storage auswählen aus.
Geben Sie unter Importdateipfad Folgendes ein:
spls/cbl455/loan_risk.csv
Klicken Sie auf Weiter.
Hinweis: Sie können diese Seite auch konfigurieren, indem Sie im Menü auf der linken Seite auf Datasets klicken und dann den Namen des Datasets auf der Seite „Datasets“ auswählen.
(Optional) Statistiken erstellen
Klicken Sie auf Statistiken erstellen, um die beschreibenden Statistiken für jede Spalte Ihres Datasets anzuzeigen.
Das Erstellen der Statistiken kann einige Minuten dauern, vor allem beim ersten Mal.
Wenn die Statistiken fertig sind, können Sie durch Klicken auf die einzelnen Spaltennamen die analytischen Diagramme anzeigen.
Aufgabe 2: Modell trainieren
Nachdem Sie ein Dataset hochgeladen haben, können Sie ein Modell trainieren, um vorherzusagen, ob ein Kunde einen Kredit zurückzahlen wird.
Klicken Sie auf Neues Modell trainieren und wählen Sie Anderes.
Trainingsmethode
Das Dataset hat schon den Namen LoanRisk.
Wählen Sie als Ziel die Option Klassifizierung aus.
Sie wählen Klassifizierung statt Regression aus, weil Sie eine konkrete Zahl vorhersagen (ob ein Kunde einen Kredit zurückzahlen wird: 0 für Rückzahlung, 1 für Zahlungsausfall/Keine Rückzahlung) und nicht eine kontinuierliche Zahl.
Klicken Sie auf Weiter.
Modelldetails
Geben Sie den Namen des Modells und die Zielspalte an.
Geben Sie dem Modell einen Namen, beispielsweise LoanRisk.
Wählen Sie für Zielspalte die Option Standard.
(Optional) Unter Erweiterte Optionen können Sie festlegen, wie Trainings- und Testdaten zugewiesen werden, und Verschlüsselungsoptionen wählen.
Klicken Sie auf Weiter.
Klicken Sie auf Weiter, um Features hinzuzufügen.
Trainingsoptionen
Geben Sie an, welche Spalten Sie in das Trainingsmodell aufnehmen möchten. Zum Beispiel spielt die ClientID für die Vorhersage des Kreditrisikos wahrscheinlich keine Rolle.
Klicken Sie auf das Minus in der Zeile ClientID, um diese aus dem Modelltraining auszuschließen.
(Optional) Unter Erweiterte Optionen können Sie verschiedene Optimierungsziele auswählen.
Weitere Informationen zu Optimierungszielen für tabellarische AutoML-Modelle finden Sie in der entsprechenden Anleitung.
Klicken Sie auf Weiter.
Computing und Preise
Der Wert unter Budget steht für die Knotenstunden für das Training. Geben Sie hier 1 ein.
Das Training Ihres AutoML-Modells für eine Rechenstunde ist meist ein guter Ausgangspunkt, um festzustellen, ob es eine Beziehung zwischen den von Ihnen ausgewählten Features und Labels gibt. Ausgehend davon können Sie Features anpassen und das Modell für weitere Stunden trainieren, um die Modellleistung zu verbessern.
Vorzeitiges Beenden sollte aktiviert bleiben.
Klicken Sie auf Training starten.
Abhängig von der Datenmenge und der Trainingsmethode kann das Training zwischen einigen Minuten und einigen Stunden dauern. Normalerweise erhalten Sie eine E-Mail von Google Cloud, wenn das Training abgeschlossen ist. In der Qwiklabs-Umgebung geschieht das jedoch nicht.
Hinweis: Um die typische Wartezeit von einer Stunde beim Modelltraining zu vermeiden, laden Sie in Aufgabe 5 ein vortrainiertes Modell herunter.
Dieses Modell ist das Ergebnis von Aufgabe 1 und 2. Aufgaben 3 und 4 dienen nur zu Demonstrationszwecken und sind relevant, wenn Sie das Modell selbst trainieren.
Vertex AI bietet zahlreiche Messwerte zur Bewertung der Modellleistung. Wir konzentrieren uns auf drei davon:
Precision-/Recall-Kurve
Wahrheitsmatrix
Featurewichtigkeit
Hinweis: Bei einem trainierten Modell können Sie den Tab Model Registry in Vertex AI aufrufen.
1. Öffnen Sie Model Registry.
2. Klicken Sie auf das Modell, das Sie gerade trainiert haben.
3. Rufen Sie den Tab Bewerten auf.
In dieser Übung können Sie diesen Schritt überspringen, da Sie ein vortrainiertes Modell verwenden.
Precision-/Recall-Kurve
Der Konfidenzschwellenwert bestimmt, wie ein ML-Modell die positiven Fälle zählt. Ein höherer Schwellenwert erhöht den Precision-Wert, verringert aber den Recall-Wert. Ein niedrigerer Schwellenwert verringert den Precision-Wert, erhöht aber den Recall-Wert.
Sie können den Schwellenwert manuell anpassen, um die Auswirkungen auf Precision und Recall zu beobachten und den besten Kompromiss zwischen beiden Werten gemäß Ihren geschäftlichen Anforderungen zu ermitteln.
Wahrheitsmatrix
Eine Wahrheitsmatrix gibt den Prozentsatz der Beispiele jeder Klasse in einem Testsatz an, den das Modell korrekt vorhergesagt hat.
Die Wahrheitsmatrix zeigt, dass Ihr anfängliches Modell 100 % der Rückzahlungsbeispiele und 87 % der Standardbeispiele in Ihrem Testsatz richtig vorhersagen konnte, was nicht schlecht ist.
Sie können den Prozentsatz mit weiteren Beispielen (mehr Daten) erhöhen oder indem Sie neue Merkmale entwickeln, die Trainingsmethode ändern usw.
Featurewichtigkeit
In Vertex AI wird die Featurewichtigkeit in einem Balkendiagramm dargestellt, das veranschaulicht, wie jedes Feature sich auf die Vorhersage auswirkt. Je länger der Balken bzw. je größer der Zahlenwert eines Feature ist, desto wichtiger ist es.
Diese Featurewichtigkeitswerte können Ihnen helfen, Ihr Modell zu verbessern und mehr Vertrauen in seine Vorhersagen zu gewinnen. Es kann sinnvoll sein, beim nächsten Modelltraining die Features mit der geringsten Wichtigkeit zu entfernen oder zwei der wichtigeren Features zu einer Featureverknüpfung zu kombinieren und zu prüfen, ob das die Modellleistung verbessert.
Featurewichtigkeit ist nur ein Beispiel für die umfassenden Machine-Learning-Funktionen von Vertex AI, die als Explainable AI bezeichnet werden. Explainable AI umfasst eine Reihe von Tools und Frameworks, mit deren Hilfe Sie durch Ihre ML-Modelle generierte Vorhersagen verstehen und interpretieren können.
Aufgabe 4: Modell bereitstellen (nur Demonstration)
Hinweis: Sie werden das Modell nicht an einem Endpunkt bereitstellen, da das Modelltraining eine Stunde dauern kann. Hier sehen Sie die Schritte, die Sie in einer Produktionsumgebung ausführen würden.
Nachdem Sie nun ein trainiertes Modell haben, ist der nächste Schritt, einen Endpunkt in Vertex AI zu erstellen. Einer Modellressource in Vertex AI können mehrere Endpunkte zugeordnet sein. Sie können den Traffic auch zwischen Endpunkten aufteilen.
Endpunkt erstellen und definieren
Klicken Sie auf der Modellseite auf Bereitstellen und Testen und anschließend auf Auf Endpunkt bereitstellen.
Geben Sie als Endpunktnamen die Bezeichnung LoanRisk ein.
Klicken Sie auf Weiter.
Modelleinstellungen und Monitoring
Belassen Sie die Einstellungen zur Aufteilung des Traffics wie sie sind.
Wählen Sie als Maschinentyp die Option e2-standard-8, 8 vCPUs, 32 GiB Arbeitsspeicher.
Klicken Sie unter Optionen für Erklärbarkeit auf Featureattribution.
Klicken Sie auf Fertig.
Klicken Sie auf Weiter.
Klicken Sie unter Modellmonitoring auf Weiter.
Wählen Sie unter Modellziele > Trainingsdatenquelle die Option Vertex AI-Dataset.
Wählen Sie Ihr Dataset aus dem Drop-down-Menü aus.
Geben Sie unter Zielspalte den Wert Standard ein.
Lassen Sie die übrigen Einstellungen unverändert und klicken Sie auf Bereitstellen.
Die Bereitstellung des Endpunkts dauert einige Minuten. Sobald sie abgeschlossen ist, wird ein grünes Häkchen neben dem Namen angezeigt.
Jetzt können Sie Vorhersagen von Ihrem bereitgestellten Modell abrufen.
Aufgabe 5: Vorhersagen abrufen
In diesem Abschnitt verwenden Sie das AutoML-Gateway, um mit einem vortrainierten Modell zu arbeiten.
UMGEBUNGSVARIABLE
WERT
Credit_Risk ENDPUNKT
1411183591831896064
INPUT_DATA_FILE
INPUT-JSON
Damit Sie das trainierte Modell verwenden können, müssen Sie einige Umgebungsvariablen erstellen.
Erstellen Sie die Umgebungsvariable AUTOML_SERVICE:
export AUTOML_SERVICE="https://automl-proxy-$PROJECT_NUMBER.us-central1.run.app/v1"
Hinweis: Nehmen Sie sich nach dem Entpacken der Lab-Assets einen Moment Zeit, um den Inhalt zu überprüfen.
Die Datei INPUT-JSON wird verwendet, um Vertex AI mit den erforderlichen Modelldaten zu versorgen. Ändern Sie diese Datei, um eigene Vorhersagen zu erstellen.
Wenn Sie die Google Cloud Console verwenden, sehen Sie im folgenden Bild, wie diese Aktion durchgeführt werden könnte:
Das wars! Sie haben das Lab erfolgreich abgeschlossen.
Sie können jetzt mit Vertex AI:
Ein Dataset hochladen
Ein Modell mit AutoML trainieren
Die Modellleistung bewerten
Das trainierte Modell auf einem Endpunkt bereitstellen
Vorhersagen abrufen
Weitere Informationen zu den verschiedenen Bereichen von Vertex AI finden Sie in der Vertex AI-Dokumentation.
Lab beenden
Wenn Sie das Lab abgeschlossen haben, klicken Sie auf Lab beenden. Google Cloud Skills Boost entfernt daraufhin die von Ihnen genutzten Ressourcen und bereinigt das Konto.
Anschließend erhalten Sie die Möglichkeit, das Lab zu bewerten. Wählen Sie die entsprechende Anzahl von Sternen aus, schreiben Sie einen Kommentar und klicken Sie anschließend auf Senden.
Die Anzahl der Sterne hat folgende Bedeutung:
1 Stern = Sehr unzufrieden
2 Sterne = Unzufrieden
3 Sterne = Neutral
4 Sterne = Zufrieden
5 Sterne = Sehr zufrieden
Wenn Sie kein Feedback geben möchten, können Sie das Dialogfeld einfach schließen.
Verwenden Sie für Feedback, Vorschläge oder Korrekturen den Tab Support.
Labs erstellen ein Google Cloud-Projekt und Ressourcen für einen bestimmten Zeitraum
Labs haben ein Zeitlimit und keine Pausenfunktion. Wenn Sie das Lab beenden, müssen Sie von vorne beginnen.
Klicken Sie links oben auf dem Bildschirm auf Lab starten, um zu beginnen
Privates Surfen verwenden
Kopieren Sie den bereitgestellten Nutzernamen und das Passwort für das Lab
Klicken Sie im privaten Modus auf Konsole öffnen
In der Konsole anmelden
Melden Sie sich mit Ihren Lab-Anmeldedaten an. Wenn Sie andere Anmeldedaten verwenden, kann dies zu Fehlern führen oder es fallen Kosten an.
Akzeptieren Sie die Nutzungsbedingungen und überspringen Sie die Seite zur Wiederherstellung der Ressourcen
Klicken Sie erst auf Lab beenden, wenn Sie das Lab abgeschlossen haben oder es neu starten möchten. Andernfalls werden Ihre bisherige Arbeit und das Projekt gelöscht.
Diese Inhalte sind derzeit nicht verfügbar
Bei Verfügbarkeit des Labs benachrichtigen wir Sie per E-Mail
Sehr gut!
Bei Verfügbarkeit kontaktieren wir Sie per E-Mail
Es ist immer nur ein Lab möglich
Bestätigen Sie, dass Sie alle vorhandenen Labs beenden und dieses Lab starten möchten
Privates Surfen für das Lab verwenden
Nutzen Sie den privaten oder Inkognitomodus, um dieses Lab durchzuführen. So wird verhindert, dass es zu Konflikten zwischen Ihrem persönlichen Konto und dem Teilnehmerkonto kommt und zusätzliche Gebühren für Ihr persönliches Konto erhoben werden.
In diesem Lab verwenden Sie AutoML in Vertex AI, um ein Modell mit tabellarischen Daten zu trainieren und einzusetzen. Vertex AI ist das neueste KI-Produkt von Google Cloud und aktuell als Vorabversion verfügbar.