Dapatkan akses ke 700+ lab dan kursus

Vertex AI: Memprediksi Risiko Pinjaman dengan AutoML

Lab 1 jam universal_currency_alt 5 Kredit show_chart Pengantar

info Lab ini mungkin menggabungkan alat AI untuk mendukung pembelajaran Anda.

Ringkasan
Penyiapan
Pengantar Vertex AI
Tugas 1. Menyiapkan data pelatihan
Tugas 2. Melatih model Anda
Tugas 3. Mengevaluasi performa model (khusus demonstrasi)
Tugas 4. Men-deploy model (hanya demonstrasi)
Tugas 5. Mendapatkan prediksi
Selamat!
Mengakhiri lab Anda

Dapatkan akses ke 700+ lab dan kursus

Ringkasan

Di lab ini, Anda akan menggunakan Vertex AI untuk melatih dan menyajikan model machine learning untuk memprediksi risiko pinjaman dengan set data tabulasi.

Tujuan

Anda akan mempelajari cara:

Mengupload set data ke Vertex AI.
Melatih model machine learning dengan AutoML.
Mengevaluasi performa model.
Men-deploy model ke endpoint.
Mendapatkan prediksi.

Penyiapan

Sebelum mengklik tombol Start Lab (Mulai Lab)

Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer, yang dimulai saat Anda mengklik Start Lab (Mulai Lab), menampilkan lamanya resource Cloud akan tersedia untuk Anda.

Lab praktis Qwiklabs ini memungkinkan Anda melakukan aktivitas lab sendiri di lingkungan cloud nyata, bukan di lingkungan demo atau simulasi. Yaitu dengan cara memberi Anda kredensial sementara yang baru yang digunakan untuk login dan mengakses Google Cloud Platform selama durasi lab.

Yang diperlukan

Untuk menyelesaikan lab ini, Anda memerlukan:

Akses ke browser internet standar (disarankan browser Chrome).
Waktu untuk menyelesaikan lab.

Catatan: Jika Anda sudah memiliki project atau akun GCP pribadi, jangan gunakan project atau akun tersebut untuk lab ini.

Cara memulai lab dan login ke Console

Klik tombol Start Lab. Jika Anda perlu membayar lab, jendela pop-up akan terbuka untuk memilih metode pembayaran. Di sebelah kiri terdapat panel berisi kredensial sementara yang harus Anda gunakan untuk lab ini.
Salin nama pengguna, lalu klik Open Google Console. Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Choose an account.
Tips: Buka tab di jendela terpisah secara berdampingan.
Di halaman Choose an account, klik Use Another Account. Halaman Login akan terbuka.
Tempel nama pengguna yang telah disalin dari panel Connection Details. Lalu, salin dan tempel sandinya.

Catatan: Anda harus menggunakan kredensial dari panel Connection Details. Jangan menggunakan kredensial Google Cloud Skills Boost. Jangan menggunakan akun Google Cloud pribadi Anda untuk lab ini agar terhindar dari tagihan.

Klik halaman berikutnya:

Setujui persyaratan dan ketentuan.
Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
Jangan daftar uji coba gratis.

Setelah beberapa saat, Konsol Cloud akan terbuka di tab ini.

Catatan: Anda dapat melihat menu berisi daftar Produk dan Layanan Google Cloud dengan mengklik Navigation menu di kiri atas.

Pengantar Vertex AI

Lab ini menggunakan Vertex AI, yakni platform AI terpadu di Google Cloud untuk melatih dan men-deploy model ML. Vertex AI menawarkan dua opsi pada satu platform untuk membangun model ML: solusi tanpa kode dengan AutoML dan solusi berbasis kode dengan Pelatihan Kustom menggunakan Vertex Workbench. Anda akan menggunakan AutoML di lab ini.

Di lab ini, Anda akan membangun model ML untuk menentukan apakah pelanggan tertentu akan membayar kembali pinjamannya atau tidak.

Tugas 1. Menyiapkan data pelatihan

Dasbor Vertex AI awal menggambarkan tahap utama untuk melatih dan men-deploy model ML: menyiapkan data pelatihan, melatih model, dan mendapatkan prediksi. Kemudian, dasbor tersebut akan menampilkan aktivitas terbaru Anda, seperti set data, model, prediksi, endpoint, dan instance notebook terbaru.

Membuat set data

Di Konsol Google Cloud, pada Navigation menu, klik Vertex AI > Datasets.
Klik Create dataset.
Berikan nama LoanRisk pada set data.
Untuk jenis data dan tujuannya, klik Tabular, lalu pilih Regression/classification.
Klik Create.

Mengupload data

Ada tiga opsi untuk mengimpor data di Vertex AI:

Mengupload file CSV dari komputer Anda.
Memilih file CSV dari Cloud Storage.
Memilih tabel atau tabel virtual dari BigQuery.

Demi kenyamanan, set data sudah diupload ke Cloud Storage.

Untuk sumber data, pilih Select CSV files from Cloud Storage.
Untuk Import file path, masukkan:

spls/cbl455/loan_risk.csv

Klik Continue.

Catatan: Anda juga dapat mengonfigurasi halaman ini dengan mengklik Datasets di menu sebelah kiri, lalu pilih nama set data di halaman Datasets.

(Opsional) Membuat statistik

Untuk melihat statistik deskriptif untuk tiap kolom set data Anda, klik Generate statistics .
Pembuatan statistik mungkin memerlukan waktu beberapa menit, terutama pada saat pertama kali.
Ketika statistik sudah siap, klik tiap nama kolom untuk menampilkan diagram analitis.

Tugas 2. Melatih model Anda

Setelah mengupload set data, Anda siap melatih model untuk memprediksi apakah pelanggan akan membayar kembali pinjamannya atau tidak.

Klik Train new model, lalu pilih Other.

Metode pelatihan

Set data sudah diberi nama LoanRisk.
Untuk Objective, pilih Classification.

Pilih klasifikasi dan bukan regresi karena Anda akan memprediksikan bilangan bulat (apakah seorang pelanggan akan membayar kembali pinjamannya atau tidak: 0 untuk membayar kembali, 1 untuk gagal bayar/tidak membayar kembali), bukan bilangan desimal.

Klik Continue.

Detail model

Tentukan nama model dan kolom target.

Berikan nama pada model tersebut, misalnya LoanRisk.
Untuk Target column, pilih Default .
(Opsional) Jelajahi Advanced options untuk menentukan cara menetapkan data pelatihan vs. pengujian dan menentukan enkripsi.
Klik Continue.
Untuk Add features, klik Continue.

Opsi pelatihan

Tentukan kolom mana yang ingin Anda sertakan dalam model pelatihan. Misalnya, ClientID mungkin tidak relevan untuk memprediksi risiko pinjaman.

Klik tanda minus pada baris ClientID untuk mengecualikannya dari model pelatihan.
(Opsional) Jelajahi Advanced options untuk memilih tujuan pengoptimalan yang berbeda.
Untuk mengetahui informasi selengkapnya tentang tujuan pengoptimalan untuk model AutoML tabulasi, baca Panduan tujuan pengoptimalan untuk model AutoML tabulasi.
Klik Continue.

Komputasi dan harga

Untuk Budget, yang merepresentasikan jumlah jam kerja node untuk pelatihan, masukkan 1.
Melatih model AutoML Anda selama 1 jam komputasi biasanya merupakan awal yang baik untuk memahami apakah ada hubungan antara fitur dan label yang Anda pilih atau tidak. Dari sana, Anda dapat memodifikasi fitur dan melatihnya dengan durasi lebih lama guna meningkatkan performa model.
Biarkan penghentian awal di posisi Enabled.
Klik Start training.

Bergantung pada ukuran data dan metode pelatihan, pelatihan dapat berlangsung dari beberapa menit hingga beberapa jam. Biasanya Anda akan menerima email dari Google Cloud saat tugas pelatihan selesai. Namun, di lingkungan Qwiklabs, Anda tidak akan menerima email.

Catatan: Untuk menghilangkan waktu tunggu pelatihan model yang biasanya berlangsung selama satu jam, download model terlatih di Tugas 5. Model ini adalah hasil dari Tugas 1 dan 2. Tugas 3 dan 4 hanya untuk demo dan berlaku jika Anda melatih sendiri model yang digunakan.

Tugas 3. Mengevaluasi performa model (khusus demonstrasi)

Vertex AI menyediakan banyak metrik untuk mengevaluasi performa model. Anda akan berfokus pada tiga hal berikut:

Kurva Presisi/Perolehan
Matriks Konfusi
Nilai Penting Fitur

Catatan: Jika memiliki model yang terlatih, Anda dapat membuka tab Model Registry di Vertex AI.

1. Buka Model Registry.

2. Klik model yang baru saja Anda latih.

3. Jelajahi tab Evaluate.

Namun di lab ini, Anda dapat melewati langkah ini karena Anda menggunakan model terlatih.

Kurva presisi/perolehan

Nilai minimum keyakinan menentukan bagaimana model ML menghitung kasus positif. Nilai minimum yang lebih tinggi meningkatkan presisi, tetapi menurunkan perolehan. Nilai minimum yang lebih rendah menurunkan presisi, tetapi meningkatkan perolehan.

Anda dapat menyesuaikan nilai minimum secara manual untuk mengamati dampaknya terhadap presisi dan perolehan serta menemukan titik keseimbangan terbaik antara keduanya untuk memenuhi kebutuhan bisnis Anda.

Matriks konfusi

Matriks konfusi menunjukkan persentase contoh dari tiap class dalam set pengujian Anda yang diprediksi dengan benar oleh model.

Matriks konfusi menunjukkan bahwa model awal Anda mampu memprediksi 100% contoh pembayaran kembali dan 87% contoh gagal bayar dalam set pengujian Anda dengan benar, dan hasil ini tidak terlalu buruk.

Anda dapat meningkatkan persentase dengan menambahkan lebih banyak contoh (lebih banyak data), merekayasa fitur baru, dan mengubah metode pelatihan, dll.

Nilai penting fitur

Dalam Vertex AI, nilai penting fitur ditampilkan melalui diagram batang untuk mengilustrasikan cara tiap fitur berkontribusi terhadap prediksi. Semakin panjang batang tersebut, atau semakin besar nilai numerik yang dikaitkan dengan suatu fitur, semakin penting fitur tersebut.

Nilai-nilai penting fitur ini dapat digunakan untuk membantu Anda meningkatkan kualitas model dan lebih yakin dengan prediksinya. Anda mungkin memutuskan untuk menghapus fitur yang paling tidak penting saat Anda melatih model berikutnya atau menggabungkan dua fitur yang lebih penting menjadi satu persilangan fitur untuk mengetahui apakah hal ini meningkatkan performa model atau tidak.

Nilai penting fitur hanyalah salah satu contoh fungsionalitas machine learning komprehensif Vertex AI yang disebut Explainable AI. Explainable AI adalah serangkaian alat dan framework untuk membantu memahami dan menafsirkan prediksi yang dibuat oleh model machine learning.

Tugas 4. Men-deploy model (hanya demonstrasi)

Catatan: Anda tidak akan men-deploy model ke endpoint karena pelatihan model dapat memakan waktu satu jam. Di sini, Anda dapat meninjau langkah-langkah yang akan Anda lakukan di lingkungan produksi.

Sekarang setelah Anda memiliki model yang terlatih, langkah selanjutnya adalah membuat endpoint di Vertex. Resource model di Vertex dapat memiliki beberapa endpoint yang terkait dengannya, dan Anda dapat membagi traffic antar-endpoint.

Membuat dan menentukan endpoint

Di halaman model Anda, klik Deploy & test, lalu klik Deploy to Endpoint.
Untuk Endpoint name, ketik LoanRisk
Klik Continue.

Setelan dan pemantauan model

Biarkan setelan pemisahan traffic sebagaimana adanya.
Untuk Machine type, pilih e2-standard-8, 8 vCPUs, 32 GiB memory.
Untuk Explainability Options, klik Feature attribution.
Klik Done.
Klik Continue.
Pada Model monitoring, klik Continue.
Pada Model objectives > Training data source, pilih Vertex AI dataset.
Pilih set data Anda dari menu drop-down.
Pada Target column, ketik Default
Tetap gunakan nilai default untuk setelan lainnya, lalu klik Deploy.

Endpoint Anda akan memerlukan waktu beberapa menit untuk di-deploy. Ketika sudah selesai, tanda centang berwarna hijau akan muncul di sebelah nama endpoint.

Sekarang Anda siap untuk mendapatkan prediksi pada model yang Anda deploy.

Tugas 5. Mendapatkan prediksi

Di bagian ini, gunakan AutoML-Gateway untuk menggunakan model terlatih yang sudah ada.

VARIABEL LINGKUNGAN	NILAI
Credit_Risk ENDPOINT	1411183591831896064
INPUT_DATA_FILE	INPUT-JSON

Untuk menggunakan model terlatih, Anda perlu membuat beberapa variabel lingkungan.

Buka jendela Cloud Shell.
Download aset lab:

gcloud storage cp gs://cloud-training/CBL455/INPUT-JSON .

Buat variabel lingkungan INPUT_DATA_FILE:

export INPUT_DATA_FILE="INPUT-JSON"

Buat variabel lingkungan PROJECT_NUMBER:

export PROJECT_NUMBER=$(gcloud projects describe $(gcloud config get-value project) --format="value(projectNumber)")

Buat variabel lingkungan AUTOML_SERVICE:

export AUTOML_SERVICE="https://automl-proxy-$PROJECT_NUMBER.us-central1.run.app/v1"

Catatan: Setelah aset lab diekstrak, luangkan waktu sejenak untuk meninjau konten.

File INPUT-JSON digunakan untuk menyediakan data model yang dibutuhkan Vertex AI. Ubah file ini untuk menghasilkan prediksi kustom.

File INPUT-JSON terdiri atas nilai-nilai berikut:

{ "instances": [ { "age": 40.77430558, "ClientID": "997", "income": 44964.0106, "loan": 3944.219318 } ] }

Masukkan perintah berikut untuk meminta prediksi:

curl -X POST -H "Content-Type: application/json" $AUTOML_SERVICE -d "@${INPUT_DATA_FILE}" -s | jq

Output yang Diharapkan:

{ "predictions": [ { "scores": [ 0.9999980926513672, 0.000001897001311590429 ], "classes": [ "0", "1" ] } ], "deployedModelId": "3093594712003575808", "model": "projects/1030115194620/locations/us-central1/models/4831874217005809664", "modelDisplayName": "credit_risk_20211119212817", "modelVersionId": "1" }

Jika Anda menggunakan Konsol Google Cloud, gambar berikut mengilustrasikan bagaimana tindakan yang sama dapat dilakukan:

Selamat!

Anda kini dapat menggunakan Vertex AI untuk:

Mengupload set data.
Melatih model dengan AutoML.
Mengevaluasi performa model.
Men-deploy model AutoML terlatih ke endpoint.
Mendapatkan prediksi.

Untuk mempelajari lebih lanjut berbagai bagian Vertex AI, baca dokumentasi Vertex AI.

Mengakhiri lab Anda

Setelah Anda menyelesaikan lab, klik Akhiri Lab. Google Cloud Skills Boost menghapus resource yang telah Anda gunakan dan membersihkan akun.

Anda akan diberi kesempatan untuk menilai pengalaman menggunakan lab. Pilih jumlah bintang yang sesuai, ketik komentar, lalu klik Submit.

Makna jumlah bintang:

1 bintang = Sangat tidak puas
2 bintang = Tidak puas
3 bintang = Netral
4 bintang = Puas
5 bintang = Sangat puas

Anda dapat menutup kotak dialog jika tidak ingin memberikan masukan.

Untuk masukan, saran, atau koreksi, gunakan tab Support.

Hak cipta 2020 Google LLC Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.

Vertex AI: Memprediksi Risiko Pinjaman dengan AutoML

Vertex AI: Memprediksi Risiko Pinjaman dengan AutoML

Ringkasan

Tujuan

Penyiapan

Sebelum mengklik tombol Start Lab (Mulai Lab)

Yang diperlukan

Cara memulai lab dan login ke Console

Pengantar Vertex AI

Tugas 1. Menyiapkan data pelatihan

Membuat set data

Mengupload data

(Opsional) Membuat statistik

Tugas 2. Melatih model Anda

Metode pelatihan

Detail model

Opsi pelatihan

Komputasi dan harga

Tugas 3. Mengevaluasi performa model (khusus demonstrasi)

Kurva presisi/perolehan

Matriks konfusi

Nilai penting fitur

Tugas 4. Men-deploy model (hanya demonstrasi)

Membuat dan menentukan endpoint

Setelan dan pemantauan model

Tugas 5. Mendapatkan prediksi

Selamat!

Mengakhiri lab Anda

Sebelum memulai

Gunakan penjelajahan rahasia

Login ke Konsol

Gunakan penjelajahan rahasia untuk menjalankan lab