Di lab ini, Anda akan menggunakan Vertex AI untuk melatih dan menyajikan model machine learning untuk memprediksi risiko pinjaman dengan set data tabulasi.
Tujuan
Anda akan mempelajari cara:
Mengupload set data ke Vertex AI.
Melatih model machine learning dengan AutoML.
Mengevaluasi performa model.
Men-deploy model ke endpoint.
Mendapatkan prediksi.
Penyiapan
Sebelum mengklik tombol Start Lab (Mulai Lab)
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer, yang dimulai saat Anda mengklik Start Lab (Mulai Lab), menampilkan lamanya resource Cloud akan tersedia untuk Anda.
Lab praktis Qwiklabs ini memungkinkan Anda melakukan aktivitas lab sendiri di lingkungan cloud nyata, bukan di lingkungan demo atau simulasi. Yaitu dengan cara memberi Anda kredensial sementara yang baru yang digunakan untuk login dan mengakses Google Cloud Platform selama durasi lab.
Yang diperlukan
Untuk menyelesaikan lab ini, Anda memerlukan:
Akses ke browser internet standar (disarankan browser Chrome).
Waktu untuk menyelesaikan lab.
Catatan: Jika Anda sudah memiliki project atau akun GCP pribadi, jangan gunakan project atau akun tersebut untuk lab ini.
Cara memulai lab dan login ke Console
Klik tombol Start Lab. Jika Anda perlu membayar lab, jendela pop-up akan terbuka untuk memilih metode pembayaran.
Di sebelah kiri terdapat panel berisi kredensial sementara yang harus Anda gunakan untuk lab ini.
Salin nama pengguna, lalu klik Open Google Console.
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Choose an account.
Tips: Buka tab di jendela terpisah secara berdampingan.
Di halaman Choose an account, klik Use Another Account. Halaman Login akan terbuka.
Tempel nama pengguna yang telah disalin dari panel Connection Details. Lalu, salin dan tempel sandinya.
Catatan: Anda harus menggunakan kredensial dari panel Connection Details. Jangan menggunakan kredensial Google Cloud Skills Boost. Jangan menggunakan akun Google Cloud pribadi Anda untuk lab ini agar terhindar dari tagihan.
Klik halaman berikutnya:
Setujui persyaratan dan ketentuan.
Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
Jangan daftar uji coba gratis.
Setelah beberapa saat, Konsol Cloud akan terbuka di tab ini.
Catatan: Anda dapat melihat menu berisi daftar Produk dan Layanan Google Cloud dengan mengklik Navigation menu di kiri atas.
Pengantar Vertex AI
Lab ini menggunakan Vertex AI, yakni platform AI terpadu di Google Cloud untuk melatih dan men-deploy model ML. Vertex AI menawarkan dua opsi pada satu platform untuk membangun model ML: solusi tanpa kode dengan AutoML dan solusi berbasis kode dengan Pelatihan Kustom menggunakan Vertex Workbench. Anda akan menggunakan AutoML di lab ini.
Di lab ini, Anda akan membangun model ML untuk menentukan apakah pelanggan tertentu akan membayar kembali pinjamannya atau tidak.
Tugas 1. Menyiapkan data pelatihan
Dasbor Vertex AI awal menggambarkan tahap utama untuk melatih dan men-deploy model ML: menyiapkan data pelatihan, melatih model, dan mendapatkan prediksi. Kemudian, dasbor tersebut akan menampilkan aktivitas terbaru Anda, seperti set data, model, prediksi, endpoint, dan instance notebook terbaru.
Membuat set data
Di Konsol Google Cloud, pada Navigation menu, klik Vertex AI > Datasets.
Klik Create dataset.
Berikan nama LoanRisk pada set data.
Untuk jenis data dan tujuannya, klik Tabular, lalu pilih Regression/classification.
Klik Create.
Mengupload data
Ada tiga opsi untuk mengimpor data di Vertex AI:
Mengupload file CSV dari komputer Anda.
Memilih file CSV dari Cloud Storage.
Memilih tabel atau tabel virtual dari BigQuery.
Demi kenyamanan, set data sudah diupload ke Cloud Storage.
Untuk sumber data, pilih Select CSV files from Cloud Storage.
Untuk Import file path, masukkan:
spls/cbl455/loan_risk.csv
Klik Continue.
Catatan: Anda juga dapat mengonfigurasi halaman ini dengan mengklik Datasets di menu sebelah kiri, lalu pilih nama set data di halaman Datasets.
(Opsional) Membuat statistik
Untuk melihat statistik deskriptif untuk tiap kolom set data Anda, klik Generate statistics .
Pembuatan statistik mungkin memerlukan waktu beberapa menit, terutama pada saat pertama kali.
Ketika statistik sudah siap, klik tiap nama kolom untuk menampilkan diagram analitis.
Tugas 2. Melatih model Anda
Setelah mengupload set data, Anda siap melatih model untuk memprediksi apakah pelanggan akan membayar kembali pinjamannya atau tidak.
Klik Train new model, lalu pilih Other.
Metode pelatihan
Set data sudah diberi nama LoanRisk.
Untuk Objective, pilih Classification.
Pilih klasifikasi dan bukan regresi karena Anda akan memprediksikan bilangan bulat (apakah seorang pelanggan akan membayar kembali pinjamannya atau tidak: 0 untuk membayar kembali, 1 untuk gagal bayar/tidak membayar kembali), bukan bilangan desimal.
Klik Continue.
Detail model
Tentukan nama model dan kolom target.
Berikan nama pada model tersebut, misalnya LoanRisk.
Untuk Target column, pilih Default .
(Opsional) Jelajahi Advanced options untuk menentukan cara menetapkan data pelatihan vs. pengujian dan menentukan enkripsi.
Klik Continue.
Untuk Add features, klik Continue.
Opsi pelatihan
Tentukan kolom mana yang ingin Anda sertakan dalam model pelatihan. Misalnya, ClientID mungkin tidak relevan untuk memprediksi risiko pinjaman.
Klik tanda minus pada baris ClientID untuk mengecualikannya dari model pelatihan.
(Opsional) Jelajahi Advanced options untuk memilih tujuan pengoptimalan yang berbeda.
Untuk mengetahui informasi selengkapnya tentang tujuan pengoptimalan untuk model AutoML tabulasi, baca Panduan tujuan pengoptimalan untuk model AutoML tabulasi.
Klik Continue.
Komputasi dan harga
Untuk Budget, yang merepresentasikan jumlah jam kerja node untuk pelatihan, masukkan 1.
Melatih model AutoML Anda selama 1 jam komputasi biasanya merupakan awal yang baik untuk memahami apakah ada hubungan antara fitur dan label yang Anda pilih atau tidak. Dari sana, Anda dapat memodifikasi fitur dan melatihnya dengan durasi lebih lama guna meningkatkan performa model.
Biarkan penghentian awal di posisi Enabled.
Klik Start training.
Bergantung pada ukuran data dan metode pelatihan, pelatihan dapat berlangsung dari beberapa menit hingga beberapa jam. Biasanya Anda akan menerima email dari Google Cloud saat tugas pelatihan selesai. Namun, di lingkungan Qwiklabs, Anda tidak akan menerima email.
Catatan: Untuk menghilangkan waktu tunggu pelatihan model yang biasanya berlangsung selama satu jam, download model terlatih di Tugas 5.
Model ini adalah hasil dari Tugas 1 dan 2. Tugas 3 dan 4 hanya untuk demo dan berlaku jika Anda melatih sendiri model yang digunakan.
Tugas 3. Mengevaluasi performa model (khusus demonstrasi)
Vertex AI menyediakan banyak metrik untuk mengevaluasi performa model. Anda akan berfokus pada tiga hal berikut:
Kurva Presisi/Perolehan
Matriks Konfusi
Nilai Penting Fitur
Catatan: Jika memiliki model yang terlatih, Anda dapat membuka tab Model Registry di Vertex AI.
1. Buka Model Registry.
2. Klik model yang baru saja Anda latih.
3. Jelajahi tab Evaluate.
Namun di lab ini, Anda dapat melewati langkah ini karena Anda menggunakan model terlatih.
Kurva presisi/perolehan
Nilai minimum keyakinan menentukan bagaimana model ML menghitung kasus positif. Nilai minimum yang lebih tinggi meningkatkan presisi, tetapi menurunkan perolehan. Nilai minimum yang lebih rendah menurunkan presisi, tetapi meningkatkan perolehan.
Anda dapat menyesuaikan nilai minimum secara manual untuk mengamati dampaknya terhadap presisi dan perolehan serta menemukan titik keseimbangan terbaik antara keduanya untuk memenuhi kebutuhan bisnis Anda.
Matriks konfusi
Matriks konfusi menunjukkan persentase contoh dari tiap class dalam set pengujian Anda yang diprediksi dengan benar oleh model.
Matriks konfusi menunjukkan bahwa model awal Anda mampu memprediksi 100% contoh pembayaran kembali dan 87% contoh gagal bayar dalam set pengujian Anda dengan benar, dan hasil ini tidak terlalu buruk.
Anda dapat meningkatkan persentase dengan menambahkan lebih banyak contoh (lebih banyak data), merekayasa fitur baru, dan mengubah metode pelatihan, dll.
Nilai penting fitur
Dalam Vertex AI, nilai penting fitur ditampilkan melalui diagram batang untuk mengilustrasikan cara tiap fitur berkontribusi terhadap prediksi. Semakin panjang batang tersebut, atau semakin besar nilai numerik yang dikaitkan dengan suatu fitur, semakin penting fitur tersebut.
Nilai-nilai penting fitur ini dapat digunakan untuk membantu Anda meningkatkan kualitas model dan lebih yakin dengan prediksinya. Anda mungkin memutuskan untuk menghapus fitur yang paling tidak penting saat Anda melatih model berikutnya atau menggabungkan dua fitur yang lebih penting menjadi satu persilangan fitur untuk mengetahui apakah hal ini meningkatkan performa model atau tidak.
Nilai penting fitur hanyalah salah satu contoh fungsionalitas machine learning komprehensif Vertex AI yang disebut Explainable AI. Explainable AI adalah serangkaian alat dan framework untuk membantu memahami dan menafsirkan prediksi yang dibuat oleh model machine learning.
Tugas 4. Men-deploy model (hanya demonstrasi)
Catatan: Anda tidak akan men-deploy model ke endpoint karena pelatihan model dapat memakan waktu satu jam. Di sini, Anda dapat meninjau langkah-langkah yang akan Anda lakukan di lingkungan produksi.
Sekarang setelah Anda memiliki model yang terlatih, langkah selanjutnya adalah membuat endpoint di Vertex. Resource model di Vertex dapat memiliki beberapa endpoint yang terkait dengannya, dan Anda dapat membagi traffic antar-endpoint.
Membuat dan menentukan endpoint
Di halaman model Anda, klik Deploy & test, lalu klik Deploy to Endpoint.
Untuk Machine type, pilih e2-standard-8, 8 vCPUs, 32 GiB memory.
Untuk Explainability Options, klik Feature attribution.
Klik Done.
Klik Continue.
Pada Model monitoring, klik Continue.
Pada Model objectives > Training data source, pilih Vertex AI dataset.
Pilih set data Anda dari menu drop-down.
Pada Target column, ketik Default
Tetap gunakan nilai default untuk setelan lainnya, lalu klik Deploy.
Endpoint Anda akan memerlukan waktu beberapa menit untuk di-deploy. Ketika sudah selesai, tanda centang berwarna hijau akan muncul di sebelah nama endpoint.
Sekarang Anda siap untuk mendapatkan prediksi pada model yang Anda deploy.
Tugas 5. Mendapatkan prediksi
Di bagian ini, gunakan AutoML-Gateway untuk menggunakan model terlatih yang sudah ada.
VARIABEL LINGKUNGAN
NILAI
Credit_Risk ENDPOINT
1411183591831896064
INPUT_DATA_FILE
INPUT-JSON
Untuk menggunakan model terlatih, Anda perlu membuat beberapa variabel lingkungan.
export AUTOML_SERVICE="https://automl-proxy-$PROJECT_NUMBER.us-central1.run.app/v1"
Catatan: Setelah aset lab diekstrak, luangkan waktu sejenak untuk meninjau konten.
File INPUT-JSON digunakan untuk menyediakan data model yang dibutuhkan Vertex AI. Ubah file ini untuk menghasilkan prediksi kustom.
Jika Anda menggunakan Konsol Google Cloud, gambar berikut mengilustrasikan bagaimana tindakan yang sama dapat dilakukan:
Selamat!
Anda kini dapat menggunakan Vertex AI untuk:
Mengupload set data.
Melatih model dengan AutoML.
Mengevaluasi performa model.
Men-deploy model AutoML terlatih ke endpoint.
Mendapatkan prediksi.
Untuk mempelajari lebih lanjut berbagai bagian Vertex AI, baca dokumentasi Vertex AI.
Mengakhiri lab Anda
Setelah Anda menyelesaikan lab, klik Akhiri Lab. Google Cloud Skills Boost menghapus resource yang telah Anda gunakan dan membersihkan akun.
Anda akan diberi kesempatan untuk menilai pengalaman menggunakan lab. Pilih jumlah bintang yang sesuai, ketik komentar, lalu klik Submit.
Makna jumlah bintang:
1 bintang = Sangat tidak puas
2 bintang = Tidak puas
3 bintang = Netral
4 bintang = Puas
5 bintang = Sangat puas
Anda dapat menutup kotak dialog jika tidak ingin memberikan masukan.
Untuk masukan, saran, atau koreksi, gunakan tab Support.
Hak cipta 2020 Google LLC Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.
Lab membuat project dan resource Google Cloud untuk jangka waktu tertentu
Lab memiliki batas waktu dan tidak memiliki fitur jeda. Jika lab diakhiri, Anda harus memulainya lagi dari awal.
Di kiri atas layar, klik Start lab untuk memulai
Gunakan penjelajahan rahasia
Salin Nama Pengguna dan Sandi yang diberikan untuk lab tersebut
Klik Open console dalam mode pribadi
Login ke Konsol
Login menggunakan kredensial lab Anda. Menggunakan kredensial lain mungkin menyebabkan error atau dikenai biaya.
Setujui persyaratan, dan lewati halaman resource pemulihan
Jangan klik End lab kecuali jika Anda sudah menyelesaikan lab atau ingin mengulanginya, karena tindakan ini akan menghapus pekerjaan Anda dan menghapus project
Konten ini tidak tersedia untuk saat ini
Kami akan memberi tahu Anda melalui email saat konten tersedia
Bagus!
Kami akan menghubungi Anda melalui email saat konten tersedia
Satu lab dalam satu waktu
Konfirmasi untuk mengakhiri semua lab yang ada dan memulai lab ini
Gunakan penjelajahan rahasia untuk menjalankan lab
Gunakan jendela Samaran atau browser pribadi untuk menjalankan lab ini. Langkah ini akan mencegah konflik antara akun pribadi Anda dan akun Siswa yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.
Di lab ini, Anda akan menggunakan AutoML pada Vertex AI untuk melatih dan menyajikan model dengan data tabulasi. Vertex AI adalah penawaran produk AI terbaru di Google Cloud, dan saat ini masih dalam tahap pratinjau.