Checkpoint
Create a BigQuery dataset
/ 20
Create a model to predict visitor transaction
/ 20
Evaluate the model
/ 20
Predict purchases per country
/ 20
Predict purchases per user
/ 20
Mulai Menggunakan BigQuery ML
GSP247
Ringkasan
BigQuery ML memungkinkan pengguna membuat dan menjalankan model machine learning di BigQuery menggunakan kueri SQL. Tujuannya adalah untuk membuat machine learning tersedia lebih luas dengan memungkinkan praktisi SQL membuat model menggunakan alat yang sudah ada dan untuk meningkatkan kecepatan pengembangan dengan meniadakan kebutuhan akan pemindahan data.
Ada set data e-commerce yang tersedia dan memiliki jutaan kumpulan data Google Analytics untuk Google Merchandise Store yang dimuat ke BigQuery. Di lab ini, Anda akan menggunakan data tersebut untuk membuat model yang dapat memprediksi apakah pengunjung akan melakukan transaksi atau tidak.
Yang akan Anda pelajari
Di lab ini, Anda akan mempelajari cara:
- Membuat set data BigQuery
- Membuat, mengevaluasi, dan menggunakan model machine learning di BigQuery
Prasyarat
Untuk mengoptimalkan pembelajaran, Anda harus memiliki pengetahuan dasar tentang SQL atau BigQuery.
Penyiapan dan persyaratan
Sebelum mengklik tombol Mulai Lab
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer, yang dimulai saat Anda mengklik Start Lab, akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab praktik ini dapat Anda gunakan untuk melakukan sendiri aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
- Akses ke browser internet standar (disarankan browser Chrome).
- Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Cara memulai lab dan login ke Google Cloud Console
-
Klik tombol Start Lab. Jika Anda perlu membayar lab, jendela pop-up akan terbuka untuk memilih metode pembayaran. Di sebelah kiri adalah panel Lab Details dengan info berikut:
- Tombol Open Google Cloud console
- Waktu tersisa
- Kredensial sementara yang harus Anda gunakan untuk lab ini
- Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
-
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account. -
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
{{{user_0.username | "Username"}}} Anda juga dapat menemukan Username di panel Lab Details.
-
Klik Next.
-
Salin Password di bawah dan tempel ke dialog Welcome.
{{{user_0.password | "Password"}}} Anda juga dapat menemukan Password di panel Lab Details.
-
Klik Next.
Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda. Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan. -
Klik halaman berikutnya:
- Setujui persyaratan dan ketentuan.
- Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
- Jangan mendaftar uji coba gratis.
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Membuka konsol BigQuery
- Di Google Cloud Console, pilih Navigation menu > BigQuery.
Kotak pesan Welcome to BigQuery in the Cloud Console akan terbuka. Kotak pesan ini menyediakan link ke panduan memulai dan catatan rilis.
- Klik Done.
Konsol BigQuery terbuka.
Tugas 1. Membuat set data
- Untuk membuat set data, klik ikon View actions di sebelah project ID lalu pilih Create dataset.
- Selanjutnya, gunakan
bqml_lab
sebagai nama atas Dataset ID, lalu klik Create dataset.
Menguji tugas yang sudah selesai
Klik Check my progress untuk memverifikasi tugas yang telah diselesaikan. Jika berhasil menyelesaikan tugas ini, Anda akan diberi skor penilaian.
Tugas 2. Membuat model
Sekarang, lanjutkan ke tugas Anda.
- Buka EDITOR BigQuery, ketik atau tempelkan kueri berikut untuk membuat model yang dapat memprediksi apakah pengunjung akan melakukan transaksi atau tidak:
- Klik RUN.
Di sini, sistem operasi perangkat pengunjung akan digunakan untuk mendapatkan informasi, seperti, katakanlah perangkat adalah perangkat seluler, negara pengunjung, dan jumlah tampilan halaman yang kemudian digunakan sebagai kriteria untuk menentukan apakah transaksi telah dilakukan.
Dalam hal ini, bqml_lab
adalah nama set data dan sample_model
adalah nama model. Jenis model yang ditentukan adalah regresi logistik biner. Dalam hal ini, label
adalah sesuatu yang ingin Anda sesuaikan.
input_label_cols
.
Data pelatihan dibatasi pada data yang dikumpulkan dari tanggal 1 Agustus 2016 hingga 30 Juni 2017. Hal ini dilakukan agar dapat menyimpan data bulan terakhir untuk “prediksi”. Selanjutnya data dibatasi hingga 100.000 titik data untuk menghemat waktu.
Menjalankan perintah CREATE MODEL
akan membuat Tugas Kueri berjalan secara asinkron sehingga Anda dapat, misalnya, menutup atau memuat ulang jendela UI BigQuery.
Menguji tugas yang sudah selesai
Klik Check my progress untuk memverifikasi tugas yang telah diselesaikan. Jika berhasil menyelesaikan tugas ini, Anda akan diberi skor penilaian.
(Opsional) Informasi model & statistik pelatihan
Jika tertarik, Anda bisa mendapatkan informasi model dengan memperluas set data bqml_lab
lalu mengklik model sample_model
di UI. Di bawah tab Details, Anda akan menemukan beberapa informasi model dasar dan opsi pelatihan yang digunakan untuk menghasilkan model. Di bagian Training, Anda akan melihat tabel atau grafik, tergantung pada setelan View as Anda:
Tugas 3. Mengevaluasi model
- Ganti kueri sebelumnya dengan kueri berikut, lalu klik Run:
Jika digunakan bersama model regresi linear, kueri di atas akan menghasilkan kolom berikut:
-
mean_absolute_error
,mean_squared_error
,mean_squared_log_error
, -
median_absolute_error
,r2_score
,explained_variance
.
Jika digunakan dengan model regresi logistik, kueri di atas akan menghasilkan kolom berikut:
-
precision
,recall
-
accuracy
,f1_score
-
log_loss
,roc_auc
Harap baca glosarium machine learning atau jalankan penelusuran dengan Google untuk memahami cara menghitung masing-masing metrik ini beserta artinya.
Anda akan menyadari bagian SELECT
dan FROM
pada kueri identik dengan yang digunakan selama pelatihan. Bagian WHERE
mencerminkan perubahan jangka waktu dan bagian FROM
menunjukkan bahwa Anda memanggil ml.EVALUATE
.
Anda akan melihat tabel yang mirip dengan yang berikut:
Menguji tugas yang sudah selesai
Klik Check my progress untuk memverifikasi tugas yang telah diselesaikan. Jika berhasil menyelesaikan tugas ini, Anda akan diberi skor penilaian.
Tugas 4. Menggunakan model
Memprediksi pembelian per negara
Dengan kueri ini, Anda akan mencoba memprediksi jumlah transaksi yang dilakukan oleh pengunjung dari setiap negara, mengurutkan hasilnya, dan memilih 10 negara teratas berdasarkan pembelian:
- Ganti kueri sebelumnya dengan kueri berikut, lalu klik Run:
Kueri ini sangat mirip dengan kueri evaluasi yang ditunjukkan di bagian sebelumnya. Sebagai ganti ml.EVALUATE
, Anda menggunakan ml.PREDICT
dan bagian BigQuery ML dari kueri digabungkan dengan perintah SQL standar. Untuk lab ini, Anda tertarik pada negara dan jumlah pembelian di setiap negara, jadi itulah alasannya menggunakan SELECT
, GROUP BY
, dan ORDER BY
. LIMIT
digunakan untuk memastikan Anda hanya mendapatkan 10 hasil teratas.
Anda akan melihat tabel yang mirip dengan yang berikut:
Menguji tugas yang sudah selesai
Klik Check my progress untuk memverifikasi tugas yang telah diselesaikan. Jika berhasil menyelesaikan tugas ini, Anda akan diberi skor penilaian.
Memprediksi pembelian per pengguna
Berikut adalah contoh lainnya. Kali ini Anda akan mencoba memprediksi jumlah transaksi yang dilakukan oleh masing-masing pengunjung, mengurutkan hasilnya, dan memilih 10 pengunjung teratas berdasarkan transaksi:
- Ganti kueri sebelumnya dengan kueri berikut, lalu klik Run:
Anda akan melihat tabel yang mirip dengan yang berikut:
Menguji tugas yang sudah selesai
Klik Check my progress untuk memverifikasi tugas yang telah diselesaikan. Jika berhasil menyelesaikan tugas ini, Anda akan diberi skor penilaian.
Tugas 5. Menguji pemahaman Anda
Di bawah ini terdapat pertanyaan pilihan ganda untuk memperkuat pemahaman Anda tentang konsep lab ini. Jawab pertanyaan tersebut sebaik mungkin.
Selamat!
Anda telah menggunakan BigQuery ML untuk membuat model regresi logistik biner, mengevaluasi model, dan menggunakan model untuk membuat prediksi.
Langkah berikutnya/Pelajari lebih lanjut
- Untuk mengetahui informasi selengkapnya tentang BigQuery ML, lihat dokumentasi.
- Punya akun Google Analytics dan ingin melakukan kueri set data Anda sendiri di BigQuery? Ikuti panduan ekspor ini.
- Panduan referensi BigQuery SQL yang lengkap ada di sini sebagai referensi tambahan: https://cloud.google.com/bigquery/docs/reference/standard-sql/query-syntax
Sertifikasi dan pelatihan Google Cloud
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui pada 22 Februari 2024
Lab Terakhir Diuji pada 22 Februari 2024
Hak cipta 2024 Google LLC Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.