arrow_back

Mulai Menggunakan BigQuery ML

Login Gabung
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Mulai Menggunakan BigQuery ML

Lab 45 menit universal_currency_alt No cost show_chart Pengantar
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP247

Lab Mandiri Google Cloud

Ringkasan

BigQuery ML memungkinkan pengguna membuat dan menjalankan model machine learning di BigQuery menggunakan kueri SQL. Tujuannya adalah untuk membuat machine learning tersedia lebih luas dengan memungkinkan praktisi SQL membuat model menggunakan alat yang sudah ada dan untuk meningkatkan kecepatan pengembangan dengan meniadakan kebutuhan akan pemindahan data.

Ada set data e-commerce yang tersedia dan memiliki jutaan kumpulan data Google Analytics untuk Google Merchandise Store yang dimuat ke BigQuery. Di lab ini, Anda akan menggunakan data tersebut untuk membuat model yang dapat memprediksi apakah pengunjung akan melakukan transaksi atau tidak.

Yang akan Anda pelajari

Di lab ini, Anda akan mempelajari cara:

  • Membuat set data BigQuery
  • Membuat, mengevaluasi, dan menggunakan model machine learning di BigQuery

Prasyarat

Untuk mengoptimalkan pembelajaran, Anda harus memiliki pengetahuan dasar tentang SQL atau BigQuery.

Penyiapan dan persyaratan

Sebelum mengklik tombol Mulai Lab

Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer, yang dimulai saat Anda mengklik Start Lab, akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.

Lab praktik ini dapat Anda gunakan untuk melakukan sendiri aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.

Untuk menyelesaikan lab ini, Anda memerlukan:

  • Akses ke browser internet standar (disarankan browser Chrome).
Catatan: Gunakan jendela Samaran atau browser pribadi untuk menjalankan lab ini. Hal ini akan mencegah konflik antara akun pribadi Anda dan akun Siswa yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.
  • Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Catatan: Jika Anda sudah memiliki project atau akun pribadi Google Cloud, jangan menggunakannya untuk lab ini agar terhindar dari tagihan ekstra pada akun Anda.

Cara memulai lab dan login ke Google Cloud Console

  1. Klik tombol Start Lab. Jika Anda perlu membayar lab, jendela pop-up akan terbuka untuk memilih metode pembayaran. Di sebelah kiri adalah panel Lab Details dengan berikut ini:

    • Tombol Open Google Console
    • Waktu tersisa
    • Kredensial sementara yang harus Anda gunakan untuk lab ini
    • Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
  2. Klik Open Google Console. Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Login.

    Tips: Atur tab di jendela terpisah secara berdampingan.

    Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account.
  3. Jika perlu, salin Username dari panel Lab Details dan tempel ke dialog Sign in. Klik Next.

  4. Salin Password dari panel Lab Details dan tempel ke dialog Welcome. Klik Next.

    Penting: Anda harus menggunakan kredensial dari panel sebelah kiri. Jangan menggunakan kredensial Google Cloud Skills Boost. Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan.
  5. Klik halaman berikutnya:

    • Setujui persyaratan dan ketentuan.
    • Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
    • Jangan daftar uji coba gratis.

Setelah beberapa saat, Cloud Console akan terbuka di tab ini.

Catatan: Anda dapat melihat menu dengan daftar Produk dan Layanan Google Cloud dengan mengklik Menu navigasi di kiri atas. Ikon menu navigasi

Membuka konsol BigQuery

  1. Di Google Cloud Console, pilih Navigation menu > BigQuery.

Kotak pesan Welcome to BigQuery in the Cloud Console akan terbuka. Kotak pesan ini menyediakan link ke panduan memulai dan catatan rilis.

  1. Klik Done.

Konsol BigQuery terbuka.

Tugas 1. Membuat set data

  1. Untuk membuat set data, klik ikon View actions di sebelah project ID lalu pilih Create dataset.

Opsi Create dataset

  1. Selanjutnya, gunakan bqml_lab sebagai nama atas Dataset ID, lalu klik Create dataset.

Menguji tugas yang sudah selesai

Klik Check my progress untuk memverifikasi tugas yang telah diselesaikan. Jika berhasil menyelesaikan tugas ini, Anda akan diberi skor penilaian.

Membuat set data BigQuery

Tugas 2. Membuat model

Sekarang, lanjutkan ke tugas Anda.

  1. Buka EDITOR BigQuery, ketik atau tempelkan kueri berikut untuk membuat model yang dapat memprediksi apakah pengunjung akan melakukan transaksi atau tidak:
#standardSQL CREATE OR REPLACE MODEL `bqml_lab.sample_model` OPTIONS(model_type='logistic_reg') AS SELECT IF(totals.transactions IS NULL, 0, 1) AS label, IFNULL(device.operatingSystem, "") AS os, device.isMobile AS is_mobile, IFNULL(geoNetwork.country, "") AS country, IFNULL(totals.pageviews, 0) AS pageviews FROM `bigquery-public-data.google_analytics_sample.ga_sessions_*` WHERE _TABLE_SUFFIX BETWEEN '20160801' AND '20170631' LIMIT 100000;
  1. Klik RUN.

Di sini, sistem operasi perangkat pengunjung akan digunakan untuk mendapatkan informasi, seperti, katakanlah perangkat adalah perangkat seluler, negara pengunjung, dan jumlah tampilan halaman yang kemudian digunakan sebagai kriteria untuk menentukan apakah transaksi telah dilakukan.

Dalam hal ini, bqml_lab adalah nama set data dan sample_model adalah nama model. Jenis model yang ditentukan adalah regresi logistik biner. Dalam hal ini, label adalah sesuatu yang ingin Anda sesuaikan.

Catatan: Jika Anda hanya ingin melihat 1 kolom, cara ini adalah cara alternatif untuk menetapkan input_label_cols.

Data pelatihan dibatasi pada data yang dikumpulkan dari tanggal 1 Agustus 2016 hingga 30 Juni 2017. Hal ini dilakukan agar dapat menyimpan data bulan terakhir untuk “prediksi”. Selanjutnya data dibatasi hingga 100.000 titik data untuk menghemat waktu.

Menjalankan perintah CREATE MODEL akan membuat Tugas Kueri berjalan secara asinkron sehingga Anda dapat, misalnya, menutup atau memuat ulang jendela UI BigQuery.

Menguji tugas yang sudah selesai

Klik Check my progress untuk memverifikasi tugas yang telah diselesaikan. Jika berhasil menyelesaikan tugas ini, Anda akan diberi skor penilaian.

Membuat model untuk memprediksi transaksi pengunjung

(Opsional) Informasi model & statistik pelatihan

Jika tertarik, Anda bisa mendapatkan informasi model dengan memperluas set data bqml_lab lalu mengklik model sample_model di UI. Di bawah tab Details, Anda akan menemukan beberapa informasi model dasar dan opsi pelatihan yang digunakan untuk menghasilkan model. Di bagian Training, Anda akan melihat tabel atau grafik, tergantung pada setelan View as Anda:

Tabel pelatihan

Grafik pelatihan

Tugas 3. Mengevaluasi model

  • Ganti kueri sebelumnya dengan kueri berikut, lalu klik Run:
#standardSQL SELECT * FROM ml.EVALUATE(MODEL `bqml_lab.sample_model`, ( SELECT IF(totals.transactions IS NULL, 0, 1) AS label, IFNULL(device.operatingSystem, "") AS os, device.isMobile AS is_mobile, IFNULL(geoNetwork.country, "") AS country, IFNULL(totals.pageviews, 0) AS pageviews FROM `bigquery-public-data.google_analytics_sample.ga_sessions_*` WHERE _TABLE_SUFFIX BETWEEN '20170701' AND '20170801'));

Jika digunakan bersama model regresi linear, kueri di atas akan menghasilkan kolom berikut:

  • mean_absolute_error, mean_squared_error, mean_squared_log_error,
  • median_absolute_error, r2_score, explained_variance.

Jika digunakan dengan model regresi logistik, kueri di atas akan menghasilkan kolom berikut:

  • precision, recall
  • accuracy, f1_score
  • log_loss, roc_auc

Harap baca glosarium machine learning atau jalankan penelusuran dengan Google untuk memahami cara menghitung masing-masing metrik ini beserta artinya.

Anda akan menyadari bagian SELECT dan FROM pada kueri identik dengan yang digunakan selama pelatihan. Bagian WHERE mencerminkan perubahan jangka waktu dan bagian FROM menunjukkan bahwa Anda memanggil ml.EVALUATE.

Anda akan melihat tabel yang mirip dengan yang berikut:

Hasil kueri model regresi logistik

Menguji tugas yang sudah selesai

Klik Check my progress untuk memverifikasi tugas yang telah diselesaikan. Jika berhasil menyelesaikan tugas ini, Anda akan diberi skor penilaian.

Mengevaluasi Model

Tugas 4. Menggunakan model

Memprediksi pembelian per negara

Dengan kueri ini, Anda akan mencoba memprediksi jumlah transaksi yang dilakukan oleh pengunjung dari setiap negara, mengurutkan hasilnya, dan memilih 10 negara teratas berdasarkan pembelian:

  • Ganti kueri sebelumnya dengan kueri berikut, lalu klik Run:
#standardSQL SELECT country, SUM(predicted_label) as total_predicted_purchases FROM ml.PREDICT(MODEL `bqml_lab.sample_model`, ( SELECT IFNULL(device.operatingSystem, "") AS os, device.isMobile AS is_mobile, IFNULL(totals.pageviews, 0) AS pageviews, IFNULL(geoNetwork.country, "") AS country FROM `bigquery-public-data.google_analytics_sample.ga_sessions_*` WHERE _TABLE_SUFFIX BETWEEN '20170701' AND '20170801')) GROUP BY country ORDER BY total_predicted_purchases DESC LIMIT 10;

Kueri ini sangat mirip dengan kueri evaluasi yang ditunjukkan di bagian sebelumnya. Sebagai ganti ml.EVALUATE, Anda menggunakan ml.PREDICT dan bagian BigQuery ML dari kueri digabungkan dengan perintah SQL standar. Untuk lab ini, Anda tertarik pada negara dan jumlah pembelian di setiap negara, jadi itulah alasannya menggunakan SELECT, GROUP BY, dan ORDER BY. LIMIT digunakan untuk memastikan Anda hanya mendapatkan 10 hasil teratas.

Anda akan melihat tabel yang mirip dengan yang berikut:

Sepuluh baris negara dengan total prediksi pembelian yang tercantum untuk setiap negara

Menguji tugas yang sudah selesai

Klik Check my progress untuk memverifikasi tugas yang telah diselesaikan. Jika berhasil menyelesaikan tugas ini, Anda akan diberi skor penilaian.

Memprediksi pembelian per negara

Memprediksi pembelian per pengguna

Berikut adalah contoh lainnya. Kali ini Anda akan mencoba memprediksi jumlah transaksi yang dilakukan oleh masing-masing pengunjung, mengurutkan hasilnya, dan memilih 10 pengunjung teratas berdasarkan transaksi:

  • Ganti kueri sebelumnya dengan kueri berikut, lalu klik Run:
#standardSQL SELECT fullVisitorId, SUM(predicted_label) as total_predicted_purchases FROM ml.PREDICT(MODEL `bqml_lab.sample_model`, ( SELECT IFNULL(device.operatingSystem, "") AS os, device.isMobile AS is_mobile, IFNULL(totals.pageviews, 0) AS pageviews, IFNULL(geoNetwork.country, "") AS country, fullVisitorId FROM `bigquery-public-data.google_analytics_sample.ga_sessions_*` WHERE _TABLE_SUFFIX BETWEEN '20170701' AND '20170801')) GROUP BY fullVisitorId ORDER BY total_predicted_purchases DESC LIMIT 10;

Anda akan melihat tabel yang mirip dengan yang berikut:

Sepuluh baris fullVisitorId dengan total prediksi pembelian yang tercantum untuk setiap pengunjung

Menguji tugas yang sudah selesai

Klik Check my progress untuk memverifikasi tugas yang telah diselesaikan. Jika berhasil menyelesaikan tugas ini, Anda akan diberi skor penilaian.

Memprediksi pembelian per pengguna

Tugas 5. Menguji pemahaman Anda

Di bawah ini terdapat pertanyaan pilihan ganda untuk memperkuat pemahaman Anda tentang konsep lab ini. Jawab pertanyaan tersebut sebaik mungkin.

Selamat!

Anda telah menggunakan BigQuery ML untuk membuat model regresi logistik biner, mengevaluasi model, dan menggunakan model untuk membuat prediksi.

Langkah berikutnya/Pelajari lebih lanjut

Sertifikasi dan pelatihan Google Cloud

...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.

Manual Terakhir Diperbarui pada 22 Februari 2024

Lab Terakhir Diuji pada 22 Februari 2024

Hak cipta 2024 Google LLC Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.