Checkpoint
Create a new dataset to store the tables
/ 25
Explore the product sentiment dataset
/ 25
Join datasets to find insights
/ 25
Append additional records
/ 25
Membuat Data Warehouse Melalui Join dan Union
GSP413
Ringkasan
BigQuery adalah database analisis yang terkelola sepenuhnya, tanpa pengoperasian (NoOps), dan hemat biaya dari Google. Dengan BigQuery, Anda dapat mengkueri data berskala terabyte tanpa perlu mengelola infrastruktur atau memiliki administrator database. BigQuery menggunakan SQL dan dapat memanfaatkan model bayar sesuai penggunaan. Dengan BigQuery, Anda dapat berfokus pada analisis data untuk menemukan insight yang bermakna.
Set data yang akan Anda gunakan adalah set data e-commerce yang memiliki jutaan kumpulan data Google Analytics dari Google Merchandise Store. Anda akan mempelajari kolom dan baris yang tersedia untuk mendapatkan insight.
Lab ini berfokus pada cara membuat tabel pelaporan baru menggunakan JOIN dan UNION SQL.
Skenario: Tim pemasaran memberi Anda dan tim data science semua ulasan produk untuk situs e-commerce Anda. Anda bekerja sama dengan mereka untuk membuat data warehouse di BigQuery yang menggabungkan data dari tiga sumber:
- Data e-commerce situs
- Tingkat stok inventaris produk dan lama pengerjaan
- Analisis sentimen ulasan produk
Yang akan Anda lakukan
Di lab ini, Anda akan mempelajari cara melakukan tugas berikut:
- Menjelajahi data e-commerce baru tentang analisis sentimen.
- Menggabungkan set data dan membuat tabel baru.
- Menambahkan data historis dengan union dan karakter pengganti tabel.
Penyiapan dan persyaratan
Sebelum mengklik tombol Mulai Lab
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer, yang dimulai saat Anda mengklik Start Lab, akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab praktik ini dapat Anda gunakan untuk melakukan sendiri aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
- Akses ke browser internet standar (disarankan browser Chrome).
- Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Cara memulai lab dan login ke Google Cloud Console
-
Klik tombol Start Lab. Jika Anda perlu membayar lab, jendela pop-up akan terbuka untuk memilih metode pembayaran. Di sebelah kiri adalah panel Lab Details dengan info berikut:
- Tombol Open Google Cloud console
- Waktu tersisa
- Kredensial sementara yang harus Anda gunakan untuk lab ini
- Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
-
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account. -
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
{{{user_0.username | "Username"}}} Anda juga dapat menemukan Username di panel Lab Details.
-
Klik Next.
-
Salin Password di bawah dan tempel ke dialog Welcome.
{{{user_0.password | "Password"}}} Anda juga dapat menemukan Password di panel Lab Details.
-
Klik Next.
Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda. Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan. -
Klik halaman berikutnya:
- Setujui persyaratan dan ketentuan.
- Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
- Jangan mendaftar uji coba gratis.
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Membuka konsol BigQuery
- Di Google Cloud Console, pilih Navigation menu > BigQuery.
Kotak pesan Welcome to BigQuery in the Cloud Console akan terbuka. Kotak pesan ini menyediakan link ke panduan memulai dan catatan rilis.
- Klik Done.
Konsol BigQuery terbuka.
Tugas 1. Membuat set data baru untuk menyimpan tabel
Untuk memulai, buat set data baru berjudul ecommerce di BigQuery untuk menyimpan tabel.
-
Di panel kiri, klik nama project BigQuery Anda (
qwiklabs-gcp-xxxx
). -
Klik ikon tiga titik di samping nama project, lalu pilih Create dataset.
Dialog Create dataset akan terbuka.
-
Tetapkan Dataset ID ke
ecommerce
, biarkan semua opsi lain tetap pada nilai defaultnya. -
Klik Create dataset.
Klik Check my progress untuk memverifikasi tujuan.
Tugas 2. Menjelajahi set data sentimen produk
Tim data science telah menganalisis semua ulasan produk Anda melalui API serta memberikan skor sentimen rata-rata dan besarnya sentimen untuk setiap produk Anda.
Project dengan set data tim pemasaran Anda adalah data-to-insights. Set data publik BigQuery tidak ditampilkan secara default di BigQuery. Kueri di lab ini akan menggunakan set data data-to-insights
meskipun Anda tidak dapat melihatnya.
- Pertama, buat salinan tabel yang dibuatkan oleh tim data science agar Anda dapat membacanya:
data-to-insights
.- Klik set data ecommerce untuk menampilkan tabel
products
.
Memeriksa data menggunakan tab Preview dan Schema
- Buka set data ecommerce > products, lalu klik tab Preview untuk melihat data.
- Klik tab Schema.
Membuat kueri yang menampilkan 5 produk teratas dengan sentimen paling positif
- Di Editor Kueri, tulis kueri SQL Anda.
Kemungkinan solusi:
- Revisi kueri agar menampilkan 5 produk teratas dengan sentimen paling negatif dan mengecualikan nilai NULL.
Kemungkinan solusi:
Apa produk dengan sentimen paling rendah?
Klik Check my progress untuk memverifikasi tujuan.
Tugas 3. Menggabungkan set data untuk menemukan insight
Skenario: Pada awal bulan, tim inventaris memberi tahu Anda bahwa kolom orderedQuantity
di set data inventaris produk perlu diperbarui. Mereka perlu bantuan Anda untuk mengkueri total penjualan per produk untuk 01/08/2017 dan membandingkannya dengan jumlah stok saat ini di inventaris untuk melihat produk mana yang perlu diisi ulang stoknya terlebih dahulu.
Menghitung volume penjualan harian berdasarkan productSKU
- Buat tabel baru di set data ecommerce dengan persyaratan di bawah:
- Beri judul
sales_by_sku_20170801
- Ambil data dari
data-to-insights.ecommerce.all_sessions_raw
- Sertakan hanya hasil unik
- Tampilkan
productSKU
- Tampilkan jumlah total yang dipesan (
productQuantity
). Petunjuk: Gunakan kondisiSUM() with a IFNULL
- Filter untuk penjualan pada
20170801
saja -
ORDER BY
(Urutkan menurut) SKU dengan pesanan terbanyak ditampilkan lebih dahulu
Kemungkinan solusi:
- Klik tabel
sales_by_sku
, lalu klik tab Preview.
Berapa banyak SKU produk unik yang terjual?
Jawaban: 462
Selanjutnya, perkaya data penjualan Anda dengan informasi inventaris produk dengan menggabungkan kedua set data.
Menggabungkan data penjualan dan data inventaris
- Dengan JOIN, perkaya data e-commerce situs dengan kolom berikut dari set data inventaris produk:
name
stockLevel
restockingLeadTime
sentimentScore
sentimentMagnitude
- Lengkapi kueri yang baru ditulis sebagian berikut:
Kemungkinan solusi:
- Ubah kueri yang telah Anda tulis untuk menyertakan:
- Kolom kalkulasi (
total_ordered / stockLevel
) dan beri alias "ratio
". Petunjuk: GunakanSAFE_DIVIDE(field1,field2)
untuk menghindari error pembagian dengan 0 saat jumlah stok 0. - Filter hasil agar hanya menyertakan produk yang telah menghabiskan 50% atau lebih inventarisnya pada awal bulan
Kemungkinan solusi:
Klik Check my progress untuk memverifikasi tujuan.
Tugas 4. Menambahkan kumpulan data
Tim internasional telah melakukan penjualan di toko pada 02/08/2017, dan Anda ingin mencatatnya ke dalam tabel penjualan harian.
Membuat tabel kosong baru untuk menyimpan penjualan berdasarkan productSKU untuk 02/08/2017
- Untuk skema ini, tentukan kolom berikut:
- nama tabel
ecommerce.sales_by_sku_20170802
productSKU STRING
-
total_ordered
sebagai kolomINT64
Kemungkinan solusi:
- Konfirmasi bahwa sekarang Anda memiliki dua tabel penjualan bertanggal sama—gunakan menu dropdown di samping nama tabel Sales_by_sku dalam hasil tabel, atau refresh browser untuk melihat tabel tersebut tercantum di menu kiri:
- Masukkan kumpulan data penjualan yang diberikan kepada Anda oleh tim penjualan:
- Pastikan kumpulan data tersebut muncul dengan melihat pratinjau tabel—klik nama tabel untuk melihat hasil.
Menambahkan data historis secara gabungan
Ada beberapa cara untuk menambahkan data yang memiliki skema sama secara gabungan. Dua cara yang umum adalah menggunakan UNION dan karakter pengganti tabel.
- Union adalah operator SQL yang menggabungkan baris dari kumpulan hasil berbeda.
- Karakter pengganti tabel memungkinkan Anda mengkueri banyak tabel menggunakan pernyataan SQL ringkas. Tabel karakter pengganti hanya tersedia di SQL standar.
- Tulis kueri UNION yang akan menghasilkan semua kumpulan data dari dua tabel di bawah:
ecommerce.sales_by_sku_20170801
ecommerce.sales_by_sku_20170802
UNION
dan UNION ALL
adalah UNION
tidak akan menyertakan kumpulan data duplikat.Apa kelemahan memiliki banyak tabel penjualan harian? Anda harus menulis banyak pernyataan UNION
yang dirangkai jadi satu.
Solusi yang lebih baik adalah menggunakan filter karakter pengganti tabel dan filter _TABLE_SUFFIX
.
- Tulis kueri yang menggunakan karakter pengganti tabel (*) untuk memilih semua kumpulan data dari
ecommerce.sales_by_sku_
untuk tahun 2017.
Kemungkinan solusi:
- Ubah kueri sebelumnya untuk menambahkan filter guna membatasi hasil sehingga untuk 02/08/2017 saja.
Kemungkinan solusi:
Klik Check my progress untuk memverifikasi tujuan.
Selamat!
Anda telah menjelajahi contoh data e-commerce dengan membuat tabel pelaporan, kemudian memanipulasi tabel virtual menggunakan JOIN dan UNION SQL.
Langkah berikutnya/Pelajari lebih lanjut
- Punya akun Google Analytics dan ingin mengkueri set data Anda sendiri di BigQuery? Ikuti panduan ekspor ini.
- Jika ingin mempelajari lebih lanjut sintaksis SQL untuk JOIN, lihat dokumentasi JOIN BigQuery.
- Coba Google Dataset Search sebagai referensi.
- Pelajari lab lain berikut:
Sertifikasi dan pelatihan Google Cloud
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui: 3 Februari 2024
Lab Terakhir Diuji: 31 Oktober 2023
Hak cipta 2024 Google LLC Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.