Di lab ini, Anda memiliki armada taksi New York City dan ingin memantau seberapa baik performa bisnis Anda secara real-time. Anda membangun streaming data pipeline untuk melihat pendapatan taksi, jumlah penumpang, status perjalanan, dan masih banyak lagi, lalu memvisualisasikan hasilnya di dasbor pengelolaan.
Tujuan
Di lab ini, Anda akan mempelajari cara:
Membuat tugas Dataflow dari template
Mengalirkan pipeline Dataflow ke BigQuery
Memantau pipeline Dataflow di BigQuery
Menganalisis hasil dengan SQL
Memvisualisasikan metrik utama di Looker Studio
Penyiapan dan persyaratan
Untuk setiap lab, Anda akan memperoleh project Google Cloud baru serta serangkaian resource selama jangka waktu tertentu, tanpa biaya.
Klik tombol Start Lab. Jika Anda perlu membayar lab, jendela pop-up akan terbuka untuk memilih metode pembayaran.
Di sebelah kiri adalah panel Lab Details yang memuat sebagai berikut:
Tombol Open Google Cloud console
Waktu tersisa
Kredensial sementara yang harus Anda gunakan untuk lab ini
Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account.
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
{{{user_0.username | "Username"}}}
Anda juga dapat menemukan Username di panel Lab Details.
Klik Next.
Salin Password di bawah dan tempel ke dialog Welcome.
{{{user_0.password | "Password"}}}
Anda juga dapat menemukan Password di panel Lab Details.
Klik Next.
Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda.
Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan.
Klik halaman berikutnya:
Setujui persyaratan dan ketentuan.
Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
Jangan mendaftar uji coba gratis.
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Catatan: Untuk melihat menu yang berisi daftar produk dan layanan Google Cloud, klik Navigation menu di kiri atas, atau ketik nama layanan atau produk di kolom Search.
Mengaktifkan Google Cloud Shell
Google Cloud Shell adalah virtual machine yang dilengkapi dengan berbagai fitur pengembangan. Virtual machine ini menawarkan direktori beranda persisten berkapasitas 5 GB dan berjalan di Google Cloud.
Google Cloud Shell menyediakan akses command line untuk resource Google Cloud Anda.
Di Cloud Console, pada toolbar di kanan atas, klik tombol Open Cloud Shell.
Klik Continue.
Proses menyediakan dan menghubungkan ke lingkungan memerlukan waktu beberapa saat. Setelah terhubung, Anda sudah diautentikasi, dan project ditetapkan ke PROJECT_ID Anda. Contoh:
gcloud adalah alat command line untuk Google Cloud. Alat ini sudah terinstal di Cloud Shell dan mendukung pelengkapan command line.
Anda dapat menampilkan daftar nama akun yang aktif dengan perintah ini:
Dalam tugas ini, Anda membuat set data taxirides. Anda memiliki dua pilihan berbeda yang dapat digunakan untuk membuat set data ini, yaitu dengan menggunakan Google Cloud Shell atau Konsol Google Cloud.
BigQuery adalah data warehouse serverless. Tabel di BigQuery disusun menjadi set data. Di lab ini, data taksi akan mengalir dari file mandiri melalui Dataflow untuk disimpan di BigQuery. Dengan konfigurasi ini, tiap file data baru yang disimpan ke dalam bucket Cloud Storage sumber akan otomatis diproses untuk dimuat.
Gunakan salah satu opsi berikut untuk membuat set data BigQuery baru:
Opsi 1: Alat command line
Di Cloud Shell (), jalankan perintah berikut untuk membuat set data taxirides.
Di Partition and cluster settings, pilih timestamp.
Klik Create Table.
Tugas 2. Menyalin artefak lab yang diperlukan
Dalam tugas ini, Anda akan memindahkan file yang diperlukan ke Project Anda.
Cloud Storage dapat digunakan untuk menyimpan dan mengambil data di seluruh dunia, berapa pun ukurannya, kapan pun waktunya. Anda dapat menggunakan Cloud Storage untuk berbagai skenario, termasuk menyajikan konten situs, menyimpan data untuk pengarsipan dan pemulihan dari bencana, atau mendistribusikan objek data besar kepada pengguna melalui download langsung.
Bucket Cloud Storage dibuat untuk Anda saat lab dimulai.
Di Cloud Shell (), jalankan perintah berikut untuk memindahkan file yang dibutuhkan untuk tugas Dataflow.
Tugas streaming baru telah dimulai. Kini Anda dapat melihat representasi visual dari data pipeline. Diperlukan waktu 3 sampai 5 menit agar data mulai dipindahkan ke BigQuery.
Catatan: Jika tugas Dataflow gagal untuk pertama kalinya, buat ulang template tugas baru dengan nama tugas baru dan jalankan tugas tersebut.
Tugas 4. Menganalisis data taksi menggunakan BigQuery
Dalam tugas ini, Anda akan menganalisis data yang sedang dialirkan.
Di Konsol Cloud, pada Navigation menu (), klik BigQuery.
Jika dialog Selamat Datang muncul, klik Done.
Di Editor Kueri, ketik perintah berikut, lalu klik Run:
SELECT * FROM taxirides.realtime LIMIT 10
Catatan: Jika tidak ada kumpulan data yang ditampilkan, tunggu sejenak dan jalankan kembali kueri di atas (Dataflow memerlukan waktu 3-5 menit untuk menyiapkan aliran data).
Output Anda akan terlihat seperti berikut:
Tugas 5. Melakukan agregasi pada aliran data untuk pelaporan
Dalam tugas ini, Anda akan menghitung agregasi pada aliran data untuk pelaporan.
Di Query Editor, hapus kueri saat ini.
Salin dan tempel kueri berikut, lalu klik Run.
WITH streaming_data AS (
SELECT
timestamp,
TIMESTAMP_TRUNC(timestamp, HOUR, 'UTC') AS hour,
TIMESTAMP_TRUNC(timestamp, MINUTE, 'UTC') AS minute,
TIMESTAMP_TRUNC(timestamp, SECOND, 'UTC') AS second,
ride_id,
latitude,
longitude,
meter_reading,
ride_status,
passenger_count
FROM
taxirides.realtime
ORDER BY timestamp DESC
LIMIT 1000
)
# calculate aggregations on stream for reporting:
SELECT
ROW_NUMBER() OVER() AS dashboard_sort,
minute,
COUNT(DISTINCT ride_id) AS total_rides,
SUM(meter_reading) AS total_revenue,
SUM(passenger_count) AS total_passengers
FROM streaming_data
GROUP BY minute, timestamp
Catatan: Pastikan Dataflow mendaftarkan data di BigQuery sebelum berlanjut ke tugas berikutnya.
Hasilnya menunjukkan metrik utama per menit untuk tiap pemberhentian taksi.
Klik Save > Save query.
Dalam dialog Save query, pada kolom Name, ketik My Saved Query.
Di Region, pastikan region cocok dengan Region Lab Qwiklabs.
Klik Save.
Tugas 6. Menghentikan Tugas Dataflow
Dalam tugas ini, Anda akan menghentikan tugas Dataflow guna mengosongkan resource untuk project Anda.
Di Konsol Cloud, pada Navigation menu (), klik View all Products > Analytics > Dataflow.
Klik streaming-taxi-pipeline, atau nama tugas yang baru.
Klik Stop, lalu pilih Cancel > Stop Job.
Tugas 7. Membuat dasbor real-time
Dalam tugas ini, Anda akan membuat dasbor real-time untuk memvisualisasikan data.
Di Konsol Cloud, pada Navigation menu (), klik BigQuery.
Di panel Explorer, luaskan Project ID Anda.
Luaskan Queries, lalu klik My Saved Query.
Permintaan Anda akan dimuat ke dalam editor kueri.
Klik Run.
Di bagian Query results, klik Open in > Looker Studio.
Looker Studio akan terbuka. Klik Get started.
Di jendela Looker Studio, klik diagram batang Anda.
(
Panel Diagram akan muncul.
Klik Add a chart, lalu pilih Combo chart.
Di panel Setup, pada Data Range Dimension, arahkan kursor ke minute (Date), lalu klik X untuk menghapusnya.
Di panel Data, klik dashboard_sort dan seret ke Setup > Data Range Dimension > Add dimension.
Di Setup > Dimension, klik minute, lalu pilih dashboard_sort.
Di Setup > Metric, klik dashboard_sort, lalu pilih total_rides.
Di Setup > Metric, klik Record Count, lalu pilih total_passengers.
Di Setup > Metric, klik Add metric, lalu pilih total_revenue.
Di Setup > Sort, klik total_rides, lalu pilih dashboard_sort.
Di Setup > Sort, klik Ascending.
Diagram Anda akan terlihat seperti ini:
Catatan: Memvisualisasikan data pada level menit saat ini tidak didukung di Looker Studio sebagai stempel waktu. Inilah sebabnya kita membuat dimensi dashboard_sort kita sendiri.
Jika sudah puas dengan dasbor Anda, klik Save and share untuk menyimpan sumber data ini.
Jika diminta untuk menyelesaikan penyiapan akun Anda, ketik informasi negara dan perusahaan Anda, setujui persyaratan dan ketentuan, lalu klik Continue.
Jika ditanya pembaruan mana yang ingin Anda terima, jawab no untuk semua, lalu klik Continue.
Jika muncul jendela permintaan Review data access before saving, klik Acknowledge and save.
Jika diminta untuk memilih akun, pilih Student Account Anda.
Kapan pun seseorang mengunjungi dasbor Anda, dasbor tersebut akan diperbarui dengan transaksi terbaru. Anda dapat mencobanya sendiri dengan mengklik More options (), lalu Refresh data.
Tugas 8. Membuat dasbor deret waktu
Dalam tugas ini, Anda akan membuat diagram deret waktu.
Klik link Looker Studio ini untuk membuka Looker Studio di tab browser baru.
Di halaman Reports, di bagian Start with a Template, klik template [+] Blank Report.
Laporan baru yang kosong akan terbuka dengan jendela Add data to report.
Dari daftar Google Connectors, pilih tile BigQuery.
Klik Custom Query, lalu pilih ProjectID Anda. Project ID tersebut akan muncul dalam format berikut, qwiklabs-gcp-xxxxxxx.
Di bagian Enter Custom Query, tempelkan kueri berikut:
SELECT
*
FROM
taxirides.realtime
WHERE
ride_status='enroute'
Klik Add > Add To Report.
Laporan baru tanpa judul akan muncul. Mungkin butuh waktu beberapa saat hingga layar selesai dimuat ulang.
Membuat diagram deret waktu
Di panel Data, klik Add a Field > Add calculated field.
Klik All Fields di sudut sebelah kiri.
Ubah jenis kolom timestamp menjadi Date & Time > Date Hour Minute (YYYYMMDDhhmm).
Dalam dialog change timestamp, klik Continue, lalu klik Done.
Di menu teratas, klik Add a chart.
Pilih Time series chart.
Letakkan diagram di sudut kiri bawah, di ruang kosong.
Di Setup > Dimension, klik timestamp (Date), lalu pilih
timestamp.
Di Setup > Dimension, klik timestamp, lalu pilih calendar.
Di Data Type, pilih Date & Time > Date Hour Minute.
Klik di luar dialog untuk menutupnya. Anda tidak perlu menambahkan nama.
Di Setup > Metric, klik Record Count, lalu pilih meter reading.
Selamat!
Di lab ini, Anda berhasil menggunakan Dataflow untuk mengalirkan data melalui pipeline ke BigQuery.
Mengakhiri lab Anda
Setelah Anda menyelesaikan lab, klik Akhiri Lab. Google Cloud Skills Boost menghapus resource yang telah Anda gunakan dan membersihkan akun.
Anda akan diberi kesempatan untuk menilai pengalaman menggunakan lab. Pilih jumlah bintang yang sesuai, ketik komentar, lalu klik Submit.
Makna jumlah bintang:
1 bintang = Sangat tidak puas
2 bintang = Tidak puas
3 bintang = Netral
4 bintang = Puas
5 bintang = Sangat puas
Anda dapat menutup kotak dialog jika tidak ingin memberikan masukan.
Untuk masukan, saran, atau koreksi, gunakan tab Support.
Hak cipta 2024 Google LLC. Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.
Lab membuat project dan resource Google Cloud untuk jangka waktu tertentu
Lab memiliki batas waktu dan tidak memiliki fitur jeda. Jika lab diakhiri, Anda harus memulainya lagi dari awal.
Di kiri atas layar, klik Start lab untuk memulai
Gunakan penjelajahan rahasia
Salin Nama Pengguna dan Sandi yang diberikan untuk lab tersebut
Klik Open console dalam mode pribadi
Login ke Konsol
Login menggunakan kredensial lab Anda. Menggunakan kredensial lain mungkin menyebabkan error atau dikenai biaya.
Setujui persyaratan, dan lewati halaman resource pemulihan
Jangan klik End lab kecuali jika Anda sudah menyelesaikan lab atau ingin mengulanginya, karena tindakan ini akan menghapus pekerjaan Anda dan menghapus project
Konten ini tidak tersedia untuk saat ini
Kami akan memberi tahu Anda melalui email saat konten tersedia
Bagus!
Kami akan menghubungi Anda melalui email saat konten tersedia
Satu lab dalam satu waktu
Konfirmasi untuk mengakhiri semua lab yang ada dan memulai lab ini
Gunakan penjelajahan rahasia untuk menjalankan lab
Gunakan jendela Samaran atau browser pribadi untuk menjalankan lab ini. Langkah ini akan mencegah konflik antara akun pribadi Anda dan akun Siswa yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.
Ingin membangun aliran pipeline data ke dasbor pengelolaan? Di lab, ini Anda akan membangun pipeline yang mengalirkan kumpulan data dalam jumlah besar ke BigQuery untuk dianalisis dan divisualisasikan.