
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create a Cloud Storage bucket
/ 50
Run an Example Pipeline Remotely
/ 50
Apache Beam SDK adalah model pemrograman open source untuk pipeline data. Di Google Cloud, Anda dapat menentukan pipeline dengan program Apache Beam, lalu menggunakan Dataflow untuk menjalankan pipeline Anda.
Di lab ini, Anda akan menyiapkan lingkungan pengembangan Python untuk Dataflow (menggunakan Apache Beam SDK untuk Python) dan menjalankan pipeline Dataflow.
Di lab ini, Anda akan mempelajari cara:
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer yang dimulai saat Anda mengklik Start Lab akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab interaktif ini dapat Anda gunakan untuk melakukan aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
Klik tombol Start Lab. Jika Anda perlu membayar lab, dialog akan terbuka untuk memilih metode pembayaran. Di sebelah kiri ada panel Lab Details yang berisi hal-hal berikut:
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
Anda juga dapat menemukan Username di panel Lab Details.
Klik Next.
Salin Password di bawah dan tempel ke dialog Welcome.
Anda juga dapat menemukan Password di panel Lab Details.
Klik Next.
Klik halaman berikutnya:
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Cloud Shell adalah mesin virtual yang dilengkapi dengan berbagai alat pengembangan. Mesin virtual ini menawarkan direktori beranda persisten berkapasitas 5 GB dan berjalan di Google Cloud. Cloud Shell menyediakan akses command-line untuk resource Google Cloud Anda.
Setelah terhubung, Anda sudah diautentikasi, dan project ditetapkan ke PROJECT_ID Anda. Output berisi baris yang mendeklarasikan PROJECT_ID untuk sesi ini:
gcloud
adalah alat command line untuk Google Cloud. Alat ini sudah terinstal di Cloud Shell dan mendukung pelengkapan command line.
Klik Authorize.
Output Anda sekarang akan terlihat seperti ini:
Output:
Output:
Contoh output:
gcloud
yang lengkap di Google Cloud, baca panduan ringkasan gcloud CLI.
Untuk memastikan akses ke API yang diperlukan, mulai ulang koneksi ke Dataflow API.
Di Konsol Cloud, masukkan "Dataflow API" di kotak penelusuran teratas. Klik hasil untuk Dataflow API.
Klik Manage.
Klik Disable API.
Jika diminta untuk mengonfirmasi, klik Disable.
Jika API sudah diaktifkan kembali, halaman akan menampilkan opsi untuk menonaktifkannya.
Saat Anda menjalankan pipeline menggunakan Dataflow, hasilnya akan disimpan di bucket Cloud Storage. Dalam tugas ini, Anda akan membuat bucket Cloud Storage untuk hasil pipeline yang Anda jalankan di tugas berikutnya.
us
Klik Create.
Jika melihat pesan Public access will be prevented, klik Confirm.
Menguji tugas yang sudah selesai
Klik Check my progress untuk memverifikasi tugas yang telah diselesaikan. Jika berhasil menyelesaikan tugas, Anda akan diberi skor penilaian.
Python3.9
:Perintah ini menarik container Docker dengan versi stabil terbaru Python 3.9, lalu membuka shell perintah untuk menjalankan perintah berikut di dalam container.
Anda akan melihat beberapa peringatan yang ditampilkan berkaitan dengan dependensi. Peringatan tersebut aman untuk diabaikan di lab ini.
wordcount.py
secara lokal dengan menjalankan perintah berikut:Anda akan melihat pesan yang mirip dengan yang berikut ini:
Anda dapat mengabaikan pesan ini.
OUTPUT_FILE
:OUTPUT_FILE
dan cat
ke dalamnya:Hasil Anda menampilkan setiap kata dalam file dan frekuensi munculnya kata tersebut.
wordcount.py
dari jarak jauh:Tunggu sampai Anda melihat pesan di output:
Lalu lanjutkan lab.
Di awal, Anda akan melihat tugas wordcount Anda dengan status Running.
Prosesnya selesai saat statusnya Succeeded.
Menguji tugas yang sudah selesai
Klik Check my progress untuk memverifikasi tugas yang telah diselesaikan. Jika berhasil menyelesaikan tugas, Anda akan diberi skor penilaian.
Klik Navigation menu > Cloud Storage di Konsol Cloud.
Klik nama bucket Anda. Di bucket, Anda akan melihat direktori results dan staging.
Klik folder results dan Anda akan melihat file output yang dibuat oleh tugas Anda:
Klik file untuk melihat jumlah katanya:
Berikut ini beberapa pertanyaan pilihan ganda untuk memperkuat pemahaman Anda terhadap konsep lab ini. Jawab pertanyaan tersebut sebaik mungkin.
Anda telah mempelajari cara menyiapkan lingkungan pengembangan Python untuk Dataflow (menggunakan Apache Beam SDK untuk Python) dan menjalankan contoh pipeline Dataflow.
Lab ini merupakan bagian dari rangkaian lab yang disebut Qwik Start. Lab ini dirancang agar Anda dapat mencoba berbagai fitur yang tersedia dengan Google Cloud. Telusuri "Qwik Starts" di katalog Google Cloud Skills Boost untuk menemukan lab berikutnya yang ingin Anda ikuti.
Jika ingin mendapatkan salinan buku Anda sendiri, lab ini didasarkan pada: Data Science on the Google Cloud Platform: O'Reilly Media, Inc.
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui: 4 Februari 2024
Lab Terakhir Diuji: 4 Mei 2023
Hak cipta 2025 Google LLC Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.
Konten ini tidak tersedia untuk saat ini
Kami akan memberi tahu Anda melalui email saat konten tersedia
Bagus!
Kami akan menghubungi Anda melalui email saat konten tersedia
One lab at a time
Confirm to end all existing labs and start this one