
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create a Dataproc cluster
/ 50
Submit a job
/ 30
Update a cluster
/ 20
Dataproc adalah layanan cloud yang cepat, mudah digunakan, dan terkelola sepenuhnya untuk menjalankan cluster Apache Spark dan Apache Hadoop dengan cara yang lebih mudah dan hemat biaya Operasi yang sebelumnya memerlukan waktu berjam-jam atau berhari-hari kini bisa dikerjakan dalam hitungan detik atau menit. Buat cluster Dataproc dengan cepat dan sesuaikan ukurannya kapan saja, sehingga Anda tidak perlu khawatir cluster tidak dapat mengimbangi perkembangan pipeline data Anda.
Lab ini menunjukkan cara menggunakan konsol Google Cloud untuk membuat cluster Dataproc, menjalankan tugas Apache Spark sederhana di cluster, lalu mengubah jumlah worker dalam cluster.
Di lab ini, Anda akan mempelajari cara:
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer yang dimulai saat Anda mengklik Start Lab akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab interaktif ini dapat Anda gunakan untuk melakukan aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
Klik tombol Start Lab. Jika Anda perlu membayar lab, dialog akan terbuka untuk memilih metode pembayaran. Di sebelah kiri ada panel Lab Details yang berisi hal-hal berikut:
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
Anda juga dapat menemukan Username di panel Lab Details.
Klik Next.
Salin Password di bawah dan tempel ke dialog Welcome.
Anda juga dapat menemukan Password di panel Lab Details.
Klik Next.
Klik halaman berikutnya:
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Untuk membuat cluster Dataproc di Google Cloud, Cloud Dataproc API harus diaktifkan. Untuk memastikan bahwa API sudah diaktifkan:
Klik Navigation menu > APIs & Services > Library:
Ketik Cloud Dataproc dalam dialog Search for APIs & Services. Konsol akan menampilkan Cloud Dataproc API dalam hasil penelusuran.
Klik Cloud Dataproc API untuk menampilkan status API. Jika API belum diaktifkan, klik tombol Enable.
Setelah API diaktifkan, lanjutkan dengan petunjuk lab.
Untuk menetapkan izin penyimpanan ke akun layanan yang diperlukan untuk membuat cluster:
Buka Navigation menu > IAM & Admin > IAM.
Klik ikon pensil di akun layanan compute@developer.gserviceaccount.com
.
Klik tombol + ADD ANOTHER ROLE, lalu pilih peran Storage Admin
Setelah Anda memilih peran Storage Admin, klik Save
Di Konsol Cloud Platform, pilih Navigation menu > Dataproc > Clusters, lalu klik Create cluster.
Klik Create untuk Cluster on Compute Engine.
Tetapkan kolom berikut untuk cluster Anda dan terima nilai default untuk semua kolom lainnya:
Kolom | Nilai |
---|---|
Name | example-cluster |
Region | |
Zona | |
Seri Mesin (Manager Node) | E2 |
Jenis Mesin (Manager Node) | e2-standard-2 |
Ukuran disk utama (Manager Node) | 30 GB |
Jumlah Worker Node | 2 |
Seri Mesin (Worker Node) | E2 |
Jenis Mesin (Worker Node) | e2-standard-2 |
Ukuran disk utama (Worker Node) | 30 GB |
Hanya IP internal | Batalkan pilihan "Configure all instances to have only internal IP addresses" |
us-central1
atau europe-west1
, untuk mengisolasi resource (termasuk instance VM dan Cloud Storage) serta lokasi penyimpanan metadata yang digunakan Cloud Dataproc dalam region yang ditentukan oleh pengguna.
Cluster baru akan muncul dalam daftar Clusters. Mungkin butuh waktu beberapa menit untuk membuatnya, Status cluster akan ditampilkan sebagai Provisioning sampai cluster siap digunakan. Status kemudian akan berubah menjadi Running.
Uji tugas yang sudah selesai
Klik Check my progress untuk memverifikasi tugas yang telah dijalankan.
Untuk menjalankan sampel tugas Spark:
Klik Jobs di panel kiri untuk beralih ke tampilan tugas Dataproc, lalu klik Submit job:
Tetapkan kolom berikut untuk memperbarui Job. Setujui nilai default untuk semua kolom lainnya.
Kolom | Nilai |
---|---|
Region | |
Cluster | example-cluster |
Job type | Spark |
Main class or jar | org.apache.spark.examples.SparkPi |
Jar files | file:///usr/lib/spark/examples/jars/spark-examples.jar |
Arguments | 1.000 (Ini menetapkan jumlah tugas.) |
Tugas akan muncul dalam daftar Jobs, yang menampilkan tugas project Anda beserta cluster, jenis, dan status terkini. Status tugas akan ditampilkan sebagai Running, lalu menjadi Succeeded setelah tugas selesai.
Uji tugas yang sudah selesai
Klik Check my progress untuk memverifikasi tugas yang telah dijalankan.
Untuk melihat output tugas yang sudah selesai:
Klik ID pekerjaan di daftar Jobs.
Pilih LINE WRAP ke ON
atau scroll ke ujung kanan untuk melihat nilai Pi yang dihitung. Output Anda, dengan LINE WRAP ON
, akan terlihat seperti ini:
Tugas Anda berhasil menghitung perkiraan nilai untuk pi!
Untuk mengubah jumlah worker instance di cluster:
Pilih Clusters di panel navigasi sebelah kiri untuk kembali ke tampilan Cluster Dataproc.
Klik example-cluster di daftar Clusters. Secara default, halaman tersebut menampilkan ringkasan penggunaan CPU cluster Anda.
Klik Configuration untuk menampilkan setelan cluster Anda saat ini.
Klik Edit. Jumlah worker node kini dapat diedit.
Masukkan 4 di kolom Worker nodes.
Klik Save.
Cluster Anda berhasil diperbarui. Periksa jumlah instance VM dalam cluster.
Uji tugas yang sudah selesai
Klik Check my progress untuk memverifikasi tugas yang telah dijalankan.
Untuk menjalankan kembali tugas dengan cluster yang telah diperbarui, klik Jobs di panel kiri, lalu klik SUBMIT JOB.
Tetapkan kolom yang sama seperti pada bagian Mengirim tugas:
Kolom | Nilai |
---|---|
Region | |
Cluster | example-cluster |
Job type | Spark |
Main class or jar | org.apache.spark.examples.SparkPi |
Jar files | file:///usr/lib/spark/examples/jars/spark-examples.jar |
Arguments | 1.000 (Ini menetapkan jumlah tugas.) |
Di bawah ini terdapat beberapa pertanyaan pilihan ganda untuk memperkuat pemahaman Anda tentang konsep lab ini. Jawab pertanyaan tersebut sebaik mungkin.
Anda kini sudah memahami cara menggunakan konsol Google Cloud untuk membuat dan memperbarui cluster Dataproc, serta mengirim tugas dalam cluster tersebut.
Lab ini juga merupakan bagian dari rangkaian lab yang disebut Qwik Start. Lab ini dirancang agar Anda dapat mencoba berbagai fitur yang tersedia dengan Google Cloud. Telusuri "Qwik Start" di katalog lab untuk menemukan lab berikutnya yang ingin Anda ikuti.
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui pada 2 Juli 2024
Lab Terakhir Diuji pada 2 Juli 2024
Hak cipta 2025 Google LLC. Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.
Konten ini tidak tersedia untuk saat ini
Kami akan memberi tahu Anda melalui email saat konten tersedia
Bagus!
Kami akan menghubungi Anda melalui email saat konten tersedia
One lab at a time
Confirm to end all existing labs and start this one