
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create a Cloud Storage bucket
/ 50
Initialize Cloud Dataprep
/ 50
Lab ini dikembangkan oleh partner kami, Trifacta. Informasi Anda mungkin akan dibagikan kepada Trifacta, yaitu sponsor lab ini, jika Anda memilih untuk menerima info terbaru terkait produk, pengumuman, dan penawaran di Profil Akun Anda.
Cloud Dataprep by Trifacta adalah layanan data cerdas untuk menjelajahi, membersihkan, dan menyiapkan data secara visual untuk analisis. Cloud Dataprep bersifat serverless dan berfungsi pada semua skala. Tidak ada infrastruktur untuk di-deploy atau dikelola. Data bisa mudah disiapkan hanya dengan mengklik dan tanpa menulis kode.
Di lab ini, Anda akan menggunakan Dataprep untuk memanipulasi suatu set data. Anda akan mengimpor set data, memperbaiki data yang tidak cocok, mentransformasi data, dan menggabungkan data. Jika Dataprep merupakan hal baru, Anda akan memahaminya di akhir lab ini.
Di lab ini, Anda akan mempelajari cara menggunakan Dataprep untuk menyelesaikan tugas berikut:
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer yang dimulai saat Anda mengklik Start Lab akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab interaktif ini dapat Anda gunakan untuk melakukan aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
Klik tombol Start Lab. Jika Anda perlu membayar lab, dialog akan terbuka untuk memilih metode pembayaran. Di sebelah kiri ada panel Lab Details yang berisi hal-hal berikut:
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
Anda juga dapat menemukan Username di panel Lab Details.
Klik Next.
Salin Password di bawah dan tempel ke dialog Welcome.
Anda juga dapat menemukan Password di panel Lab Details.
Klik Next.
Klik halaman berikutnya:
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Cloud Shell adalah mesin virtual yang dilengkapi dengan berbagai alat pengembangan. Mesin virtual ini menawarkan direktori beranda persisten berkapasitas 5 GB dan berjalan di Google Cloud. Cloud Shell menyediakan akses command-line untuk resource Google Cloud Anda.
Klik Activate Cloud Shell di bagian atas Konsol Google Cloud.
Klik jendela berikut:
Setelah terhubung, Anda sudah diautentikasi, dan project ditetapkan ke Project_ID,
gcloud
adalah alat command line untuk Google Cloud. Alat ini sudah terinstal di Cloud Shell dan mendukung pelengkapan command line.
Output:
Output:
gcloud
yang lengkap di Google Cloud, baca panduan ringkasan gcloud CLI.
Di Konsol Cloud, pilih Navigation menu() > Cloud Storage > Buckets.
Klik Create bucket.
Di dialog Create a bucket, Beri nama unik untuk bucket. Biarkan setelan lain tetap pada nilai defaultnya.
Hapus centang Enforce public access prevention on this bucket untuk Choose how to control access to objects
.
Klik Create.
Anda berhasil membuat bucket. Ingat nama bucket tersebut untuk langkah-langkah selanjutnya.
Klik Check my progress untuk memverifikasi tugas yang telah diselesaikan. Jika Anda berhasil membuat bucket Cloud Storage, skor penilaian akan terlihat.
Anda akan melihat pesan yang menyatakan bahwa identitas layanan telah dibuat.
Pilih Navigation menu > Dataprep.
Centang untuk menyetujui Persyaratan Layanan Google Dataprep, lalu klik Accept.
Centang untuk memberikan otorisasi berbagi informasi akun Anda dengan Trifacta, lalu klik Agree and Continue.
Klik Allow untuk mengizinkan Trifacta mengakses data project.
Klik nama pengguna siswa Anda untuk login ke Cloud Dataprep by Trifacta. Nama pengguna Anda adalah Username di panel kiri pada lab Anda.
Klik Allow untuk memberi Cloud Dataprep akses ke akun lab Google Cloud Anda.
Centang untuk menyetujui Persyaratan Layanan Trifacta, lalu klik Accept.
Klik Continue di layar First time setup untuk membuat lokasi penyimpanan default.
Dataprep akan terbuka.
Klik Check my progress untuk memverifikasi tugas yang telah diselesaikan. Setelah berhasil melakukan inisialisasi Cloud Dataprep dengan lokasi penyimpanan default, Anda akan melihat skor penilaian.
Cloud Dataprep menggunakan ruang kerja flow
untuk mengakses dan memanipulasi set data.
Halaman alur FEC-2016 akan terbuka.
Di bagian ini, Anda akan mengimpor dan menambahkan data ke alur FEC-2016.
Klik Add Datasets, lalu pilih link Import Datasets.
Di panel menu bagian kiri, pilih Cloud Storage untuk mengimpor set data dari Cloud Storage, lalu klik ikon pensil untuk mengedit jalur file.
gs://spls/gsp105
di kotak teks Choose a file or folder, lalu klik Go.Anda mungkin perlu melebarkan jendela browser untuk melihat tombol Go dan Cancel.
Klik us-fec/.
Klik ikon + di samping cn-2016.txt
untuk membuat set data yang ditampilkan di panel kanan. Klik judul set data di panel kanan dan ganti namanya menjadi "Candidate Master 2016".
Dengan cara yang sama, tambahkan set data itcont-2016-orig.txt
, lalu ganti namanya menjadi "Campaign Contributions 2016".
Kedua set data akan tercantum di panel kanan. Berikutnya, klik Import & Add to Flow.
Anda akan melihat kedua set data tercantum sebagai alur.
Halaman Transformer Candidate Master 2016 akan terbuka dalam tampilan petak.
Halaman Transformer adalah tempat Anda menyusun urutan langkah transformasi dan melihat hasilnya diterapkan ke sampel. Jika sudah puas dengan hasilnya, jalankan tugas terhadap set data Anda.
Perhatikan juga bahwa jika Anda mengklik nama kolom, panel Details akan terbuka di sebelah kanan.
Klik X di bagian kanan atas panel Details untuk menutup panel Details.
Pada langkah-langkah berikut ini, Anda akan menelusuri data dalam tampilan petak dan menerapkan langkah-langkah transformasi ke urutan langkah Anda.
Tindakan ini akan membuat langkah di mana nilai-nilai ini dipilih.
Panel Recipe di bagian kanan sekarang menyertakan langkah-langkah berikut:
Keep rows where(DATE(2016, 1, 1) <= column5) && (column5 < DATE(2018, 1, 1))
Scroll ke bagian bawah halaman (ditandai dengan warna merah) dan temukan nilai yang tidak cocok. Kemudian, akan terlihat bahwa sebagian besar data ini memiliki nilai "P" di column7, dan "US" di column6. Ketidakcocokan ini terjadi karena column6 ditandai sebagai kolom "State" (ditunjukkan dengan ikon bendera), tetapi ada nilai yang bukan nilai negara bagian di dalamnya (misalnya "US").
Tidak ada lagi ketidakcocokan, dan penanda kolom sekarang berubah menjadi hijau.
D halaman Join, Anda dapat menambahkan set data saat ini ke set data atau urutan langkah lain berdasarkan informasi yang sama di kedua set data.
Sebelum menggabungkan file Contributions ke file Candidate, kosongkan file Contributions.
Klik untuk memilih Campaign Contributions 2016 yang berwarna abu-abu.
Di panel kanan, klik Add > Recipe, lalu klik Edit Recipe.
Klik ikon recipe di bagian kanan atas halaman, lalu klik Add New Step.
Hapus pemisah ekstra dalam set data.
Transformation Builder menguraikan perintah Wrangle dan mengisi kolom transformasi Find and Replace.
Klik Add untuk menambahkan transformasi ke urutan langkah.
Tambahkan satu langkah baru lagi ke urutan langkah. Klik New Step, lalu ketik "Join" dalam kotak Penelusuran.
Klik Join datasets untuk membuka halaman Joins.
Klik "Candidate Master 2016" untuk menggabungkannya dengan Campaign Contributions 2016, lalu klik Accept di bagian kanan bawah.
Dataprep menyimpulkan kunci umum. Ada banyak nilai yang sama yang dianggap Join Keys oleh Dataprep.
Column 2 dan 11 terbuka untuk ditinjau.
Buat ringkasan sarat manfaat dengan agregasi, penghitungan rata-rata, dan penghitungan kontribusi di Column 16, serta pengelompokan kandidat berdasarkan ID, nama, dan afiliasi grup di Column 2, 24, dan 8.
Sampel awal data yang digabungkan dan diagregasi ditampilkan dan merepresentasikan tabel ringkasan para kandidat presiden Amerika Serikat serta metrik kontribusi kampanye mereka pada tahun 2016.
Anda dapat membuat data menjadi lebih mudah dimengerti dengan mengganti nama kolom.
Lalu, klik Add.
Tambahkan New Step terakhir berikut untuk membulatkan jumlah Average Contribution:
Hasilnya akan terlihat seperti ini:
Anda telah menggunakan Dataprep untuk menambahkan set data dan membuat urutan langkah untuk mengumpulkan data menjadi hasil yang bermanfaat.
Lab ini merupakan bagian dari rangkaian lab yang disebut Qwik Start. Lab ini dirancang agar Anda dapat mencoba berbagai fitur yang tersedia dengan Google Cloud. Telusuri "Qwik Start" di katalog lab untuk menemukan lab berikutnya yang ingin Anda ikuti.
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui pada 06 Juni 2024
Lab Terakhir Diuji pada 06 Juni 2024
Hak cipta 2025 Google LLC. Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.
Konten ini tidak tersedia untuk saat ini
Kami akan memberi tahu Anda melalui email saat konten tersedia
Bagus!
Kami akan menghubungi Anda melalui email saat konten tersedia
One lab at a time
Confirm to end all existing labs and start this one