Checkpoint
Run a query (dataset: samples, table: shakespeare, substring: raisin)
/ 10
Run a query (dataset: samples, table: shakespeare, substring: huzzah)
/ 10
Create a new dataset (name: babynames)
/ 20
Load the data into a new table
/ 20
Run queries against your dataset table
/ 20
Remove the babynames dataset
/ 20
BigQuery: Qwik Start - Command Line
GSP071
Ringkasan
Menyimpan dan mengkueri set data yang sangat besar dapat menjadi proses yang mahal dan memakan waktu tanpa adanya perangkat keras dan infrastruktur yang tepat. BigQuery adalah cloud data warehouse serverless dan sangat skalabel yang mengatasi masalah ini dengan memungkinkan Kueri SQL super-cepat menggunakan kecanggihan pemrosesan infrastruktur Google. Cukup pindahkan data Anda ke BigQuery dan biarkan kami yang menangani sisanya. Anda dapat mengontrol akses baik ke project maupun data Anda berdasarkan kebutuhan bisnis, seperti mengizinkan orang lain melihat atau mengkueri data Anda.
Anda dapat mengakses BigQuery melalui Konsol, UI Web, atau alat command line menggunakan berbagai library klien seperti Java, .NET, atau Python. Anda juga dapat menggunakan berbagai penyedia solusi untuk berinteraksi dengan BigQuery.
Lab praktik ini menunjukkan kepada Anda cara menggunakan bq
, alat command line berbasis python untuk BigQuery, untuk mengkueri tabel publik dan memuat data sampel ke BigQuery.
Yang akan Anda lakukan
- Mengkueri set data publik
- Membuat set data baru
- Memuat data ke tabel baru
- Mengkueri tabel kustom
Penyiapan dan persyaratan
Sebelum mengklik tombol Mulai Lab
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer, yang dimulai saat Anda mengklik Start Lab, akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab praktik ini dapat Anda gunakan untuk melakukan sendiri aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
- Akses ke browser internet standar (disarankan browser Chrome).
- Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Cara memulai lab dan login ke Google Cloud Console
-
Klik tombol Start Lab. Jika Anda perlu membayar lab, jendela pop-up akan terbuka untuk memilih metode pembayaran. Di sebelah kiri adalah panel Lab Details dengan info berikut:
- Tombol Open Google Cloud console
- Waktu tersisa
- Kredensial sementara yang harus Anda gunakan untuk lab ini
- Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
-
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account. -
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
{{{user_0.username | "Username"}}} Anda juga dapat menemukan Username di panel Lab Details.
-
Klik Next.
-
Salin Password di bawah dan tempel ke dialog Welcome.
{{{user_0.password | "Password"}}} Anda juga dapat menemukan Password di panel Lab Details.
-
Klik Next.
Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda. Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan. -
Klik halaman berikutnya:
- Setujui persyaratan dan ketentuan.
- Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
- Jangan mendaftar uji coba gratis.
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Mengaktifkan Cloud Shell
Cloud Shell adalah mesin virtual yang dilengkapi dengan berbagai alat pengembangan. Mesin virtual ini menawarkan direktori beranda persisten berkapasitas 5 GB dan berjalan di Google Cloud. Cloud Shell menyediakan akses command-line untuk resource Google Cloud Anda.
- Klik Activate Cloud Shell di bagian atas konsol Google Cloud.
Setelah terhubung, Anda sudah diautentikasi, dan project ditetapkan ke PROJECT_ID Anda. Output berisi baris yang mendeklarasikan PROJECT_ID untuk sesi ini:
gcloud
adalah alat command line untuk Google Cloud. Alat ini sudah terinstal di Cloud Shell dan mendukung pelengkapan command line.
- (Opsional) Anda dapat menampilkan daftar nama akun yang aktif dengan perintah ini:
-
Klik Authorize.
-
Output Anda sekarang akan terlihat seperti ini:
Output:
- (Opsional) Anda dapat menampilkan daftar project ID dengan perintah ini:
Output:
Contoh output:
gcloud
yang lengkap di Google Cloud, baca panduan ringkasan gcloud CLI.
Tugas 1. Menguji tabel
BigQuery menawarkan sejumlah tabel sampel yang dapat Anda kueri. Di lab ini, Anda akan mengkueri tabel shakespeare
, yang berisi entri untuk setiap kata dalam setiap drama.
Untuk menguji skema tabel Shakespeare dalam set data sampel, jalankan:
Pada perintah ini, Anda akan melakukan hal berikut:
-
bq
untuk memanggil alat command line BigQuery -
show
adalah tindakannya - Kemudian, Anda mencantumkan nama
project:public dataset.table
di BigQuery yang ingin Anda lihat.
Output:
Tugas 2. Menjalankan perintah help
Jika Anda menyertakan nama perintah dengan perintah help, Anda akan mendapatkan informasi tentang perintah spesifik tersebut.
- Misalnya, panggilan ke
bq help
berikut akan mengambil informasi tentang perintahquery
:
- Untuk melihat daftar semua perintah yang digunakan
bq
, jalankanbq help
saja.
Tugas 3. Menjalankan kueri
Sekarang, Anda akan menjalankan kueri untuk melihat berapa kali substring "raisin" muncul dalam karya Shakespeare.
- Untuk menjalankan kueri, jalankan perintah
bq query "[SQL_STATEMENT]"
:
-
Escape tanda petik di dalam [SQL_STATEMENT] dengan tanda \ atau
-
Gunakan jenis tanda petik yang berbeda dengan tanda baca di sekitarnya ("versus").
- Jalankan kueri SQL standar berikut di Cloud Shell untuk menghitung berapa kali substring "raisin" muncul di semua karya Shakespeare:
Dalam perintah ini:
-
--use_legacy_sql=false
menjadikan SQL standar sebagai sintaksis kueri default.
Output:
Tabel ini menunjukkan bahwa meskipun kata raisin secara persis tidak ditemukan, huruf-hurufnya muncul dengan urutan yang serupa kata tersebut dalam beberapa karya Shakespeare.
Menguji tugas yang sudah selesai
Klik Check my progress untuk memverifikasi tugas yang telah dijalankan. Jika telah berhasil mengkueri set data publik, Anda akan melihat skor penilaian.
Jika Anda mencari kata yang tidak terdapat dalam karya Shakespeare, tidak ada hasil yang akan ditampilkan.
- Jalankan pencarian berikut untuk kata "huzzah", dan tidak ada kecocokan yang ditampilkan:
Menguji tugas yang sudah selesai
Klik Check my progress untuk memverifikasi tugas yang telah dijalankan. Jika telah berhasil mengkueri set data publik, Anda akan melihat skor penilaian.
Tugas 4. Membuat tabel baru
Sekarang, buat tabel Anda sendiri. Setiap tabel disimpan di dalam set data. Set data adalah sekelompok resource, seperti tabel dan tabel virtual.
Membuat set data baru
- Gunakan perintah
bq ls
untuk memunculkan setiap set data yang ada di project Anda:
Anda akan diarahkan kembali ke command line karena belum ada set data apa pun di project Anda.
- Jalankan
bq ls
dan Project IDbigquery-public-data
untuk mencantumkan set data di project spesifik tersebut, diikuti dengan titik dua (:):
Output:
Sekarang, buat set data. Panjang nama set data maksimal 1.024 karakter, dan terdiri atas A-Z, a-z, 0-9, serta garis bawah. Namun, nama set data tidak boleh diawali dengan angka atau garis bawah, atau memiliki spasi.
- Gunakan perintah
bq mk
untuk membuat set data baru yang bernamababynames
di project Anda:
Contoh output:
Menguji tugas yang sudah selesai
Klik Check my progress untuk memverifikasi tugas yang telah dijalankan. Jika telah berhasil membuat set data BigQuery yang bernama babynames, Anda akan melihat skor penilaian.
- Jalankan
bq ls
untuk memastikan set data sekarang muncul sebagai bagian dari project Anda:
Contoh output:
Mengupload set data
Agar dapat membuat tabel ini, Anda harus menambahkan set data ke project Anda. File data khusus yang akan Anda gunakan berisi data nama bayi populer dengan ukuran sekitar 7 MB, yang disediakan oleh Badan Penyelenggara Jaminan Sosial AS.
- Jalankan perintah ini untuk menambahkan file ZIP babynames ke project Anda, menggunakan URL untuk file data tersebut:
- Munculkan file:
Bisa Anda lihat, nama file ini ditambahkan ke project.
- Sekarang, ekstrak file:
- Anda akan mendapatkan daftar file teks yang cukup panjang. Munculkan file itu lagi:
Perintah bq load
membuat atau memperbarui tabel dan memuat data dalam satu langkah.
Anda akan menggunakan perintah bq load
untuk memuat file sumber ke tabel baru yang bernama names2010 di set data babynames yang baru saja Anda buat. Secara default, tindakan ini berjalan secara sinkron, dan akan selesai dalam beberapa detik.
Argumen bq load
yang akan Anda jalankan adalah:
- Buat tabel Anda:
Contoh output:
Menguji tugas yang sudah selesai
Klik Check my progress untuk memverifikasi tugas yang telah dijalankan. Jika telah berhasil memuat data ke dalam tabel set data, Anda akan melihat skor penilaian.
- Jalankan
bq ls
danbabynames
untuk memastikan tabel tersebut kini muncul di set data Anda:
Output:
- Jalankan
bq show
dandataset.table
Anda untuk melihat skemanya:
Output:
-E
. Pelajari lebih lanjut Encoding Karakter dari Pengantar pemuatan data.
Tugas 5. Menjalankan kueri
Sekarang, Anda siap mengkueri data dan menampilkan beberapa hasil yang menarik.
- Jalankan perintah berikut untuk menampilkan 5 nama anak perempuan terpopuler:
Output:
- Jalankan perintah berikut untuk melihat 5 nama anak laki-laki yang paling tidak umum:
Output:
Menguji tugas yang sudah selesai
Klik Check my progress untuk memverifikasi tugas yang telah dijalankan. Jika telah berhasil menjalankan kueri terhadap set data khusus, Anda akan melihat skor penilaian.
Tugas 6. Menguji Pemahaman Anda
Di bawah ini terdapat pertanyaan pilihan ganda untuk memperkuat pemahaman Anda tentang konsep lab ini. Jawab pertanyaan tersebut sebaik mungkin.
Tugas 7. Membersihkan set data
- Jalankan perintah
bq rm
untuk menghapus set datababynames
yang memiliki flag-r
guna menghapus semua tabel dalam set data tersebut:
- Konfirmasi perintah penghapusan dengan mengetik
Y
.
Menguji tugas yang sudah selesai
Klik Check my progress untuk memverifikasi tugas yang telah dijalankan. Jika telah berhasil menghapus set data babynames, Anda akan melihat skor penilaian.
Selamat!
Sekarang, Anda dapat menggunakan command line untuk mengkueri tabel publik dan memuat data sampel ke BigQuery.
Langkah berikutnya/Pelajari lebih lanjut
Lab ini juga merupakan bagian dari rangkaian lab yang disebut Qwik Start. Lab ini dirancang agar Anda dapat mencoba berbagai fitur yang tersedia dengan Google Cloud. Telusuri "Qwik Start" di katalog lab untuk menemukan lab berikutnya yang ingin Anda ikuti.
Sertifikasi dan pelatihan Google Cloud
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui 26 Januari 2024
Lab Terakhir Diuji 24 Agustus 2023
Hak cipta 2024 Google LLC Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.