Checkpoint
Create the connection resource
/ 20
Set up access to a Cloud Storage data lake
/ 30
Create the BigLake table
/ 20
Create the external table
/ 10
Update external table to Biglake table
/ 20
BigLake: Qwik Start
- GSP1040
- Ringkasan
- Tujuan
- Penyiapan dan persyaratan
- Tugas 1. Membuat resource koneksi
- Tugas 2. Menyiapkan akses ke data lake Cloud Storage
- Tugas 3. Membuat tabel BigLake
- Tugas 4. Menjalankan kueri pada tabel BigLake melalui BigQuery
- Tugas 5. Menyiapkan kebijakan kontrol akses
- Tugas 6. Mengupgrade tabel eksternal ke tabel BigLake
- Selamat!
GSP1040
Ringkasan
BigLake adalah mesin penyimpanan terpadu yang menyederhanakan akses data untuk data warehouse dan data lake dengan menyediakan kontrol akses presisi yang seragam di seluruh penyimpanan multi-cloud dan format terbuka.
BigLake memperluas keamanan yang sangat spesifik pada tabel BigQuery hingga ke tingkat baris dan kolom terkait data yang disimpan di penyimpanan objek eksternal seperti Amazon S3, Azure Data Lake Storage Gen2, dan Google Cloud Storage. BigLake memisahkan akses ke tabel dari data penyimpanan cloud yang mendasarinya melalui delegasi akses. Fitur ini membantu Anda dalam memberikan akses tingkat baris dan kolom secara aman kepada pengguna dan pipeline di organisasi Anda tanpa memberikan akses penuh ke tabel.
Setelah membuat tabel BigLake, Anda dapat menjalankan kueri pada tabel tersebut seperti pada tabel BigQuery lainnya. BigQuery akan memberlakukan kontrol akses tingkat baris dan kolom, dan tiap pengguna hanya akan melihat potongan data yang diizinkan untuk dilihatnya. Kebijakan tata kelola diterapkan pada semua akses ke data melalui BigQuery API. Misalnya, BigQuery Storage API dapat digunakan untuk mengakses data yang diotorisasi menggunakan mesin kueri open source seperti Apache Spark, seperti yang ditunjukkan diagram berikut:
Tujuan
Dalam lab ini, Anda akan:
- Membuat dan melihat resource koneksi.
- Menyiapkan akses ke data lake Cloud Storage.
- Membuat tabel BigLake.
- Menjalankan kueri pada tabel BigLake melalui BigQuery.
- Menyiapkan kebijakan kontrol akses.
- Mengupgrade tabel eksternal ke tabel BigLake.
Penyiapan dan persyaratan
Sebelum mengklik tombol Mulai Lab
Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer, yang dimulai saat Anda mengklik Start Lab, akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.
Lab praktik ini dapat Anda gunakan untuk melakukan sendiri aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.
Untuk menyelesaikan lab ini, Anda memerlukan:
- Akses ke browser internet standar (disarankan browser Chrome).
- Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.
Cara memulai lab dan login ke Google Cloud Console
-
Klik tombol Start Lab. Jika Anda perlu membayar lab, jendela pop-up akan terbuka untuk memilih metode pembayaran. Di sebelah kiri adalah panel Lab Details dengan info berikut:
- Tombol Open Google Cloud console
- Waktu tersisa
- Kredensial sementara yang harus Anda gunakan untuk lab ini
- Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
-
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).
Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.
Tips: Atur tab di jendela terpisah secara berdampingan.
Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account. -
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
{{{user_0.username | "Username"}}} Anda juga dapat menemukan Username di panel Lab Details.
-
Klik Next.
-
Salin Password di bawah dan tempel ke dialog Welcome.
{{{user_0.password | "Password"}}} Anda juga dapat menemukan Password di panel Lab Details.
-
Klik Next.
Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda. Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan. -
Klik halaman berikutnya:
- Setujui persyaratan dan ketentuan.
- Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
- Jangan mendaftar uji coba gratis.
Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.
Mengaktifkan Cloud Shell
Cloud Shell adalah mesin virtual yang dilengkapi dengan berbagai alat pengembangan. Mesin virtual ini menawarkan direktori beranda persisten berkapasitas 5 GB dan berjalan di Google Cloud. Cloud Shell menyediakan akses command-line untuk resource Google Cloud Anda.
- Klik Activate Cloud Shell di bagian atas konsol Google Cloud.
Setelah terhubung, Anda sudah diautentikasi, dan project ditetapkan ke PROJECT_ID Anda. Output berisi baris yang mendeklarasikan PROJECT_ID untuk sesi ini:
gcloud
adalah alat command line untuk Google Cloud. Alat ini sudah terinstal di Cloud Shell dan mendukung pelengkapan command line.
- (Opsional) Anda dapat menampilkan daftar nama akun yang aktif dengan perintah ini:
-
Klik Authorize.
-
Output Anda sekarang akan terlihat seperti ini:
Output:
- (Opsional) Anda dapat menampilkan daftar project ID dengan perintah ini:
Output:
Contoh output:
gcloud
yang lengkap di Google Cloud, baca panduan ringkasan gcloud CLI.
Tugas 1. Membuat resource koneksi
Tabel BigLake mengakses data Google Cloud Storage menggunakan resource koneksi. Resource koneksi dapat dikaitkan dengan satu tabel atau kelompok arbitrer tabel dalam project.
-
Dari Navigation Menu, buka BigQuery > BigQuery Studio. Klik Done.
-
Untuk membuat koneksi, klik +ADD, lalu klik Connections to external data sources.
- Pada Connection type list, pilih Vertex AI remote models, remote functions and BigLake (Cloud Resource).
-
Di kolom Connection ID, masukkan
my-connection
. -
Untuk Location type, pilih Multi-region, lalu pilih US (multiple regions in United States) dari dropdown.
-
Klik Create connection.
-
Untuk melihat informasi koneksi Anda, pilih koneksi di menu navigasi.
- Di bagian Connection info, salin ID Akun Layanan. Anda akan memerlukan ID ini di bagian berikut.
Klik Check my progress untuk memverifikasi tujuan.
Tugas 2. Menyiapkan akses ke data lake Cloud Storage
Di bagian ini, Anda akan memberikan akses hanya baca untuk resource koneksi baru ke data lake Cloud Storage sehingga BigQuery dapat mengakses file Cloud Storage atas nama pengguna. Sebaiknya Anda memberikan peran IAM Storage Object Viewer ke akun layanan resource koneksi, sehingga akun layanan dapat mengakses bucket Cloud Storage.
-
Dari Navigation Menu, buka IAM & Admin > IAM.
-
Klik +GRANT ACCESS.
-
Di kolom New principals, masukkan ID akun layanan yang Anda salin sebelumnya.
-
Di kolom Select a role, pilih Cloud Storage, lalu pilih Storage Object Viewer.
- Klik Save.
Klik Check my progress untuk memverifikasi tujuan.
Tugas 3. Membuat tabel BigLake
Contoh berikut menggunakan format file CSV, tetapi Anda dapat menggunakan format apa pun yang didukung BigLake, seperti yang ditunjukkan dalam Limitations. Jika Anda sudah terbiasa membuat tabel di BigQuery, proses ini akan serupa. Satu-satunya perbedaan adalah Anda harus menentukan koneksi resource cloud yang terkait.
Jika tidak ada skema yang disediakan dan akun layanan tidak diberikan akses ke bucket pada langkah sebelumnya, langkah ini akan gagal dengan pesan akses ditolak.
Membuat set data
-
Buka lagi BigQuery > BigQuery Studio.
-
Klik tiga titik di samping nama project Anda, lalu pilih Create dataset.
-
Untuk Dataset ID, gunakan
demo_dataset
. -
Untuk Location type, pilih Multi-region, lalu pilih US (multiple regions in United States) dari dropdown.
-
Biarkan kolom lainnya sebagai default, lalu klik Create Dataset.
Setelah set data dibuat, Anda dapat menyalin set data yang sudah ada dari Cloud Storage ke BigQuery.
Membuat tabel
- Klik tiga titik di samping demo_dataset, lalu pilih Create table.
- Di bagian Source untuk Create table from, pilih Google Cloud Storage.
-
Klik Browse untuk memilih set data. Buka bucket bernama
, lalu file customer.csv
untuk diimpor ke BigQuery, kemudian klik Select. -
Di bagian Destination, pastikan project lab Anda telah dipilih dan Anda menggunakan demo_dataset.
-
Untuk nama tabel, gunakan
biglake_table
. -
Tetapkan table type ke External Table.
-
Pilih kotak Create a BigLake table using a Cloud Resource connection.
Pastikan ID koneksi Anda us.my-connection dipilih. Konfigurasi Anda akan terlihat seperti berikut:
- Di bagian Schema, aktifkan Edit as text, lalu salin dan tempel skema berikut ke kotak teks:
- Klik Create Table.
Klik Check my progress untuk memverifikasi tujuan.
Tugas 4. Menjalankan kueri pada tabel BigLake melalui BigQuery
Setelah membuat tabel BigLake, Anda dapat menggunakan klien BigQuery apa pun untuk mengirimkan kueri.
-
Dari toolbar pratinjau biglake_table, klik Query > In new tab.
-
Jalankan hal berikut untuk membuat kueri pada tabel BigLake melalui BigQuery Editor:
-
Klik Run.
-
Pastikan Anda dapat melihat semua kolom dan data dalam tabel yang dihasilkan.
Tugas 5. Menyiapkan kebijakan kontrol akses
Setelah tabel BigLake dibuat, tabel ini dapat dikelola dengan cara yang mirip dengan tabel BigQuery. Untuk membuat kebijakan kontrol akses untuk tabel BigLake, pertama-tama Anda akan membuat taksonomi tag kebijakan di BigQuery. Kemudian, terapkan tag kebijakan ke baris atau kolom yang sensitif. Di bagian ini, Anda akan membuat kebijakan tingkat kolom. Untuk mengetahui petunjuk tentang cara menyiapkan keamanan tingkat baris, baca panduan keamanan tingkat baris.
Untuk tujuan ini, taksonomi BigQuery bernama
Menambahkan tag kebijakan ke kolom
Anda sekarang akan menggunakan tag kebijakan yang dibuat untuk membatasi akses ke kolom tertentu dalam tabel BigQuery. Dalam contoh ini, Anda akan membatasi akses ke informasi sensitif seperti alamat, kode pos, dan nomor telepon.
-
Dari Navigation Menu, buka BigQuery > BigQuery Studio.
-
Buka demo-dataset > biglake_table, lalu klik tabel untuk membuka halaman skema tabel.
-
Klik Edit Schema.
-
Centang kotak di samping kolom address, postal_code, dan phone.
-
Klik Add policy tag.
-
Klik
untuk meluaskannya guna memilih biglake-policy.
-
Klik Select.
Kolom Anda sekarang seharusnya sudah memiliki tag kebijakan yang dilampirkan padanya.
-
Klik Save.
-
Pastikan skema tabel Anda sekarang terlihat seperti berikut.
Memastikan keamanan tingkat kolom
-
Buka editor kueri untuk biglake_table.
-
Jalankan hal berikut untuk membuat kueri pada tabel BigLake melalui BigQuery Editor:
-
Klik Run.
Anda akan menerima pesan error akses ditolak:
- Sekarang, jalankan kueri berikut dengan menghapus kolom yang aksesnya tidak Anda miliki:
Kueri seharusnya berjalan tanpa masalah dan menampilkan kolom yang dapat Anda akses. Contoh ini menunjukkan bahwa keamanan tingkat kolom yang diterapkan melalui BigQuery juga dapat diterapkan pada tabel BigLake.
Tugas 6. Mengupgrade tabel eksternal ke tabel BigLake
Anda dapat mengupgrade tabel yang ada ke tabel BigLake dengan mengaitkan tabel tersebut ke koneksi resource cloud. Untuk mengetahui daftar lengkap flag dan argumen, lihat bq update
dan bq mkdef
.
Membuat tabel eksternal
-
Klik tiga titik di samping demo_dataset, lalu pilih Create table.
-
Di bagian Source untuk Create table from, pilih Google Cloud Storage.
-
Klik Browse untuk memilih set data. Buka bucket bernama
, lalu file invoice.csv
untuk diimpor ke BigQuery, kemudian klik Select. -
Di bagian Destination, pastikan project lab Anda telah dipilih dan Anda menggunakan demo_dataset.
-
Untuk nama tabel, gunakan
external_table
. -
Tetapkan table type ke External Table.
- Di bagian Schema, aktifkan Edit as text, lalu salin dan tempel skema berikut ke kotak teks:
- Klik Create Table.
Klik Check my progress untuk memverifikasi tujuan.
Mengupdate tabel eksternal ke tabel BigLake
- Buka jendela Cloud Shell yang baru dan jalankan perintah berikut untuk membuat definisi tabel eksternal baru yang menentukan koneksi yang akan digunakan:
- Pastikan definisi tabel Anda telah dibuat:
- Dapatkan skema dari tabel Anda:
- Update tabel menggunakan definisi tabel eksternal yang baru:
Klik Check my progress untuk memverifikasi tujuan.
Memastikan tabel yang diupdate
-
Dari Navigation Menu, buka BigQuery > BigQuery Studio.
-
Buka demo-dataset > lalu klik dua kali external_table.
-
Buka tab Details.
-
Pastikan tabel di bagian External Data Configuration sekarang menggunakan Connection ID yang sesuai.
Bagus! Anda berhasil mengupgrade tabel eksternal yang sudah ada ke tabel BigLake dengan mengaitkannya ke koneksi resource cloud.
Selamat!
Dalam lab ini, Anda telah membuat resource koneksi, menyiapkan akses ke data lake Cloud Storage, dan membuat tabel BigLake. Anda kemudian menjalankan kueri pada tabel BigLake melalui BigQuery, dan menyiapkan kebijakan kontrol akses tingkat kolom. Terakhir, Anda mengupdate tabel eksternal yang sudah ada ke tabel BigLake menggunakan resource koneksi.
Langkah Berikutnya/Pelajari Lebih Lanjut
Pastikan Anda membaca dokumentasi berikut untuk praktik lainnya dengan BigLake:
- Pengantar Tabel BigLake
- Dokumentasi Membuat dan Mengelola tabel BigLake
- Menjalankan kueri pada tabel BigLake menggunakan konektor
Sertifikasi dan pelatihan Google Cloud
...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.
Manual Terakhir Diperbarui pada 16 Januari 2024
Lab Terakhir Diuji pada 16 Januari 2024
Hak cipta 2024 Google LLC Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.