Dapatkan akses ke 700+ lab dan kursus

Bekerja dengan JSON, Array, dan Struct di BigQuery

Lab 1 jam 15 menit universal_currency_alt 5 Kredit show_chart Menengah

info Lab ini mungkin menggabungkan alat AI untuk mendukung pembelajaran Anda.

GSP416
Ringkasan
Penyiapan dan persyaratan
Tugas 1. Membuat set data baru untuk menyimpan tabel
Tugas 2. Berlatih bekerja dengan array di SQL
Tugas 3. Membuat array Anda sendiri dengan ARRAY_AGG()
Tugas 4. Membuat kueri tabel yang berisi array
Tugas 5. Pengantar STRUCT
Tugas 6. Berlatih dengan STRUCT dan array
Tugas 7. Pertanyaan lab: STRUCT()
Tugas 8. Pertanyaan lab: Membuka array dengan UNNEST( )
Tugas 9. Memfilter dalam nilai array
Selamat!

Dapatkan akses ke 700+ lab dan kursus

GSP416

Ringkasan

BigQuery adalah database analisis berbiaya rendah dan tanpa pengoperasian (NoOps) yang dikelola sepenuhnya oleh Google. Dengan BigQuery, Anda dapat mengkueri data berskala terabyte tanpa perlu mengelola infrastruktur atau memiliki administrator database. BigQuery menggunakan SQL dan memanfaatkan model bayar sesuai penggunaan. Dengan BigQuery, Anda dapat berfokus menganalisis data untuk menemukan insight yang bermakna.

Di lab ini, Anda akan bekerja secara mendalam dengan data semi-terstruktur (menyerap jenis data JSON, Array) di dalam BigQuery. Mendenormalisasi skema Anda menjadi satu tabel dengan kolom berulang dan bertingkat dapat meningkatkan performa, namun sintaksis SQL untuk bekerja dengan data array bisa jadi rumit. Anda akan berlatih memuat, membuat kueri, memecahkan masalah, dan menghapus tingkatan berbagai set data semi-terstruktur.

Yang akan Anda lakukan

Di lab ini, Anda akan mempelajari cara:

Memuat dan membuat kueri data semi-terstruktur termasuk menghapus tingkatan.
Memecahkan masalah kueri pada data semi-terstruktur.

Penyiapan dan persyaratan

Sebelum mengklik tombol Start Lab

Baca petunjuk ini. Lab memiliki timer dan Anda tidak dapat menjedanya. Timer yang dimulai saat Anda mengklik Start Lab akan menampilkan durasi ketersediaan resource Google Cloud untuk Anda.

Lab interaktif ini dapat Anda gunakan untuk melakukan aktivitas lab di lingkungan cloud sungguhan, bukan di lingkungan demo atau simulasi. Untuk mengakses lab ini, Anda akan diberi kredensial baru yang bersifat sementara dan dapat digunakan untuk login serta mengakses Google Cloud selama durasi lab.

Untuk menyelesaikan lab ini, Anda memerlukan:

Akses ke browser internet standar (disarankan browser Chrome).

Catatan: Gunakan jendela Samaran (direkomendasikan) atau browser pribadi untuk menjalankan lab ini. Hal ini akan mencegah konflik antara akun pribadi Anda dan akun siswa yang dapat menyebabkan tagihan ekstra pada akun pribadi Anda.

Waktu untuk menyelesaikan lab. Ingat, setelah dimulai, lab tidak dapat dijeda.

Catatan: Hanya gunakan akun siswa untuk lab ini. Jika Anda menggunakan akun Google Cloud yang berbeda, Anda mungkin akan dikenai tagihan ke akun tersebut.

Cara memulai lab dan login ke Google Cloud Console

Klik tombol Start Lab. Jika Anda perlu membayar lab, dialog akan terbuka untuk memilih metode pembayaran. Di sebelah kiri ada panel Lab Details yang berisi hal-hal berikut:
- Tombol Open Google Cloud console
- Waktu tersisa
- Kredensial sementara yang harus Anda gunakan untuk lab ini
- Informasi lain, jika diperlukan, untuk menyelesaikan lab ini
Klik Open Google Cloud console (atau klik kanan dan pilih Open Link in Incognito Window jika Anda menjalankan browser Chrome).

Lab akan menjalankan resource, lalu membuka tab lain yang menampilkan halaman Sign in.

Tips: Atur tab di jendela terpisah secara berdampingan.
Catatan: Jika Anda melihat dialog Choose an account, klik Use Another Account.
Jika perlu, salin Username di bawah dan tempel ke dialog Sign in.
{{{user_0.username | "Username"}}}
Anda juga dapat menemukan Username di panel Lab Details.
Klik Next.
Salin Password di bawah dan tempel ke dialog Welcome.
{{{user_0.password | "Password"}}}
Anda juga dapat menemukan Password di panel Lab Details.
Klik Next.
Penting: Anda harus menggunakan kredensial yang diberikan lab. Jangan menggunakan kredensial akun Google Cloud Anda. Catatan: Menggunakan akun Google Cloud sendiri untuk lab ini dapat dikenai biaya tambahan.
Klik halaman berikutnya:
- Setujui persyaratan dan ketentuan.
- Jangan tambahkan opsi pemulihan atau autentikasi 2 langkah (karena ini akun sementara).
- Jangan mendaftar uji coba gratis.

Setelah beberapa saat, Konsol Google Cloud akan terbuka di tab ini.

Catatan: Untuk mengakses produk dan layanan Google Cloud, klik Navigation menu atau ketik nama layanan atau produk di kolom Search.

Membuka konsol BigQuery

Di Google Cloud Console, pilih Navigation menu > BigQuery.

Kotak pesan Welcome to BigQuery in the Cloud Console akan terbuka. Kotak pesan ini menyediakan link ke panduan memulai dan catatan rilis.

Klik Done.

Konsol BigQuery terbuka.

Tugas 1. Membuat set data baru untuk menyimpan tabel

Di BigQuery Anda, klik tiga titik di samping Project ID Anda dan pilih Create dataset:

Tetapkan Dataset ID ke fruit_store. Gunakan nilai default untuk opsi lainnya (Data Location, Default Expiration).
Klik Create dataset.

Tugas 2. Berlatih bekerja dengan array di SQL

Di SQL, biasanya Anda akan memiliki satu nilai untuk tiap baris seperti daftar buah di bawah ini:

Baris	Buah
1	rasberi
2	beri hitam
3	stroberi
4	ceri

Bagaimana jika Anda menginginkan daftar item buah untuk tiap orang di toko? Daftarnya bisa tampak seperti berikut:

Baris	Buah	Orang
1	rasberi	santi
2	beri hitam	santi
3	stroberi	santi
4	ceri	santi
5	jeruk	feri
6	apel	feri

Dalam SQL database relasional tradisional, Anda akan melihat pengulangan nama dan langsung berpikir untuk membagi tabel di atas menjadi dua tabel terpisah: Item Buah dan Orang. Proses ini disebut normalisasi (beralih dari satu tabel ke banyak tabel). Normalisasi adalah pendekatan umum untuk database transaksional seperti mySQL.

Untuk data warehousing, analis data sering kali melakukannya dengan arah sebaliknya (denormalisasi) dan menyatukan banyak tabel terpisah ke dalam satu tabel pelaporan besar.

Sekarang, Anda akan mempelajari pendekatan berbeda yang menyimpan data pada tingkat perincian berbeda, semuanya dalam satu tabel menggunakan kolom berulang:

Baris	Buah (array)	Orang
1	rasberi	santi
	beri hitam
	stroberi
	ceri
2	jeruk	feri
2	apel

Apa yang aneh pada tabel sebelumnya?

Hanya terdiri atas dua baris.
Ada banyak nilai kolom untuk Buah dalam satu baris.
Orang-orang dikaitkan dengan semua nilai kolom.

Apa insight utamanya? Jenis data array.

Cara yang lebih mudah untuk menafsirkan array Buah:

Baris	Buah (array)	Orang
1	[rasberi, beri hitam, stroberi, ceri]	santi
2	[jeruk, apel]	feri

Kedua tabel ini sama persis. Ada dua pembelajaran utama di sini:

Array adalah daftar item dalam tanda kurung [ ]
BigQuery secara visual menampilkan array secara flattened. BigQuery mencantumkan nilai dalam array secara vertikal (perhatikan bahwa semua nilai tersebut masih termasuk dalam satu baris)

Cobalah sendiri.

Masukkan kode berikut dalam Editor Kueri BigQuery:

#standardSQL SELECT ['raspberry', 'blackberry', 'strawberry', 'cherry'] AS fruit_array

Klik Run.
Sekarang coba jalankan yang ini:

#standardSQL SELECT ['raspberry', 'blackberry', 'strawberry', 'cherry', 1234567] AS fruit_array

Anda akan mendapatkan error seperti berikut:

Error: Array elements of types {INT64, STRING} do not have a common supertype at [3:1]

Array hanya dapat berbagi satu tipe data (semua string, semua angka).

Berikut tabel akhir untuk diterapkan kueri:

#standardSQL SELECT person, fruit_array, total_cost FROM `data-to-insights.advanced.fruit_store`;

Klik Run.
Setelah melihat hasilnya, klik tab JSON untuk melihat struktur hasil yang disusun bertingkat.

Memuat JSON semi-terstruktur ke BigQuery

Bagaimana jika Anda memiliki file JSON yang perlu diserap ke BigQuery?

Buat tabel baru fruit_details dalam set data.

Klik set data fruit_store.

Sekarang Anda akan melihat opsi Create Table.

Catatan: Anda mungkin harus memperluas jendela browser untuk melihat opsi Create table.

Tambahkan detail berikut untuk tabel:

Source: Pilih Google Cloud Storage di dropdown Create table from.
Select file from Cloud Storage bucket: cloud-training/data-insights-course/labs/optimizing-for-performance/shopping_cart.json
File format: JSONL (Newline delimited JSON)

Namai tabel baru tersebut dengan fruit_details.
Centang kotak centang Schema (Auto detect).
Klik Create table.

Dalam skema, perhatikan bahwa fruit_array ditandai sebagai REPEATED yang berarti ia adalah sebuah array.

Rangkuman

BigQuery secara native mendukung array
Nilai array harus memiliki jenis data yang sama
Array disebut kolom REPEATED di BigQuery

Klik Check my progress untuk memverifikasi tujuan. Membuat set data dan tabel baru untuk menyimpan data

Tugas 3. Membuat array Anda sendiri dengan ARRAY_AGG()

Belum ada array di tabel Anda? Anda bisa membuatnya.

Salin dan tempel kueri di bawah ini untuk menjelajahi set data publik ini:

SELECT fullVisitorId, date, v2ProductName, pageTitle FROM `data-to-insights.ecommerce.all_sessions` WHERE visitId = 1501570398 ORDER BY date

Klik Run dan lihat hasilnya.

Sekarang, gunakan fungsi ARRAY_AGG() untuk menggabungkan nilai string kita ke dalam array.

Salin dan tempel kueri di bawah ini untuk menjelajahi set data publik ini:

SELECT fullVisitorId, date, ARRAY_AGG(v2ProductName) AS products_viewed, ARRAY_AGG(pageTitle) AS pages_viewed FROM `data-to-insights.ecommerce.all_sessions` WHERE visitId = 1501570398 GROUP BY fullVisitorId, date ORDER BY date

Klik Run dan lihat hasilnya.

Selanjutnya, gunakan fungsi ARRAY_LENGTH() untuk menghitung jumlah halaman dan produk yang dilihat:

SELECT fullVisitorId, date, ARRAY_AGG(v2ProductName) AS products_viewed, ARRAY_LENGTH(ARRAY_AGG(v2ProductName)) AS num_products_viewed, ARRAY_AGG(pageTitle) AS pages_viewed, ARRAY_LENGTH(ARRAY_AGG(pageTitle)) AS num_pages_viewed FROM `data-to-insights.ecommerce.all_sessions` WHERE visitId = 1501570398 GROUP BY fullVisitorId, date ORDER BY date

Selanjutnya, hapus duplikat halaman dan produk sehingga Anda dapat melihat berapa banyak produk unik yang ditampilkan dengan menambahkan DISTINCT ke ARRAY_AGG():

SELECT fullVisitorId, date, ARRAY_AGG(DISTINCT v2ProductName) AS products_viewed, ARRAY_LENGTH(ARRAY_AGG(DISTINCT v2ProductName)) AS distinct_products_viewed, ARRAY_AGG(DISTINCT pageTitle) AS pages_viewed, ARRAY_LENGTH(ARRAY_AGG(DISTINCT pageTitle)) AS distinct_pages_viewed FROM `data-to-insights.ecommerce.all_sessions` WHERE visitId = 1501570398 GROUP BY fullVisitorId, date ORDER BY date

Klik Check my progress untuk memverifikasi tujuan. Menjalankan kueri untuk melihat berapa banyak produk unik yang ditampilkan

Rangkuman

Anda dapat melakukan beberapa hal yang cukup berguna dengan array seperti:

mencari jumlah elemen dengan ARRAY_LENGTH(<array>)
menghapus duplikat elemen dengan ARRAY_AGG(DISTINCT <field>)
mengurutkan elemen dengan ARRAY_AGG(<field> ORDER BY <field>)
membatasi ARRAY_AGG(<field> LIMIT 5)

Tugas 4. Membuat kueri tabel yang berisi array

Set Data Publik BigQuery untuk Google Analytics bigquery-public-data.google_analytics_sample memiliki lebih banyak kolom dan baris daripada set data kursus kita data-to-insights.ecommerce.all_sessions. Lebih penting lagi, set data ini sudah menyimpan nilai kolom seperti produk, halaman, dan transaksi secara native sebagai ARRAY.

Salin dan tempel kueri di bawah ini untuk menjelajahi data yang tersedia dan melihat apakah Anda dapat menemukan kolom dengan nilai berulang (array) atau tidak:

SELECT * FROM `bigquery-public-data.google_analytics_sample.ga_sessions_20170801` WHERE visitId = 1501570398

Jalankan kueri
Scroll ke kanan dalam hasil hingga Anda melihat kolom hits.product.v2ProductName (alias multikolom akan segera dibahas).

Jumlah kolom yang tersedia dalam skema Google Analytics bisa sangat banyak untuk dianalisis.

Cobalah untuk membuat kueri hanya untuk kolom kunjungan dan nama halaman seperti sebelumnya:

SELECT visitId, hits.page.pageTitle FROM `bigquery-public-data.google_analytics_sample.ga_sessions_20170801` WHERE visitId = 1501570398

Anda akan mendapatkan error: Error:Cannot access field page on a value with type ARRAY<STRUCT<hitNumber INT64, time INT64, hour INT64, ...>> at [3:8]

Sebelum Anda dapat membuat kueri kolom REPEATED (array) secara normal, Anda harus terlebih dahulu memecah array kembali menjadi baris.

Misalnya, array untuk hits.page.pageTitle saat ini disimpan sebagai satu baris seperti:

['homepage','product page','checkout']

dan array tersebut harus menjadi:

['homepage', 'product page', 'checkout']

Bagaimana cara melakukannya dengan SQL?

Jawaban: Gunakan fungsi UNNEST() pada kolom array Anda:

SELECT DISTINCT visitId, h.page.pageTitle FROM `bigquery-public-data.google_analytics_sample.ga_sessions_20170801`, UNNEST(hits) AS h WHERE visitId = 1501570398 LIMIT 10

Kita akan membahas UNNEST() secara lebih mendetail nanti, tetapi untuk saat ini ketahuilah bahwa:

Anda perlu menggunakan fungsi UNNEST() pada array untuk mengembalikan elemen array ke dalam baris
UNNEST() selalu mengikuti nama tabel dalam klausa FROM Anda (anggaplah secara konseptual seperti tabel yang telah digabungkan sebelumnya)

Klik Check my progress untuk memverifikasi tujuan. Mengeksekusi kueri untuk menggunakan UNNEST() pada kolom array

Tugas 5. Pengantar STRUCT

Anda mungkin bertanya-tanya mengapa alias kolom hit.page.pageTitle terlihat seperti tiga kolom dalam satu kolom yang dipisahkan oleh titik. Sama seperti nilai ARRAY yang memberi Anda fleksibilitas untuk mendalami perincian kolom Anda, jenis data lain memungkinkan Anda memperluas skema dengan mengelompokkan kolom terkait bersama-sama. Jenis data SQL tersebut adalah jenis data STRUCT.

Cara termudah untuk memikirkan STRUCT adalah dengan menganggapnya secara konseptual seperti tabel terpisah yang sudah digabungkan sebelumnya ke dalam tabel utama Anda.

STRUCT dapat memiliki:

Satu atau banyak kolom di dalamnya
Jenis data yang sama atau berbeda untuk tiap kolom
Aliasnya sendiri

Kedengarannya persis seperti tabel 'kan?

Menjelajahi set data dengan STRUCT

Untuk membuka set data bigquery-public-data, klik +ADD lalu pilih Star a project by name dan masukkan nama bigquery-public-data
Klik Star.

Project bigquery-public-data tercantum di bagian Explorer.

Buka bigquery-public-data.
Cari dan buka set data google_analytics_sample.
Klik tabel ga_sessions_ (366).
Mulailah men-scroll skema dan jawab pertanyaan berikut menggunakan fitur cari di browser Anda.

Seperti yang dapat Anda bayangkan, ada banyak sekali data sesi situs yang disimpan untuk situs e-commerce modern.

Keuntungan utama memiliki 32 STRUCT dalam satu tabel adalah Anda dapat menjalankan kueri seperti ini tanpa harus melakukan JOIN apa pun:

SELECT visitId, totals.*, device.* FROM `bigquery-public-data.google_analytics_sample.ga_sessions_20170801` WHERE visitId = 1501570398 LIMIT 10

Catatan: Sintaksis .* memberi tahu BigQuery untuk menampilkan semua kolom untuk STRUCT tersebut (seperti jika totals.* adalah tabel terpisah yang menjadi dasar penggabungan).

Dengan menyimpan tabel pelaporan besar sebagai STRUCT ("tabel" yang telah digabungkan sebelumnya) dan ARRAY (perincian mendalam), Anda akan:

Mendapatkan keunggulan performa yang signifikan dengan menghindari JOIN 32 tabel
Mendapatkan data terperinci dari ARRAY saat Anda memerlukannya. Jika Anda tidak membutuhkannya pun tidak apa-apa karena BigQuery akan menyimpan tiap kolom satu per satu di disk.
Mendapatkan semua konteks bisnis dalam satu tabel, sehingga Anda tidak perlu mengkhawatirkan kunci untuk JOIN dan tabel mana yang memiliki data yang Anda perlukan

Tugas 6. Berlatih dengan STRUCT dan array

Set data berikutnya adalah waktu putaran pelari di lintasan. Tiap putaran akan disebut "split".

Dengan kueri ini, coba gunakan sintaksis STRUCT dan perhatikan berbagai jenis kolom dalam container struct:

#standardSQL SELECT STRUCT("Rudisha" as name, 23.4 as split) as runner

Baris	runner.name	runner.split
1	Rudisha	23,4

Apa yang Anda perhatikan terkait alias kolom? Karena ada kolom yang tersusun bertingkat di dalam struct (name dan split adalah subset dari runner), Anda akan mendapatkan notasi titik.

Bagaimana jika pelari memiliki beberapa waktu split untuk sekali lomba (seperti waktu per putaran)?

Tentu saja dengan array!

Jalankan kueri di bawah ini untuk mengonfirmasi:

#standardSQL SELECT STRUCT("Rudisha" as name, [23.4, 26.3, 26.4, 26.1] as splits) AS runner

Baris	runner.name	runner.splits
1	Rudisha	23,4
		26,3
		26,4
		26,1

Ringkasnya:

Struct adalah container yang dapat memiliki beberapa nama kolom dan jenis data yang tersusun bertingkat di dalamnya.
Array dapat menjadi salah satu jenis kolom di dalam Struct (seperti yang ditunjukkan di atas dengan kolom splits).

Berlatih menyerap data JSON

Buat set data baru bernama racing.
Klik set data racing, lalu klik Create table.

Catatan: Anda mungkin harus memperluas jendela browser untuk melihat opsi Create table.

Source: pilih Google Cloud Storage pada dropdown Create table from.
Select file from Cloud Storage bucket: cloud-training/data-insights-course/labs/optimizing-for-performance/race_results.json
File format: JSONL (Newline delimited JSON)
Pada Schema, klik penggeser Edit as text dan tambahkan kode berikut:

[ { "name": "race", "type": "STRING", "mode": "NULLABLE" }, { "name": "participants", "type": "RECORD", "mode": "REPEATED", "fields": [ { "name": "name", "type": "STRING", "mode": "NULLABLE" }, { "name": "splits", "type": "FLOAT", "mode": "REPEATED" } ] } ]

Namai tabel baru tersebut dengan race_results.
Klik Create table.
Setelah pekerjaan pemuatan berhasil, pratinjau skema untuk tabel yang baru dibuat:

Kolom manakah yang merupakan STRUCT? Bagaimana Anda mengetahuinya?

Kolom participants adalah STRUCT karena jenisnya RECORD.

Kolom manakah yang merupakan ARRAY?

Kolom participants.splits adalah array float di dalam struct participants induk. Kolom ini memiliki mode REPEATED yang menandakan array. Nilai array ini disebut nilai bertingkat karena merupakan beberapa nilai di dalam satu kolom.

Klik Check my progress untuk memverifikasi tujuan. Membuat set data dan tabel untuk menyerap data JSON

Berlatih membuat kueri kolom berulang dan bertingkat

Mari kita lihat semua pelari untuk lomba 800 Meter:

#standardSQL SELECT * FROM racing.race_results

Berapa banyak baris yang ditampilkan?

Jawaban: 1

Bagaimana jika Anda ingin mencantumkan nama masing-masing pelari dan jenis lombanya?

Jalankan skema di bawah ini dan lihat apa yang terjadi:

#standardSQL SELECT race, participants.name FROM racing.race_results

Error: Cannot access field name on a value with type ARRAY<STRUCT<name STRING, splits ARRAY<FLOAT64>>>> at [2:27]

Sama seperti jika Anda lupa menggunakan GROUP BY saat Anda memakai fungsi agregasi, di sini ada dua tingkat perincian yang berbeda. Satu baris untuk lomba dan tiga baris untuk nama peserta. Jadi bagaimana cara mengubah yang berikut...

Baris	race	participants.name
1	800M	Rudisha
2	???	Makhloufi
3	???	Murphy

...menjadi berikut:

Baris	race	participants.name
1	800M	Rudisha
2	800M	Makhloufi
3	800M	Murphy

Dalam SQL relasional tradisional, jika Anda memiliki tabel lomba dan tabel peserta, apa yang akan Anda lakukan untuk mendapatkan informasi dari kedua tabel tersebut? Anda akan menggabungkan keduanya menggunakan fungsi JOIN. Di sini, STRUCT peserta (yang secara konseptual sangat mirip dengan tabel) sudah menjadi bagian dari tabel race Anda, tetapi belum berkorelasi secara benar dengan kolom "race" yang non-STRUCT.

Dapatkah Anda memikirkan perintah SQL yang berisi dua kata yang akan Anda gunakan untuk mengorelasikan lomba 800M dengan masing-masing pelari di tabel pertama?

Jawaban: CROSS JOIN

Bagus.

Sekarang coba jalankan ini:

#standardSQL SELECT race, participants.name FROM racing.race_results CROSS JOIN participants # this is the STRUCT (it is like a table within a table)

Table name "participants" missing dataset while no default dataset is set in the request.

Meskipun STRUCT peserta terlihat seperti sebuah tabel, namun secara teknis masih merupakan sebuah kolom di tabel racing.race_results.

Tambahkan nama set data ke kueri:

#standardSQL SELECT race, participants.name FROM racing.race_results CROSS JOIN race_results.participants # full STRUCT name

Lalu klik Run.

Wow! Anda berhasil membuat daftar semua pelari untuk tiap lomba!

Baris	race	name
1	800M	Rudisha
2	800M	Makhloufi
3	800M	Murphy
4	800M	Bosse
5	800M	Rotich
6	800M	Lewandowski
7	800M	Kipketer
8	800M	Berian

Anda dapat menyederhanakan kueri terakhir dengan:

Menambahkan alias untuk tabel asli
Mengganti kata “CROSS JOIN” dengan koma (tanda koma secara implisit melakukan cross join)

Tindakan ini akan memberi Anda hasil kueri yang sama:

#standardSQL SELECT race, participants.name FROM racing.race_results AS r, r.participants

Jika ada lebih dari satu jenis lomba (800M, 100M, 200M), bukankah CROSS JOIN hanya akan menghubungkan tiap nama pelari dengan tiap kemungkinan lomba seperti Cartesian product?

Jawaban: Tidak. Ini adalah cross join terkorelasi yang hanya membuka elemen yang terkait dengan satu baris. Untuk mendapatkan info lebih lanjut, baca bagian bekerja dengan ARRAY dan STRUCT

Rangkuman STRUCT:

STRUCT SQL hanyalah sebuah container kolom data lain yang dapat memiliki jenis data berbeda. Kata struct berarti struktur data. Ingat contoh sebelumnya: STRUCT(``"Rudisha" as name, [23.4, 26.3, 26.4, 26.1] as splits``)`` AS runner
STRUCT diberi alias (seperti runner di atas) dan secara konseptual dapat dianggap sebagai tabel di dalam tabel utama Anda.
STRUCT (dan ARRAY) harus dibuka sebelum Anda dapat mengoperasikan elemennya. Gunakan fungsi UNNEST() pada nama struct itu sendiri atau kolom struct yang berupa array untuk membuka dan meratakannya ke format yang mudah dibaca.

Tugas 7. Pertanyaan lab: STRUCT()

Jawab pertanyaan di bawah ini menggunakan tabel racing.race_results yang Anda buat sebelumnya.

Tugas: Tulis kueri untuk menghitung jumlah total pelari yang ada di tabel menggunakan fungsi COUNT.

Untuk memulai, gunakan kueri yang sudah ditulis sebagian di bawah ini:

#standardSQL SELECT COUNT(participants.name) AS racer_count FROM racing.race_results

Catatan: Ingat, Anda harus melakukan cross join di nama struct Anda sebagai sumber data tambahan setelah FROM.

Solusi yang dapat dilakukan:

#standardSQL SELECT COUNT(p.name) AS racer_count FROM racing.race_results AS r, UNNEST(r.participants) AS p

Baris	racer_count
1	8

Jawaban: Ada 8 orang pelari yang mengikuti lomba tersebut.

Klik Check my progress untuk memverifikasi tujuan. Menjalankan kueri untuk menghitung jumlah total pelari yang ada di tabel menggunakan fungsi COUNT.

Tugas 8. Pertanyaan lab: Membuka array dengan UNNEST( )

Tulis kueri yang akan mencantumkan total waktu lomba untuk pelari yang namanya dimulai dengan huruf R. Urutkan hasilnya dengan total waktu tercepat terlebih dahulu. Gunakan operator UNNEST() dan mulai dengan kueri yang sudah ditulis sebagian di bawah ini.

Lengkapi kueri:

#standardSQL SELECT p.name, SUM(split_times) as total_race_time FROM racing.race_results AS r , r.participants AS p , p.splits AS split_times WHERE GROUP BY ORDER BY ;

Note:

Anda perlu membuka struct dan array di dalam struct sebagai sumber data setelah klausa FROM Anda.
Pastikan untuk menggunakan alias jika diperlukan.

Solusi yang dapat dilakukan:

#standardSQL SELECT p.name, SUM(split_times) as total_race_time FROM racing.race_results AS r , UNNEST(r.participants) AS p , UNNEST(p.splits) AS split_times WHERE p.name LIKE 'R%' GROUP BY p.name ORDER BY total_race_time ASC;

Baris	name	total_race_time
1	Rudisha	102.19999999999999
2	Rotich	103.6

Klik Check my progress untuk memverifikasi tujuan. Menjalankan kueri yang akan mencantumkan total waktu lomba untuk pelari yang namanya dimulai dengan huruf R

Tugas 9. Memfilter dalam nilai array

Anda kebetulan melihat bahwa waktu putaran tercepat yang tercatat untuk lomba lari 800 M adalah 23,2 detik, tetapi Anda tidak melihat pelari mana yang berlari pada putaran tersebut. Buat kueri yang menampilkan hasil tersebut.

Selesaikan kueri yang sudah ditulis sebagian:

#standardSQL SELECT p.name, split_time FROM racing.race_results AS r , r.participants AS p , p.splits AS split_time WHERE split_time = ;

Solusi yang dapat dilakukan:

#standardSQL SELECT p.name, split_time FROM racing.race_results AS r , UNNEST(r.participants) AS p , UNNEST(p.splits) AS split_time WHERE split_time = 23.2;

Baris	name	split_time
1	Kipketer	23,2

Klik Check my progress untuk memverifikasi tujuan. Menjalankan kueri untuk melihat pelari mana yang mendapatkan waktu putaran tercepat

Selamat!

Anda telah berhasil menyerap set data JSON, membuat ARRAY dan STRUCT, serta menghapus tingkatan data semi-terstruktur untuk mendapatkan insight.

Langkah berikutnya/Pelajari lebih lanjut

Untuk mendapatkan info lebih lanjut, baca bagian Bekerja dengan Array.
Lihat lab ini:

Sertifikasi dan pelatihan Google Cloud

...membantu Anda mengoptimalkan teknologi Google Cloud. Kelas kami mencakup keterampilan teknis dan praktik terbaik untuk membantu Anda memahami dengan cepat dan melanjutkan proses pembelajaran. Kami menawarkan pelatihan tingkat dasar hingga lanjutan dengan opsi on demand, live, dan virtual untuk menyesuaikan dengan jadwal Anda yang sibuk. Sertifikasi membantu Anda memvalidasi dan membuktikan keterampilan serta keahlian Anda dalam teknologi Google Cloud.

Manual Terakhir Diperbarui pada 08 Mei 2025

Lab Terakhir Diuji pada 08 Mei 2025

Hak cipta 2025 Google LLC. Semua hak dilindungi undang-undang. Google dan logo Google adalah merek dagang dari Google LLC. Semua nama perusahaan dan produk lain mungkin adalah merek dagang masing-masing perusahaan yang bersangkutan.

Bekerja dengan JSON, Array, dan Struct di BigQuery

Bekerja dengan JSON, Array, dan Struct di BigQuery

GSP416

Ringkasan

Yang akan Anda lakukan

Penyiapan dan persyaratan

Sebelum mengklik tombol Start Lab

Cara memulai lab dan login ke Google Cloud Console

Membuka konsol BigQuery

Tugas 1. Membuat set data baru untuk menyimpan tabel

Tugas 2. Berlatih bekerja dengan array di SQL

Memuat JSON semi-terstruktur ke BigQuery

Tugas 3. Membuat array Anda sendiri dengan ARRAY_AGG()

Tugas 4. Membuat kueri tabel yang berisi array

Tugas 5. Pengantar STRUCT

Menjelajahi set data dengan STRUCT

Tugas 6. Berlatih dengan STRUCT dan array

Berlatih menyerap data JSON

Berlatih membuat kueri kolom berulang dan bertingkat

Tugas 7. Pertanyaan lab: STRUCT()

Tugas 8. Pertanyaan lab: Membuka array dengan UNNEST( )

Tugas 9. Memfilter dalam nilai array

Selamat!

Langkah berikutnya/Pelajari lebih lanjut

Sertifikasi dan pelatihan Google Cloud

Sebelum memulai

Gunakan penjelajahan rahasia

Login ke Konsol

Gunakan penjelajahan rahasia untuk menjalankan lab