Punkty kontrolne
Run a query (dataset: samples, table: shakespeare, substring: raisin)
/ 10
Run a query (dataset: samples, table: shakespeare, substring: huzzah)
/ 10
Create a new dataset (name: babynames)
/ 20
Load the data into a new table
/ 20
Run queries against your dataset table
/ 20
Remove the babynames dataset
/ 20
BigQuery: Qwik Start – wiersz poleceń
GSP071
Opis
Przechowywanie ogromnych zbiorów danych i tworzenie do nich zapytań może być czasochłonne i drogie, jeśli nie ma się odpowiedniego sprzętu i infrastruktury. BigQuery to bezserwerowa, wysoce skalowalna chmurowa hurtownia danych, która rozwiązuje ten problem, pozwalając na bardzo szybkie wykonywanie zapytań SQL z wykorzystaniem mocy obliczeniowej infrastruktury Google. Wystarczy, że przeniesiesz swoje dane do BigQuery i całą ciężką pracę pozwolisz wykonać nam. Możesz kontrolować opcje dostępu zarówno do projektu, jak i do danych w zależności od wymagań Twojej firmy (takich jak potrzeba umożliwienia innym przeglądania danych lub wysyłania w związku z nimi zapytań).
Dostęp do BigQuery możesz uzyskać przez konsolę, interfejs internetowy lub narzędzie wiersza poleceń, korzystając z różnych bibliotek klienta, takich jak Java, .NET czy Python. Do interakcji z BigQuery możesz wykorzystać też rozwiązania oferowane przez licznych dostawców.
Z tego modułu praktycznego dowiesz się, jak używać bq
, opartego na języku Python narzędzia wiersza poleceń w BigQuery, w celu tworzenia zapytań do tabel publicznych i wczytywania przykładowych danych w BigQuery.
Jakie zadania wykonasz
- Tworzenie zapytania do publicznego zbioru danych
- Tworzenie nowego zbioru danych
- Wczytywanie danych do nowej tabeli
- Tworzenie zapytania do tabeli niestandardowej
Konfiguracja i wymagania
Zanim klikniesz przycisk Rozpocznij moduł
Zapoznaj się z tymi instrukcjami. Moduły mają limit czasowy i nie można ich zatrzymać. Gdy klikniesz Rozpocznij moduł, na liczniku wyświetli się informacja o tym, na jak długo udostępniamy Ci zasoby Google Cloud.
W tym praktycznym module możesz spróbować swoich sił w wykonywaniu opisywanych działań w prawdziwym środowisku chmury, a nie w jego symulacji lub wersji demonstracyjnej. Otrzymasz nowe, tymczasowe dane logowania, dzięki którym zalogujesz się i uzyskasz dostęp do Google Cloud na czas trwania modułu.
Do ukończenia modułu potrzebne będą:
- dostęp do standardowej przeglądarki internetowej (zalecamy korzystanie z przeglądarki Chrome).
- Odpowiednia ilość czasu na ukończenie modułu – pamiętaj, że gdy rozpoczniesz, nie możesz go wstrzymać.
Rozpoczynanie modułu i logowanie się w konsoli Google Cloud
-
Kliknij przycisk Rozpocznij moduł. Jeśli moduł jest odpłatny, otworzy się wyskakujące okienko, w którym możesz wybrać formę płatności. Po lewej stronie znajduje się panel Szczegóły modułu z następującymi elementami:
- przyciskiem Otwórz konsolę Google Cloud;
- czasem, który Ci pozostał;
- tymczasowymi danymi logowania, których musisz użyć w tym module;
- innymi informacjami potrzebnymi do ukończenia modułu.
-
Kliknij Otwórz konsolę Google Cloud (lub kliknij prawym przyciskiem myszy i wybierz Otwórz link w oknie incognito, jeśli korzystasz z przeglądarki Chrome).
Moduł uruchomi zasoby, po czym otworzy nową kartę ze stroną logowania.
Wskazówka: otwórz karty obok siebie w osobnych oknach.
Uwaga: jeśli pojawi się okno Wybierz konto, kliknij Użyj innego konta. -
W razie potrzeby skopiuj nazwę użytkownika znajdującą się poniżej i wklej ją w oknie logowania.
{{{user_0.username | "Username"}}} Nazwę użytkownika znajdziesz też w panelu Szczegóły modułu.
-
Kliknij Dalej.
-
Skopiuj podane niżej hasło i wklej je w oknie powitania.
{{{user_0.password | "Password"}}} Hasło znajdziesz też w panelu Szczegóły modułu.
-
Kliknij Dalej.
Ważne: musisz użyć danych logowania podanych w module. Nie używaj danych logowania na swoje konto Google Cloud. Uwaga: korzystanie z własnego konta Google Cloud w tym module może wiązać się z dodatkowymi opłatami. -
Na kolejnych stronach wykonaj następujące czynności:
- Zaakceptuj Warunki korzystania z usługi.
- Nie dodawaj opcji odzyskiwania ani uwierzytelniania dwuskładnikowego (ponieważ konto ma charakter tymczasowy).
- Nie rejestruj się w bezpłatnych wersjach próbnych.
Poczekaj, aż na karcie otworzy się konsola Google Cloud.
Aktywowanie Cloud Shell
Cloud Shell to maszyna wirtualna oferująca wiele narzędzi dla programistów. Zawiera stały katalog domowy o pojemności 5 GB i działa w Google Cloud. Dzięki wierszowi poleceń Cloud Shell zyskujesz dostęp do swoich zasobów Google Cloud.
- Kliknij Aktywuj Cloud Shell na górze konsoli Google Cloud.
Po połączeniu użytkownik od razu jest uwierzytelniony. Uruchomi się Twój projekt o identyfikatorze PROJECT_ID. Dane wyjściowe zawierają wiersz z zadeklarowanym identyfikatorem PROJECT_ID dla tej sesji:
gcloud
to narzędzie wiersza poleceń Google Cloud. Jest ono już zainstalowane w Cloud Shell i obsługuje funkcję autouzupełniania po naciśnięciu tabulatora.
- (Opcjonalnie) Aby wyświetlić listę aktywnych kont, użyj tego polecenia:
-
Kliknij Autoryzuj.
-
Dane wyjściowe powinny wyglądać tak:
Dane wyjściowe:
- (Opcjonalnie) Aby wyświetlić identyfikator projektu, użyj tego polecenia:
Dane wyjściowe:
Przykładowe dane wyjściowe:
gcloud
w Google Cloud znajdziesz w opisie narzędzia wiersza poleceń gcloud.
Zadanie 1. Analizowanie tabeli
BigQuery oferuje wiele przykładowych tabel, do których możesz wysyłać zapytania. W tym module wyślesz zapytania do tabeli shakespeare
, której wpisy to wszystkie słowa z każdej sztuki Szekspira.
Aby przeanalizować schemat szekspirowskiej tabeli w przykładowym zbiorze danych, uruchom polecenie:
Oto co oznaczają poszczególne części tego polecenia:
-
bq
pozwala na wywołanie narzędzia wiersza poleceń BigQuery, -
show
to działanie, - z kolei fragment
bigquery-public-data:samples.shakespeare
zawiera nazwę projektu w BigQuery oraz nazwę interesującej Cię tabeli.
Dane wyjściowe:
Zadanie 2. Uruchamianie polecenia pomocy
Gdy do poleceń pomocy dołączysz nazwę polecenia, wyświetlą się dane na jego temat.
- Na przykład wywołanie pomocy
bq help
sprawia, że pobierane są informacje o poleceniuquery
:
- Aby zobaczyć listę wszystkich poleceń używanych przez
bq
, wystarczy uruchomić poleceniebq help
.
Zadanie 3. Uruchamianie zapytania
Teraz uruchomisz zapytanie, aby sprawdzić, ile razy w dziełach Szekspira pojawia się podłańcuch „raisin”.
- W tym celu użyj polecenia
bq query "[SQL_STATEMENT]"
:
-
Jeśli wewnątrz [SQL_STATEMENT] pojawi się jakikolwiek cudzysłów, zmodyfikuj go, poprzedzając znakiem \.
-
Możesz też użyć innego cudzysłowu na zewnątrz [SQL_STATEMENT] (' zamiast ").
- W Cloud Shell uruchom standardowe zapytanie SQL, aby policzyć liczbę wystąpień podłańcucha „raisin” we wszystkich dziełach Szekspira:
W tym poleceniu:
-
--use_legacy_sql=false
sprawia, że domyślną składnią zapytań jest standardowa wersja SQL.
Dane wyjściowe:
Z danych w tabeli możemy wywnioskować, że choć samo słowo raisin nie występuje w żadnym dziele Szekspira, to w kilku pojawia się tworzący to słowo ciąg liter.
Testowanie ukończonego zadania
Kliknij Sprawdź postępy, aby zobaczyć stan realizacji zadania. Jeśli udało Ci się uruchomić zapytanie do publicznego zbioru danych, wyświetli się odpowiedni wynik.
Jeśli spróbujesz wyszukać słowo, które nie pojawia się w dziełach Szekspira, nie zostaną zwrócone żadne wyniki.
- Uruchom polecenie wyszukania wyrazu „huzzah”, które nie zwróci dopasowań:
Testowanie ukończonego zadania
Kliknij Sprawdź postępy, aby zobaczyć stan realizacji zadania. Jeśli udało Ci się uruchomić zapytanie do publicznego zbioru danych, wyświetli się odpowiedni wynik.
Zadanie 4. Tworzenie nowej tabeli
Teraz utworzysz własną tabelę. Każda tabela przechowywana jest w zbiorze danych. Zbiór danych to grupa zasobów, takich jak tabele i widoki.
Tworzenie nowego zbioru danych
- Użyj polecenia
bq ls
, aby wyświetlić listę wszystkich zbiorów danych w projekcie:
Powrócisz do wiersza poleceń, ponieważ w projekcie nie ma jeszcze żadnego zbioru danych.
- Uruchom polecenie składające się z elementu
bq ls
, identyfikatora projektubigquery-public-data
oraz dwukropka (:), aby wyświetlić listę zbiorów danych w tym projekcie:
Dane wyjściowe:
Teraz utwórz zbiór danych. Nazwa zbioru danych może składać się z maksymalnie 1024 znaków i zawierać litery A–Z (albo a–z), cyfry 0–9 oraz podkreślenia, ale nie może zaczynać się liczbą lub podkreśleniem ani zawierać spacji.
- W projekcie użyj polecenia
bq mk
, aby utworzyć nowy zbiór danych o nazwiebabynames
:
Przykładowe dane wyjściowe:
Testowanie ukończonego zadania
Kliknij Sprawdź postępy, aby zobaczyć stan realizacji zadania. Jeśli udało Ci się utworzyć zbiór danych BigQuery o nazwie babynames, wyświetli się odpowiedni wynik.
- Uruchom polecenie
bq ls
, aby upewnić się, że zbiór danych jest teraz częścią Twojego projektu:
Przykładowe dane wyjściowe:
Przesyłanie zbioru danych
Zanim utworzysz tabelę, musisz dodać zbiór danych do swojego projektu. Plik z danymi niestandardowymi, którego użyjesz, zawiera około 7 MB danych dotyczących popularnych imion dla dzieci (informacje zostały dostarczone przez US Social Security Administration, instytucję w Stanach Zjednoczonych zajmującą się ubezpieczeniami społecznymi).
- Aby dodać plik ZIP z imionami dla dzieci do swojego projektu, uruchom następujące polecenie, korzystając przy tym z adresu URL pliku danych:
- Wyświetl listę plików:
Wyświetli się nazwa dodanego do projektu pliku.
- Teraz rozpakuj plik:
- To spora lista plików tekstowych. Ponownie wyświetl listę plików:
Polecenie bq load
pozwala w jednym kroku utworzyć lub zaktualizować tabelę oraz wczytać dane.
Użyjesz polecenia bq load
w celu przesłania pliku źródłowego do nowej tabeli o nazwie names2010 (imiona_2010) w utworzonym przez Ciebie zbiorze danych babynames. Domyślnie procesy przebiegają synchronicznie i trwają kilka sekund.
Argumenty bq load
, które uruchomisz, to:
- Utwórz tabelę:
Przykładowe dane wyjściowe:
Testowanie ukończonego zadania
Kliknij Sprawdź postępy, aby zobaczyć stan realizacji zadania. Jeśli udało Ci się wczytać dane do tabeli zbioru danych, wyświetli się odpowiedni wynik.
- Uruchom
bq ls
na zbiorzebabynames
, aby sprawdzić, czy tabela wyświetla się w zbiorze danych:
Dane wyjściowe:
- Zastosuj polecenie
bq show
do swojej tabeli zbioru danychdataset.table
, aby wyświetlić schemat:
Dane wyjściowe:
-E
. Więcej na temat kodowania znaków dowiesz się z przewodnika wprowadzającego do ładowania danych.
Zadanie 5. Uruchamianie zapytań
Teraz możesz uruchomić zapytanie do danych i otrzymać interesujące wyniki.
- Uruchom następujące polecenie, aby zobaczyć 5 najpopularniejszych imion dla dziewczynek:
Dane wyjściowe:
- Uruchom następujące polecenie, aby wyświetlić 5 najrzadszych imion dla chłopców:
Dane wyjściowe:
Testowanie ukończonego zadania
Kliknij Sprawdź postępy, aby zobaczyć stan realizacji zadania. Jeśli udało Ci się uruchomić zapytanie do niestandardowego zbioru danych, wyświetli się odpowiedni wynik.
Zadanie 6. Sprawdź swoją wiedzę
Poniżej znajdziesz pytania jednokrotnego wyboru, które pomogą Ci utrwalić wiedzę zdobytą w tym module. Odpowiedz na nie najlepiej, jak potrafisz.
Zadanie 7. Czyszczenie danych
- Uruchom polecenie
bq rm
, aby usunąć zbiór danychbabynames
przy użyciu flagi-r
i usunąć wszystkie tabele w zbiorze danych:
- Potwierdź polecenie usunięcia, wpisując
Y
.
Testowanie ukończonego zadania
Kliknij Sprawdź postępy, aby zobaczyć stan realizacji zadania. Jeśli udało Ci się usunąć zbiór danych babynames, wyświetli się odpowiedni wynik.
Gratulacje!
Już wiesz, jak używać wiersza poleceń, aby tworzyć zapytania do tabel publicznych i wczytywać przykładowe dane w BigQuery.
Kolejne kroki / Więcej informacji
Ten moduł należy do serii modułów Qwik Start. Opracowaliśmy je, aby dać Ci przedsmak bogactwa funkcji dostępnych w Google Cloud. Wyszukaj „Qwik Start” w katalogu modułów i znajdź kolejny moduł, który Cię interesuje.
Szkolenia i certyfikaty Google Cloud
…pomogą Ci wykorzystać wszystkie możliwości technologii Google Cloud. Nasze zajęcia obejmują umiejętności techniczne oraz sprawdzone metody, które ułatwią Ci szybką naukę i umożliwią jej kontynuację. Oferujemy szkolenia na poziomach od podstawowego po zaawansowany prowadzone w trybach wirtualnym, na żądanie i na żywo, dzięki czemu możesz dopasować program szkoleń do swojego napiętego harmonogramu. Certyfikaty umożliwią udokumentowanie i potwierdzenie Twoich umiejętności oraz doświadczenia w zakresie technologii Google Cloud.
Ostatnia aktualizacja instrukcji: 26 stycznia 2024 r.
Ostatni test modułu: 24 sierpnia 2023 r.
Copyright 2024 Google LLC. Wszelkie prawa zastrzeżone. Google i logo Google są znakami towarowymi Google LLC. Wszelkie inne nazwy firm i produktów mogą być znakami towarowymi odpowiednich podmiotów, z którymi są powiązane.