
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create a cloud storage bucket
/ 25
Upload CSV files to Cloud Storage
/ 25
Create a Cloud SQL instance
/ 25
Create a database
/ 25
SQL (Structured Query Language) to standardowy język używany przy wykonywaniu operacji na danych, umożliwiający zadawanie pytań i uzyskiwanie informacji z ustrukturyzowanych zbiorów danych. Powszechnie wykorzystuje się go do zarządzania bazami danych oraz wykonywania zadań takich jak wpisywanie rejestru transakcji do relacyjnych baz danych czy analizowanie petabajtów danych.
Moduł składa się z 2 części. W pierwszej nauczysz się podstawowych słów kluczowych SQL. Wykorzystasz je w BigQuery, uruchamiając zapytania do publicznego zbioru danych zawierającego informacje o przejazdach rowerami miejskimi w Londynie.
Z drugiej części dowiesz się, jak eksportować podzbiory zbioru danych o wykorzystaniu rowerów miejskich w Londynie do plików CSV, które następnie prześlesz do Cloud SQL. Nauczysz się także, jak za pomocą Cloud SQL tworzyć bazy danych i tabele oraz nimi zarządzać. Na koniec przećwiczysz użycie dodatkowych słów kluczowych SQL umożliwiających wykonywanie operacji na danych i ich edytowanie.
W tym module nauczysz się, jak:
Bardzo ważne: przed rozpoczęciem tego modułu wyloguj się z osobistego i służbowego konta Gmail.
To jest moduł dla użytkowników początkujących. Zakładamy więc, że masz niewielkie doświadczenie z SQL lub nie masz go wcale. Znajomość Cloud Storage i Cloud Shell może być pomocna, ale nie jest konieczna. W tym module nauczysz się podstaw czytania i pisania zapytań w języku SQL, a także przećwiczysz zdobyte umiejętności przy użyciu BigQuery oraz Cloud SQL.
Zanim rozpoczniesz ten moduł, spróbuj ocenić swój stopień znajomości SQL. Poniżej znajdziesz trudniejsze moduły pozwalające na wykorzystanie wiedzy w bardziej złożonych przykładach.
Aby rozpocząć, przewiń stronę w dół i wykonaj opisane niżej kroki konfiguracji środowiska modułu.
Zapoznaj się z tymi instrukcjami. Moduły mają limit czasowy i nie można ich zatrzymać. Gdy klikniesz Rozpocznij moduł, na liczniku wyświetli się informacja o tym, na jak długo udostępniamy Ci zasoby Google Cloud.
W tym praktycznym module możesz spróbować swoich sił w wykonywaniu opisywanych działań w prawdziwym środowisku chmury, a nie w jego symulacji lub wersji demonstracyjnej. Otrzymasz nowe, tymczasowe dane logowania, dzięki którym zalogujesz się i uzyskasz dostęp do Google Cloud na czas trwania modułu.
Do ukończenia modułu potrzebne będą:
Kliknij przycisk Rozpocznij moduł. Jeśli moduł jest odpłatny, otworzy się wyskakujące okienko, w którym możesz wybrać formę płatności. Po lewej stronie znajduje się panel Szczegóły modułu z następującymi elementami:
Kliknij Otwórz konsolę Google Cloud (lub kliknij prawym przyciskiem myszy i wybierz Otwórz link w oknie incognito, jeśli korzystasz z przeglądarki Chrome).
Moduł uruchomi zasoby, po czym otworzy nową kartę ze stroną logowania.
Wskazówka: otwórz karty obok siebie w osobnych oknach.
W razie potrzeby skopiuj nazwę użytkownika znajdującą się poniżej i wklej ją w oknie logowania.
Nazwę użytkownika znajdziesz też w panelu Szczegóły modułu.
Kliknij Dalej.
Skopiuj podane niżej hasło i wklej je w oknie powitania.
Hasło znajdziesz też w panelu Szczegóły modułu.
Kliknij Dalej.
Na kolejnych stronach wykonaj następujące czynności:
Poczekaj, aż na karcie otworzy się konsola Google Cloud.
Jak już wspomnieliśmy, SQL umożliwia pozyskiwanie informacji z „ustrukturyzowanych zbiorów danych”. Ustrukturyzowany zbiór danych ma jasno określone reguły i formatowanie. Często uporządkowany jest w formie tabeli lub danych w wierszach i kolumnach.
Przykładem nieustrukturyzowanych danych są pliki graficzne. Nieustrukturyzowane dane nie działają w SQL i nie mogą być przechowywane w zbiorach danych ani tabelach BigQuery (przynajmniej nie natywnie). Aby móc wykonywać operacje na (między innymi) pliku graficznym, należałoby skorzystać z usługi takiej jak Cloud Vision – na przykład bezpośrednio poprzez jej interfejs API.
Poniżej znajdziesz przykład ustrukturyzowanego zbioru danych w formie prostej tabeli:
Użytkownik |
Cena |
Wysłano |
Sean |
35 USD |
Tak |
Rocky |
50 USD |
Nie |
Jeśli masz już doświadczenie z Arkuszami Google, powinno to wyglądać znajomo. W tabeli znajdują się kolumny Użytkownik, Cena i Wysłano oraz 2 wiersze składające się z wartości wpisanych dla poszczególnych kolumn.
Ogólnie rzecz biorąc, baza danych to zestaw składający się z co najmniej 1 tabeli. Choć SQL jest narzędziem do zarządzania ustrukturyzowanymi bazami danych, często uruchamia się zapytania nie do całej bazy, a do jednej lub kilku połączonych ze sobą tabel (co będziemy robić również w tym module).
Ponieważ język SQL jest z natury fonetyczny, przed uruchomieniem zapytania warto zastanowić się nad tym, jakie informacje chcemy uzyskać (chyba że badamy dane tylko dla zabawy).
SQL ma gotowe słowa kluczowe, których używa się do tworzenia zapytań opartych na pseudoangielskiej składni SQL, tak aby silnik bazy danych zwrócił oczekiwaną odpowiedź.
Najważniejsze słowa kluczowe to SELECT
i FROM
:
SELECT
, aby określić, które pola ze zbioru danych chcesz pobrać.FROM
, aby określić, z których tabel chcesz pobrać dane.Wesprzyjmy się przykładem. Załóżmy, że masz tabelę example_table
, która zawiera kolumny USER (UŻYTKOWNIK), PRICE (CENA) i SHIPPED (WYSŁANO):
Przyjmijmy także, że chcesz pobrać tylko dane znajdujące się w kolumnie USER. Możesz to zrobić, uruchamiając zapytanie wykorzystujące słowa kluczowe SELECT
i FROM
:
Jeśli wykonasz podane powyżej polecenie, wybrane zostaną wszystkie nazwy z kolumny USER
znajdujące się w example_table
.
Przy użyciu słowa kluczowego SQL SELECT
można wybrać też wiele kolumn. Załóżmy, że chcesz pobrać dane, które znajdują się w kolumnach USER i SHIPPED. Aby to zrobić, zmodyfikuj poprzednie zapytanie SELECT
, dodając do niego kolejną wartość kolumny (pamiętaj, by oddzielić tę wartość przecinkiem):
Uruchomienie tego polecenia sprawi, że z pamięci pobrane zostaną dane USER
i SHIPPED
:
Tym prostym sposobem udało Ci się opanować 2 podstawowe słowa kluczowe SQL. Teraz zrobi się jeszcze ciekawiej.
Słowo kluczowe WHERE
to kolejne polecenie SQL, które filtruje tabele w poszukiwaniu określonych wartości kolumny. Przyjmijmy, że z tabeli example_table
chcesz pobrać nazwy użytkowników, których paczki zostały wysłane. Możesz dodać do zapytania słowo WHERE
, tak jak poniżej:
To polecenie zwraca z pamięci nazwy wszystkich użytkowników z kolumny USER, których paczki zostały wysłane (SHIPPED):
Skoro poznaliśmy już podstawy dotyczące słów kluczowych SQL, spróbuj wykorzystać zdobyte informacje, uruchamiając omówione typy zapytań w konsoli BigQuery.
Poniżej znajdziesz pytania jednokrotnego wyboru, które pomogą Ci utrwalić zdobytą dotychczas wiedzę. Odpowiedz na nie najlepiej, jak potrafisz.
BigQuery to w pełni zarządzana hurtownia danych, która może obsługiwać petabajty danych i działa w Google Cloud. Analitycy i badacze danych mogą szybko filtrować duże zbiory danych, tworzyć do nich zapytania, zbierać wyniki oraz wykonywać złożone operacje, nie martwiąc się o konfigurację czy zarządzanie serwerami. BigQuery jest dostarczane w formie narzędzia wiersza poleceń (zainstalowanego w Cloud Shell) lub konsoli sieciowej – obie formy pozwalają na zarządzanie danymi przechowywanymi w projektach Google Cloud i tworzenie do nich zapytań.
W tym module do uruchamiania zapytań SQL użyjesz konsoli sieciowej.
Otworzy się okno Witamy w usłudze BigQuery w Cloud Console. Zawiera ono link do krótkiego wprowadzenia oraz informacji o wersji.
Otworzy się konsola BigQuery.
Poświęćmy chwilę na omówienie kilku ważnych funkcji interfejsu użytkownika. Po prawej stronie konsoli znajduje się Edytor zapytań. To w nim wpisuje się i uruchamia polecenia SQL takie jak te, które przedstawiliśmy wcześniej. Pod spodem znajduje się „Historia zapytań”, czyli lista zapytań uruchomionych w przeszłości.
Obszar po lewej stronie konsoli to Menu nawigacyjne. Oprócz niewymagających wyjaśnień opcji związanych z historią zapytań, zapisanymi zapytaniami i historią zadań znajduje się tam karta Eksplorator.
Najwyższy poziom zasobów na karcie Eksplorator to projekty Google Cloud – czyli takie, jak tymczasowe projekty Google Cloud, w których logujesz się i których używasz w każdym module Google Cloud Skills Boost. Jak widać w konsoli i na ostatnim zrzucie ekranu, na karcie Eksplorator znajduje się tylko Twój projekt. Jeśli klikniesz strzałkę obok nazwy projektu, nic się nie wyświetli.
To dlatego, że projekt nie zawiera żadnych zbiorów danych ani tabel – nie ma nic, do czego można by utworzyć zapytanie. Wcześniej dowiedzieliśmy się, że zbiór danych zawiera tabele. Dodając dane do projektu, zwróć uwagę na następującą prawidłowość: w BigQuery projekt zawiera zbiory danych, a zbiór danych – tabele. Skoro zrozumieliśmy już wzorzec projekt > zbiór danych > tabela i zgłębiliśmy tajniki konsoli, spróbujmy przesłać dane, do których można utworzyć zapytania.
W tej sekcji pobierzesz do projektu dane publiczne, aby móc przećwiczyć uruchamianie poleceń SQL w BigQuery.
Kliknij + DODAJ.
Wybierz Oznacz projekt według nazwy gwiazdką.
Jako nazwę projektu wpisz bigquery-public-data.
Kliknij GWIAZDKĘ.
Pamiętaj, że w nowej karcie nadal pracujesz z poziomu projektu modułu. Wprawdzie pobraliśmy dostępny publicznie projekt zawierający zbiory danych i tabele, aby przeanalizować go w BigQuery, ale nie przełączyliśmy się na niego. Wszystkie zadania i usługi wciąż powiązane są z Twoim kontem Google Cloud Skills Boost. Możesz się o tym przekonać, sprawdzając pole projektu tuż przy samej górze konsoli:
bigquery-public-data
london_bicycles
cycle_hire
cycle_stations
W tym module użyjesz danych z tabeli cycle_hire. Otwórz tabelę cycle_hire
, po czym kliknij kartę Podgląd. Wyświetlona strona powinna przypominać tę:
Przyjrzyj się kolumnom i wartościom podanym w wierszach. Teraz do tabeli cycle_hire
możesz uruchomić zapytania SQL.
Poznaliśmy już podstawowe słowa kluczowe stosowane w zapytaniach SQL oraz omówiliśmy wzorzec danych BigQuery; mamy także dane, z którymi można pracować. Teraz możemy uruchomić polecenia SQL przy użyciu tej usługi.
Jeśli spojrzysz w prawy dolny róg konsoli, zobaczysz, że jest 83 434 866 wierszy danych dotyczących pojedynczych przejazdów rowerami publicznymi na terenie Londynu w latach 2015–2017 – trzeba przyznać, że to niemało.
Przyjrzyj się kluczowi end_station_name
w kolumnie siódmej, który wskazuje na miejsce docelowe przejazdu rowerem miejskim. Wcześniej jednak uruchom proste zapytanie, aby wyizolować kolumnę end_station_name
.
Po około 20 sekundach powinno zostać zwróconych 83 434 866 wierszy zawierających dane z kolumny, której dotyczyło zapytanie: end_station_name
.
A może sprawdzimy, ile przejazdów trwało co najmniej 20 minut?
WHERE
:Przeprocesowanie tego zapytania może potrwać około minuty.
SELECT *
zwraca wszystkie wartości kolumny z tabeli. Czas trwania (duration) mierzony jest w sekundach, dlatego użyliśmy wartości 1200 (60 × 20).
Jeśli spojrzysz w prawy dolny róg, zobaczysz, że zwróconych zostało 26 441 016 wierszy. Liczba ta stanowi ułamek całości (26 441 016 / 83 434 866), co oznacza, że około 30% przejazdów rowerem publicznym po Londynie trwało co najmniej 20 minut (dobre rozwiązanie na dłuższą metę).
Poniżej znajdziesz pytania jednokrotnego wyboru, które pomogą Ci utrwalić zdobytą dotychczas wiedzę. Odpowiedz na nie najlepiej, jak potrafisz.
Słowo kluczowe GROUP BY
zbiera wiersze wyników o wspólnych kryteriach (np. wartości kolumny) i zwraca wszystkie unikalne wpisy spełniające dane kryteria.
To użyteczne słowo kluczowe, które przydaje się do wyszukiwania informacji kategorialnych w tabelach.
Wynikiem jest lista unikalnych (niepowtarzalnych) wartości kolumny.
Gdybyśmy nie użyli słowa kluczowego GROUP BY
, zapytanie zwróciłoby wszystkie 84 434 866 wierszy. Zastosowanie GROUP BY
pozwala na wyświetlenie unikalnych wartości kolumny z tabeli. Możesz się o tym przekonać, spoglądając w prawy dolny róg. Zobaczysz 954 wiersze, co oznacza, że w Londynie są 954 unikalne miejsca, w których rozpoczęto przejazd rowerem publicznym.
Funkcja COUNT()
zwraca liczbę wierszy o takich samych kryteriach (np. wartości kolumny). W połączeniu z GROUP BY
może być bardzo przydatna.
Dodaj funkcję COUNT
do poprzedniego zapytania, aby dowiedzieć się, ile przejazdów rozpoczęło się w danym miejscu.
Wyniki pokazują, ile przejazdów rowerem miejskim rozpoczęło się w każdym z miejsc.
Kolejnym słowem kluczowym używanym w SQL jest AS
– umożliwia ono stworzenie aliasu tabeli lub kolumny. Alias to nowa nazwa nadawana zwróconej kolumnie lub tabeli (w zależności od tego, do czego słowo AS
się odnosi).
AS
do zapytania, które zostało uruchomione przed chwilą, aby zobaczyć, jak to wygląda w praktyce. Wyczyść zapytanie z edytora, po czym skopiuj i wklej następujące polecenie:W wynikach nazwa prawej kolumny zmieniła się z COUNT(*)
na num_starts
.
Jak widzimy, nazwa aliasu dla kolumny COUNT(*)
w zwróconej tabeli to num_starts
. „AS” jest przydatnym słowem kluczowym, zwłaszcza jeśli ma się do czynienia z dużymi zbiorami danych – skomplikowana nazwa tabeli czy kolumny może łatwo wypaść z pamięci (i zdarza się to częściej, niż myślisz).
Słowo kluczowe ORDER BY
sortuje dane zwrócone z zapytania w kolejności rosnącej lub malejącej na podstawie określonych kryteriów bądź wartości kolumny. Dodaj to słowo do poprzedniego zapytania, aby:
Każde z poniższych poleceń jest osobnym zapytaniem. Dla każdego polecenia:
Wyniki ostatniego zapytania zawierają listę miejsc początkowych według liczby przejazdów, które się w nich rozpoczęły.
Jak widać, najwięcej przejazdów rozpoczęło się na stacji „Hyde Park Corner, Hyde Park”. Są one jednak tylko ułamkiem całości (234 458 / 83 434 866) i stanowią mniej niż 1% wszystkich przejazdów.
Poniżej znajdziesz pytania jednokrotnego wyboru, które pomogą Ci utrwalić zdobytą dotychczas wiedzę. Odpowiedz na nie najlepiej, jak potrafisz.
Cloud SQL to w pełni zarządzana usługa bazy danych ułatwiająca konfigurację i obsługę relacyjnych baz danych PostgreSQL i MySQL w chmurze oraz zarządzanie i administrowanie nimi. Cloud SQL akceptuje 2 formaty danych: pliki zrzutu SQL (.sql) i pliki CSV (.csv). Za chwilę dowiesz się, jak wyeksportować podzbiory tabeli cycle_hire
do plików CSV i przesłać je do Cloud Storage jako lokalizacji pośredniej.
Tak powinno wyglądać ostatnie uruchomione przez Ciebie polecenie w konsoli BigQuery:
W sekcji Wyniki zapytania kliknij ZAPISZ WYNIKI > CSV (plik lokalny). Rozpocznie się pobieranie, w wyniku którego Twoje zapytanie zostanie zapisane jako plik CSV. Zapamiętaj lokalizację i nazwę pobranego pliku – wkrótce będzie Ci on potrzebny.
Wyczyść zapytanie z edytora, po czym skopiuj i uruchom następujące polecenie:
Zwraca ono tabelę zawierającą liczbę przejazdów rowerem miejskim, które zakończyły się w każdym z miejsc docelowych, uporządkowaną numerycznie od wartości najwyższej do najniższej.
Przejdź do konsoli Google Cloud. Utworzysz tam zasobnik na dane, do którego prześlesz utworzone przed chwilą pliki.
Wybierz Menu nawigacyjne > Cloud Storage > Zasobniki, a następnie kliknij UTWÓRZ ZASOBNIK.
Wpisz unikalną nazwę zasobnika, pozostaw wszystkie pozostałe ustawienia z wartościami domyślnymi i kliknij Utwórz.
Jeśli pojawi się okno Dostęp publiczny zostanie zablokowany
, kliknij Potwierdź.
Kliknij Sprawdź postępy poniżej, aby sprawdzić postęp pracy z modułem. Jeśli udało Ci się utworzyć zasobnik, wyświetli się odpowiedni wynik.
W konsoli Google Cloud powinien wyświetlać się teraz Twój nowo utworzony zasobnik Cloud Storage.
Kliknij PRZEŚLIJ > Prześlij pliki i wybierz plik CSV zawierający dane związane z miejscami początkowymi przejazdów (start_station_name
).
Następnie kliknij Otwórz. Powtórz te czynności dla pliku zawierającego dane związane z miejscami docelowymi przejazdów (end_station_name
).
Zmień nazwę pliku z danymi start_station_name
, klikając najpierw 3 kropki znajdujące się w pewnej odległości od pliku, a następnie zmień nazwę. Jako nazwę pliku wpisz start_station_data.csv
.
Zmień nazwę pliku z danymi end_station_name
, klikając najpierw 3 kropki znajdujące się w pewnej odległości od pliku, a następnie zmień nazwę. Jako nazwę pliku wpisz end_station_data.csv
.
Na liście Obiekty na stronie Szczegóły zasobnika powinny teraz występować obiekty start_station_data.csv
i end_station_data.csv
.
Kliknij Sprawdź postępy, żeby zobaczyć stan realizacji zadania. Jeśli udało Ci się przesłać obiekty CSV do zasobnika, wyświetli się odpowiedni wynik.
W konsoli wybierz Menu nawigacyjne > SQL.
Kliknij UTWÓRZ INSTANCJĘ > Wybierz MySQL.
Wpisz my-demo jako identyfikator instancji.
W polu Hasło wpisz bezpieczne hasło (zapamiętaj je).
Jako wersję bazy danych wybierz MySQL 8.
W polu Wybierz wersję Cloud SQL kliknij Enterprise.
W polu Gotowe wybierz Programowanie (4 vCPU, 16 GB RAM, 100 GB miejsca na dane, jedna strefa).
W polu Region ustaw wartość
W polu Wiele stref (wysoka dostępność) > Główna strefa ustaw
Kliknij UTWÓRZ INSTANCJĘ.
Kliknij Sprawdź postępy poniżej, aby sprawdzić postęp pracy z modułem. Jeśli udało Ci się skonfigurować instancję Cloud SQL, wyświetli się odpowiedni wynik.
Instancja Cloud SQL została już skonfigurowana, możesz więc utworzyć w niej bazę danych przy użyciu wiersza poleceń Cloud Shell.
Otwórz Cloud Shell, klikając ikonę w prawym górnym rogu konsoli.
Uruchom to polecenie, aby ustawić identyfikator projektu jako zmienną środowiskową:
Jeśli pojawi się pytanie [Y/n], naciśnij Y, a następnie Enter.
Wyświetli się link do otwarcia w przeglądarce. Otwórz ten link w tej samej przeglądarce, w której masz otwarte konto qwiklabs. Po zalogowaniu się otrzymasz kod weryfikacyjny do skopiowania. Wklej ten kod w Cloud Shell.
my-demo
własną nazwą instancji (o ile to konieczne):Powinny pojawić się wyniki podobne do tych:
Choć instancja Cloud SQL zawiera już skonfigurowane bazy danych, utworzysz własną bazę do przechowywania danych dotyczących przejazdów rowerem miejskim na terenie Londynu.
bike
:Powinny pojawić się te wyniki:
Kliknij Sprawdź postępy, by zobaczyć stan realizacji zadania. Jeśli udało Ci się utworzyć bazę danych w instancji Cloud SQL, wyświetli się odpowiedni wynik.
Ta instrukcja używa słowa kluczowego CREATE
, ale tym razem pojawia się w niej klauzula TABLE
, która określa, że utworzona ma zostać tabela, a nie baza danych. Słowo kluczowe USE
wskazuje bazę danych, z którą chcesz się połączyć. Masz już tabelę o nazwie „london1” zawierającą 2 kolumny: „start_station_name” i „num”. Część VARCHAR(255)
wskazuje na kolumnę z ciągiem o zmiennej długości, mogącą pomieścić do 255 znaków, a INT
to kolumna przechowująca wartości całkowite.
Dla obu kolumn dane wyjściowe powinny wyglądać tak:
W wyniku widzimy „Empty set”, ponieważ dane nie zostały jeszcze wczytane.
Wróć do konsoli Cloud SQL. Teraz prześlesz pliki CSV z danymi start_station_name
i end_station_name
do nowo utworzonych tabel „london1” i „london2”.
start_station_data.csv
. Kliknij Wybierz.bike
, a jako tabelę wpisz london1
.Wykonaj te same czynności dla drugiego pliku CSV.
end_station_data.csv
. Kliknij Wybierz.bike
, a jako tabelę wpisz london2
.Oba pliki CSV powinny być już przesłane do tabel w bazie danych bike
.
Powinno wyświetlić się 955 wierszy danych wyjściowych, po 1 na każdą unikalną nazwę miejsca.
Powinno wyświetlić się 959 wierszy danych wyjściowych, 1 na każdą unikalną nazwę miejsca plus 1 dodatkowy.
Teraz przedstawimy kilka innych słów kluczowych SQL, które pomagają w zarządzaniu danymi. Zacznijmy od DELETE
.
Po uruchomieniu obu poleceń dane wyjściowe powinny wyglądać tak:
Usunięte wiersze były nagłówkami kolumn z plików CSV. Słowo kluczowe DELETE
nie powoduje usunięcia pierwszego wiersza jako takiego – usunie ono wszystkie wiersze tabeli, które w danej kolumnie (w tym przypadku: „num”) mają określoną wartość (w tym przypadku: 0). Jeśli uruchomisz zapytania SELECT * FROM london1;
i SELECT * FROM london2;
, a następnie przewiniesz tabelę do góry, zobaczysz, że te wiersze już nie istnieją.
Słowo kluczowe INSERT INTO
pozwala na wstawianie wartości do tabel.
start_station_name
i wartością 1 w kolumnie num
:Słowo kluczowe INSERT INTO
wymaga tabeli („london1”) – utworzy ono nowy wiersz z wartościami dla kolumn wskazanych w pierwszym nawiasie (w tym przypadku „start_station_name” i „num”). Wszystko, co zostanie wpisane po klauzuli VALUES, zostanie wstawione jako wartości w nowym wierszu.
Powinny pojawić się te wyniki:
Jeśli uruchomisz zapytanie SELECT * FROM london1;
, zobaczysz dodatkowy wiersz dodany u dołu tabeli „london1”.
Ostatnim słowem kluczowym, którego się dziś nauczysz, jest UNION
. Łączy ono dane wyjściowe z co najmniej 2 zapytań SELECT
w zestaw wyników. Użyjesz słowa kluczowego UNION
do połączenia podzbiorów tabel „london1” i „london2”.
Przedstawione niżej połączone zapytanie pobierze określone dane z obu tabel i połączy je przy użyciu operatora UNION
.
Pierwsze zapytanie SELECT
wybiera 2 kolumny z tabeli „london1” i tworzy alias kolumny „start_station_name”, która zostaje ustawiona jako „top_stations”. Używa też słowa kluczowego WHERE
do pobrania nazw wyłącznie tych miejsc, z których rozpoczęło się ponad 100 tys. przejazdów rowerami miejskimi.
Drugie zapytanie SELECT
wybiera 2 kolumny z tabeli „london2” i używa słowa kluczowego WHERE
do pobrania nazw wyłącznie tych miejsc, w których zakończyło się ponad 100 tys. przejazdów rowerami miejskimi.
Umieszczone pomiędzy zapytaniami słowo kluczowe UNION
łączy wyniki tych zapytań poprzez zgrupowanie danych z tabel „london2” i „london1”. Ponieważ nastąpiło połączenie „london1” z „london2”, wyodrębnione kolumny to „top_stations” i „num”.
Słowo kluczowe ORDER BY
uporządkuje ostateczną, połączoną tabelę alfabetycznie według wartości w kolumnie „top_stations” w kolejności malejącej.
Przykładowe dane wyjściowe (Twoje wyniki mogą się różnić) :
Jak widzisz, 13 z 14 stacji to najpopularniejsze miejsca zarówno pod względem rozpoczęcia, jak i zakończenia przejazdów. Dzięki kilku podstawowym słowom kluczowym SQL udało Ci się utworzyć zapytanie do sporego zbioru danych, które zwróciło punkty danych i odpowiedzi na określone pytania.
W tym module nauczyliśmy się podstaw SQL oraz tego, jak stosować słowa kluczowe i uruchamiać zapytania w BigQuery i CloudSQL. Poznaliśmy podstawowe zagadnienia dotyczące projektów, baz danych i tabel. Wykorzystaliśmy w praktyce słowa kluczowe, które umożliwiają edytowanie danych i wykonywanie na nich operacji. Wiesz już, jak wczytywać dane do BigQuery oraz jak uruchamiać zapytania do tabel w praktyce. Dowiedzieliśmy się, jak utworzyć instancje w Cloud SQL, i przenieśliśmy podzbiory danych do tabel znajdujących się w bazach danych. Połączyliśmy i uruchomiliśmy zapytania w Cloud SQL, aby dojść do interesujących wniosków dotyczących miejsc w Londynie, w których rozpoczęto i zakończono przejazdy rowerami miejskimi.
Kontynuuj naukę i ćwiczenie korzystania z Cloud SQL i BigQuery w tych modułach Google Cloud Skill Boost:
Więcej informacji o badaniu danych znajdziesz w publikacji Data Science on the Google Cloud Platform, 2nd Edition: O'Reilly Media, Inc.
…pomogą Ci wykorzystać wszystkie możliwości technologii Google Cloud. Nasze zajęcia obejmują umiejętności techniczne oraz sprawdzone metody, które ułatwią Ci szybką naukę i umożliwią jej kontynuację. Oferujemy szkolenia na poziomach od podstawowego po zaawansowany prowadzone w trybach wirtualnym, na żądanie i na żywo, dzięki czemu możesz dopasować program szkoleń do swojego napiętego harmonogramu. Certyfikaty umożliwią udokumentowanie i potwierdzenie Twoich umiejętności oraz doświadczenia w zakresie technologii Google Cloud.
Ostatnia aktualizacja instrukcji: 11 października 2024 r.
Ostatni test modułu: 11 października 2024 r.
Copyright 2025 Google LLC. Wszelkie prawa zastrzeżone. Google i logo Google są znakami towarowymi Google LLC. Wszelkie inne nazwy firm i produktów mogą być znakami towarowymi odpowiednich podmiotów, z którymi są powiązane.
Ta treść jest obecnie niedostępna
Kiedy dostępność się zmieni, wyślemy Ci e-maila z powiadomieniem
Świetnie
Kiedy dostępność się zmieni, skontaktujemy się z Tobą e-mailem
One lab at a time
Confirm to end all existing labs and start this one