Punkty kontrolne
Create a Cloud SQL instance
/ 30
Whitelist the Cloud Shell instance to access your SQL instance
/ 30
Create a bts database and flights table using the create_table.sql file
/ 40
Wczytywanie danych do Google Cloud SQL
GSP196
Opis
W tym module zaimportujesz dane z plików tekstowych CSV do Cloud SQL, a następnie przeprowadzisz kilka podstawowych analiz danych za pomocą prostych zapytań.
Zbiór danych użyty w tym module pochodzi z amerykańskiego biura statystyk transportu i zawiera archiwalne informacje o lotach krajowych w Stanach Zjednoczonych. Korzystając z tego zbioru danych, można zademonstrować szeroką gamę pomysłów i technik związanych z badaniem danych. Jest on używany we wszystkich modułach kursu Data Science on Google Cloud Platform.
Cele
- Utworzenie instancji Cloud SQL
- Utworzenie bazy danych Cloud SQL
- Zaimportowanie danych tekstowych do Cloud SQL
- Utworzenie początkowego modelu danych za pomocą zapytań
Konfiguracja i wymagania
Zanim klikniesz przycisk Rozpocznij moduł
Zapoznaj się z tymi instrukcjami. Moduły mają limit czasowy i nie można ich zatrzymać. Gdy klikniesz Rozpocznij moduł, na liczniku wyświetli się informacja o tym, na jak długo udostępniamy Ci zasoby Google Cloud.
W tym praktycznym module możesz spróbować swoich sił w wykonywaniu opisywanych działań w prawdziwym środowisku chmury, a nie w jego symulacji lub wersji demonstracyjnej. Otrzymasz nowe, tymczasowe dane logowania, dzięki którym zalogujesz się i uzyskasz dostęp do Google Cloud na czas trwania modułu.
Do ukończenia modułu potrzebne będą:
- dostęp do standardowej przeglądarki internetowej (zalecamy korzystanie z przeglądarki Chrome).
- Odpowiednia ilość czasu na ukończenie modułu – pamiętaj, że gdy rozpoczniesz, nie możesz go wstrzymać.
Rozpoczynanie modułu i logowanie się w konsoli Google Cloud
-
Kliknij przycisk Rozpocznij moduł. Jeśli moduł jest odpłatny, otworzy się wyskakujące okienko, w którym możesz wybrać formę płatności. Po lewej stronie znajduje się panel Szczegóły modułu z następującymi elementami:
- przyciskiem Otwórz konsolę Google Cloud;
- czasem, który Ci pozostał;
- tymczasowymi danymi logowania, których musisz użyć w tym module;
- innymi informacjami potrzebnymi do ukończenia modułu.
-
Kliknij Otwórz konsolę Google Cloud (lub kliknij prawym przyciskiem myszy i wybierz Otwórz link w oknie incognito, jeśli korzystasz z przeglądarki Chrome).
Moduł uruchomi zasoby, po czym otworzy nową kartę ze stroną logowania.
Wskazówka: otwórz karty obok siebie w osobnych oknach.
Uwaga: jeśli pojawi się okno Wybierz konto, kliknij Użyj innego konta. -
W razie potrzeby skopiuj nazwę użytkownika znajdującą się poniżej i wklej ją w oknie logowania.
{{{user_0.username | "Username"}}} Nazwę użytkownika znajdziesz też w panelu Szczegóły modułu.
-
Kliknij Dalej.
-
Skopiuj podane niżej hasło i wklej je w oknie powitania.
{{{user_0.password | "Password"}}} Hasło znajdziesz też w panelu Szczegóły modułu.
-
Kliknij Dalej.
Ważne: musisz użyć danych logowania podanych w module. Nie używaj danych logowania na swoje konto Google Cloud. Uwaga: korzystanie z własnego konta Google Cloud w tym module może wiązać się z dodatkowymi opłatami. -
Na kolejnych stronach wykonaj następujące czynności:
- Zaakceptuj Warunki korzystania z usługi.
- Nie dodawaj opcji odzyskiwania ani uwierzytelniania dwuskładnikowego (ponieważ konto ma charakter tymczasowy).
- Nie rejestruj się w bezpłatnych wersjach próbnych.
Poczekaj, aż na karcie otworzy się konsola Google Cloud.
Aktywowanie Cloud Shell
Cloud Shell to maszyna wirtualna oferująca wiele narzędzi dla programistów. Zawiera stały katalog domowy o pojemności 5 GB i działa w Google Cloud. Dzięki wierszowi poleceń Cloud Shell zyskujesz dostęp do swoich zasobów Google Cloud.
- Kliknij Aktywuj Cloud Shell na górze konsoli Google Cloud.
Po połączeniu użytkownik od razu jest uwierzytelniony. Uruchomi się Twój projekt o identyfikatorze PROJECT_ID. Dane wyjściowe zawierają wiersz z zadeklarowanym identyfikatorem PROJECT_ID dla tej sesji:
gcloud
to narzędzie wiersza poleceń Google Cloud. Jest ono już zainstalowane w Cloud Shell i obsługuje funkcję autouzupełniania po naciśnięciu tabulatora.
- (Opcjonalnie) Aby wyświetlić listę aktywnych kont, użyj tego polecenia:
-
Kliknij Autoryzuj.
-
Dane wyjściowe powinny wyglądać tak:
Dane wyjściowe:
- (Opcjonalnie) Aby wyświetlić identyfikator projektu, użyj tego polecenia:
Dane wyjściowe:
Przykładowe dane wyjściowe:
gcloud
w Google Cloud znajdziesz w opisie narzędzia wiersza poleceń gcloud.
Zadanie 1. Przygotowywanie środowiska
W tym module jest używany zestaw przykładów kodu i skryptów opracowany na potrzeby 2 wydania książki Data Science on the Google Cloud Platform (Badanie danych w Google Cloud Platform) wydawnictwa O'Reilly Media, Inc. Omówimy tutaj konfigurację Google Cloud SQL i zadania importowania danych przedstawione w pierwszej części 3 rozdziału tej książki, zatytułowanego „Creating Compelling Dashboards” (Tworzenie ciekawych paneli informacyjnych). Sklonujesz przykładowe repozytorium używane w rozdziale 2 z GitHub do Cloud Shell i tam będziesz wykonywać wszystkie zadania modułu.
Klonowanie repozytorium do Google Cloud
- Aby sklonować repozytorium, wpisz w Cloud Shell następujące polecenia:
- Przejdź do katalogu repozytorium:
- Utwórz zmienne środowiskowe używane w dalszej części modułu, jedną dla swojego identyfikatora projektu, drugą dla zasobnika, który zawiera Twoje dane:
- Aby zebrać plik w zasobniku Cloud Storage, wpisz to polecenie:
Zadanie 2. Tworzenie instancji Cloud SQL
- Aby utworzyć instancję Cloud SQL, wpisz następujące polecenia:
Potrwa to kilka minut.
Testowanie ukończonego zadania
Kliknij Sprawdź postępy, aby zobaczyć stan realizacji zadania. Jeśli udało Ci się utworzyć instancję Cloud SQL, wyświetli się wynik.
- Utwórz zmienną środowiskową z adresem IP Cloud Shell:
- Wpisz na listę dozwolonych instancję Cloud Shell, przyznając jej dostęp do zarządzania Twoją instancją SQL.
- Gdy pojawi się komunikat, naciśnij Y, aby zaakceptować zmianę.
Testowanie ukończonego zadania
Kliknij Sprawdź postępy, aby zobaczyć stan realizacji zadania. Jeśli udało Ci się zezwolić Cloud Shell na dostęp do instancji SQL, wyświetli się odpowiedni wynik.
Tworzenie bazy danych i tabeli
Aby zaimportować dane do tabeli Postgres, musisz najpierw utworzyć pustą bazę danych i tabelę za pomocą prawidłowego schematu.
-
W konsoli Cloud, w Menu nawigacyjnym () kliknij SQL .
-
Aby otworzyć stronę z opisem instancji, kliknij nazwę instancji
flights
(loty). -
Z menu nawigacyjnego SQL wybierz Bazy danych.
-
Kliknij Utwórz bazę danych.
-
W oknie nowej bazy danych podaj jej nazwę jako
bts
. -
Kliknij Utwórz.
-
Aby otworzyć stronę z opisem instancji, z menu nawigacyjnego SQL wybierz Przegląd.
-
Na górze ekranu kliknij IMPORTUJ.
-
W polu pliku w Cloud Storage kliknij Przeglądaj.
-
W sekcji zasobników kliknij strzałkę przy nazwie Twojego zasobnika.
-
Wybierz plik
create_table.sql
. -
Kliknij Wybierz.
-
W sekcji Format pliku wybierz SQL.
-
Wskaż bazę danych
bts
w swojej instancji Cloud SQL. -
Kliknij Importuj, aby zacząć import.
Po kilku sekundach zostanie utworzona pusta tabela.
Testowanie ukończonego zadania
Kliknij Sprawdź postępy, aby zobaczyć stan realizacji zadania. Jeśli udało Ci się utworzyć bazę danych bts i tabelę flights przy użyciu pliku create_table.sql, wyświetli się wynik.
Zadanie 3. Dodawanie danych do instancji Cloud SQL
Masz już utworzoną pustą bazę danych i tabelę, więc teraz załaduj do tej tabeli pliki CSV. Wczytaj dane dotyczące stycznia, znajdując plik 201501.csv w swoim zasobniku i podając CSV jako format, bts jako bazę danych i flights jako tabelę.
-
Na stronie instancji SQL kliknij IMPORTUJ.
-
W polu pliku w Cloud Storage kliknij Przeglądaj, a następnie kliknij strzałkę obok nazwy Twojego zasobnika i wybierz
201501.csv
. -
Kliknij Wybierz.
-
Jako format pliku wybierz CSV.
-
Wybierz bazę danych
bts
i wpiszflights
jako swoją tabelę. -
Kliknij IMPORTUJ.
Zadanie 4. Interakcja z bazą danych
- Połącz się z instancją Cloud SQL z Cloud Shell za pomocą polecenia:
-
Gdy pojawi się prośba o podanie hasła, wpisz
Passw0rd
. Litery mogą nie być widoczne, gdy będziesz je wpisywać. -
W oknie, które się pokaże, połącz się z bazą danych bts:
-
Gdy pojawi się prośba o podanie hasła, wpisz
Passw0rd
. -
Potem uruchom zapytanie, aby uzyskać listę 5 lotnisk o największym ruchu:
Zapytanie jest wydajne, ponieważ zbiór danych ma niewielki rozmiar (tylko dane ze stycznia), ale baza danych będzie działać coraz wolniej w miarę dodawania kolejnych miesięcy.
Relacyjne bazy danych są odpowiednie do mniejszych zbiorów danych, w których uruchamia się szybkie zapytania zwracające mały podzbiór danych. W przypadku większych baz danych dostosowujesz wydajność relacyjnej bazy danych, indeksując kolumny, które Cię interesują. Co więcej, ponieważ relacyjne bazy danych zwykle obsługują transakcje i gwarantują silną spójność, są świetnym wyborem w przypadku danych, które będą często aktualizowane.
Jednak relacyjna baza danych to nieodpowiedni wybór, jeśli:
- Twoje dane są głównie tylko do odczytu,
- rozmiar zbioru danych sięga terabajtów,
- potrzebujesz skanowania całej tabeli (np. aby obliczyć maksymalną wartość kolumny) lub Twoje dane przychodzą w dużych ilościach.
Opisuje to przypadek użycia dotyczący opóźnień lotów. W tej sytuacji trzeba przejść z relacyjnej bazy danych na analityczną hurtownię danych, czyli BigQuery. Analityczna hurtownia danych umożliwi nam używanie SQL i poradzi sobie dużo lepiej z dużymi zbiorami danych oraz nieoczekiwanymi zapytaniami (to znaczy, że nie potrzebuje indeksowana kolumn).
Gratulacje!
Wiesz teraz jak tworzyć tabele i importować do Google Cloud SQL dane tekstowe, które zostały zapisane w Cloud Storage.
Kolejne kroki / Więcej informacji
Więcej propozycji:
- 2 wydanie książki Data Science on the Google Cloud Platform: O'Reilly Media, Inc (Badanie danych w Google Cloud Platform) wydawnictwa O'Reilly Media, Inc.
Szkolenia i certyfikaty Google Cloud
…pomogą Ci wykorzystać wszystkie możliwości technologii Google Cloud. Nasze zajęcia obejmują umiejętności techniczne oraz sprawdzone metody, które ułatwią Ci szybką naukę i umożliwią jej kontynuację. Oferujemy szkolenia na poziomach od podstawowego po zaawansowany prowadzone w trybach wirtualnym, na żądanie i na żywo, dzięki czemu możesz dopasować program szkoleń do swojego napiętego harmonogramu. Certyfikaty umożliwią udokumentowanie i potwierdzenie Twoich umiejętności oraz doświadczenia w zakresie technologii Google Cloud.
Ostatnia aktualizacja instrukcji: 28 listopada 2023 r.
Ostatni test modułu: 28 listopada 2023 r.
Copyright 2024 Google LLC. Wszelkie prawa zastrzeżone. Google i logo Google są znakami towarowymi Google LLC. Wszelkie inne nazwy firm i produktów mogą być znakami towarowymi odpowiednich podmiotów, z którymi są powiązane.