
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create a Cloud SQL instance
/ 30
Whitelist the Cloud Shell instance to access your SQL instance
/ 30
Create a bts database and flights table using the create_table.sql file
/ 40
W tym module zaimportujesz dane z plików tekstowych CSV do Cloud SQL, a następnie przeprowadzisz kilka podstawowych analiz danych za pomocą prostych zapytań.
Zbiór danych użyty w tym module pochodzi z amerykańskiego biura statystyk transportu i zawiera archiwalne informacje o lotach krajowych w Stanach Zjednoczonych. Korzystając z tego zbioru danych, można zademonstrować szeroką gamę pomysłów i technik związanych z badaniem danych. Jest on używany we wszystkich modułach kursu Data Science on Google Cloud Platform.
Zapoznaj się z tymi instrukcjami. Moduły mają limit czasowy i nie można ich zatrzymać. Gdy klikniesz Rozpocznij moduł, na liczniku wyświetli się informacja o tym, na jak długo udostępniamy Ci zasoby Google Cloud.
W tym praktycznym module możesz spróbować swoich sił w wykonywaniu opisywanych działań w prawdziwym środowisku chmury, a nie w jego symulacji lub wersji demonstracyjnej. Otrzymasz nowe, tymczasowe dane logowania, dzięki którym zalogujesz się i uzyskasz dostęp do Google Cloud na czas trwania modułu.
Do ukończenia modułu potrzebne będą:
Kliknij przycisk Rozpocznij moduł. Jeśli moduł jest odpłatny, otworzy się wyskakujące okienko, w którym możesz wybrać formę płatności. Po lewej stronie znajduje się panel Szczegóły modułu z następującymi elementami:
Kliknij Otwórz konsolę Google Cloud (lub kliknij prawym przyciskiem myszy i wybierz Otwórz link w oknie incognito, jeśli korzystasz z przeglądarki Chrome).
Moduł uruchomi zasoby, po czym otworzy nową kartę ze stroną logowania.
Wskazówka: otwórz karty obok siebie w osobnych oknach.
W razie potrzeby skopiuj nazwę użytkownika znajdującą się poniżej i wklej ją w oknie logowania.
Nazwę użytkownika znajdziesz też w panelu Szczegóły modułu.
Kliknij Dalej.
Skopiuj podane niżej hasło i wklej je w oknie powitania.
Hasło znajdziesz też w panelu Szczegóły modułu.
Kliknij Dalej.
Na kolejnych stronach wykonaj następujące czynności:
Poczekaj, aż na karcie otworzy się konsola Google Cloud.
Cloud Shell to maszyna wirtualna oferująca wiele narzędzi dla programistów. Zawiera stały katalog domowy o pojemności 5 GB i działa w Google Cloud. Dzięki wierszowi poleceń Cloud Shell zyskujesz dostęp do swoich zasobów Google Cloud.
Po połączeniu użytkownik od razu jest uwierzytelniony. Uruchomi się Twój projekt o identyfikatorze PROJECT_ID. Dane wyjściowe zawierają wiersz z zadeklarowanym identyfikatorem PROJECT_ID dla tej sesji:
gcloud
to narzędzie wiersza poleceń Google Cloud. Jest ono już zainstalowane w Cloud Shell i obsługuje funkcję autouzupełniania po naciśnięciu tabulatora.
Kliknij Autoryzuj.
Dane wyjściowe powinny wyglądać tak:
Dane wyjściowe:
Dane wyjściowe:
Przykładowe dane wyjściowe:
gcloud
w Google Cloud znajdziesz w opisie narzędzia wiersza poleceń gcloud.
W tym module jest używany zestaw przykładów kodu i skryptów opracowany na potrzeby 2 wydania książki Data Science on the Google Cloud Platform (Badanie danych w Google Cloud Platform) wydawnictwa O'Reilly Media, Inc. Omówimy tutaj konfigurację Google Cloud SQL i zadania importowania danych przedstawione w pierwszej części 3 rozdziału tej książki, zatytułowanego „Creating Compelling Dashboards” (Tworzenie ciekawych paneli informacyjnych). Sklonujesz przykładowe repozytorium używane w rozdziale 2 z GitHub do Cloud Shell i tam będziesz wykonywać wszystkie zadania modułu.
Potrwa to kilka minut.
Kliknij Sprawdź postępy, aby zobaczyć stan realizacji zadania. Jeśli udało Ci się utworzyć instancję Cloud SQL, wyświetli się wynik.
Kliknij Sprawdź postępy, aby zobaczyć stan realizacji zadania. Jeśli udało Ci się zezwolić Cloud Shell na dostęp do instancji SQL, wyświetli się odpowiedni wynik.
Aby zaimportować dane do tabeli Postgres, musisz najpierw utworzyć pustą bazę danych i tabelę za pomocą prawidłowego schematu.
W konsoli Cloud, w Menu nawigacyjnym () kliknij SQL .
Aby otworzyć stronę z opisem instancji, kliknij nazwę instancji flights
(loty).
Z menu nawigacyjnego SQL wybierz Bazy danych.
Kliknij Utwórz bazę danych.
W oknie nowej bazy danych podaj jej nazwę jako bts
.
Kliknij Utwórz.
Aby otworzyć stronę z opisem instancji, z menu nawigacyjnego SQL wybierz Przegląd.
Na górze ekranu kliknij IMPORTUJ.
W polu pliku w Cloud Storage kliknij Przeglądaj.
W sekcji zasobników kliknij strzałkę przy nazwie Twojego zasobnika.
Wybierz plik create_table.sql
.
Kliknij Wybierz.
W sekcji Format pliku wybierz SQL.
Wskaż bazę danych bts
w swojej instancji Cloud SQL.
Kliknij Importuj, aby zacząć import.
Po kilku sekundach zostanie utworzona pusta tabela.
Kliknij Sprawdź postępy, aby zobaczyć stan realizacji zadania. Jeśli udało Ci się utworzyć bazę danych bts i tabelę flights przy użyciu pliku create_table.sql, wyświetli się wynik.
Masz już utworzoną pustą bazę danych i tabelę, więc teraz załaduj do tej tabeli pliki CSV. Wczytaj dane dotyczące stycznia, znajdując plik 201501.csv w swoim zasobniku i podając CSV jako format, bts jako bazę danych i flights jako tabelę.
Na stronie instancji SQL kliknij IMPORTUJ.
W polu pliku w Cloud Storage kliknij Przeglądaj, a następnie kliknij strzałkę obok nazwy Twojego zasobnika i wybierz 201501.csv
.
Kliknij Wybierz.
Jako format pliku wybierz CSV.
Wybierz bazę danych bts
i wpisz flights
jako swoją tabelę.
Kliknij IMPORTUJ.
Gdy pojawi się prośba o podanie hasła, wpisz Passw0rd
. Litery mogą nie być widoczne, gdy będziesz je wpisywać.
W oknie, które się pokaże, połącz się z bazą danych bts:
Gdy pojawi się prośba o podanie hasła, wpisz Passw0rd
.
Potem uruchom zapytanie, aby uzyskać listę 5 lotnisk o największym ruchu:
Zapytanie jest wydajne, ponieważ zbiór danych ma niewielki rozmiar (tylko dane ze stycznia), ale baza danych będzie działać coraz wolniej w miarę dodawania kolejnych miesięcy.
Relacyjne bazy danych są odpowiednie do mniejszych zbiorów danych, w których uruchamia się szybkie zapytania zwracające mały podzbiór danych. W przypadku większych baz danych dostosowujesz wydajność relacyjnej bazy danych, indeksując kolumny, które Cię interesują. Co więcej, ponieważ relacyjne bazy danych zwykle obsługują transakcje i gwarantują silną spójność, są świetnym wyborem w przypadku danych, które będą często aktualizowane.
Jednak relacyjna baza danych to nieodpowiedni wybór, jeśli:
Opisuje to przypadek użycia dotyczący opóźnień lotów. W tej sytuacji trzeba przejść z relacyjnej bazy danych na analityczną hurtownię danych, czyli BigQuery. Analityczna hurtownia danych umożliwi nam używanie SQL i poradzi sobie dużo lepiej z dużymi zbiorami danych oraz nieoczekiwanymi zapytaniami (to znaczy, że nie potrzebuje indeksowana kolumn).
Wiesz teraz jak tworzyć tabele i importować do Google Cloud SQL dane tekstowe, które zostały zapisane w Cloud Storage.
Więcej propozycji:
…pomogą Ci wykorzystać wszystkie możliwości technologii Google Cloud. Nasze zajęcia obejmują umiejętności techniczne oraz sprawdzone metody, które ułatwią Ci szybką naukę i umożliwią jej kontynuację. Oferujemy szkolenia na poziomach od podstawowego po zaawansowany prowadzone w trybach wirtualnym, na żądanie i na żywo, dzięki czemu możesz dopasować program szkoleń do swojego napiętego harmonogramu. Certyfikaty umożliwią udokumentowanie i potwierdzenie Twoich umiejętności oraz doświadczenia w zakresie technologii Google Cloud.
Ostatnia aktualizacja instrukcji: 28 listopada 2023 r.
Ostatni test modułu: 28 listopada 2023 r.
Copyright 2024 Google LLC. Wszelkie prawa zastrzeżone. Google i logo Google są znakami towarowymi Google LLC. Wszelkie inne nazwy firm i produktów mogą być znakami towarowymi odpowiednich podmiotów, z którymi są powiązane.
Ta treść jest obecnie niedostępna
Kiedy dostępność się zmieni, wyślemy Ci e-maila z powiadomieniem
Świetnie
Kiedy dostępność się zmieni, skontaktujemy się z Tobą e-mailem
One lab at a time
Confirm to end all existing labs and start this one