
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create a Cloud Storage bucket
/ 50
Initialize Cloud Dataprep
/ 50
Ten moduł opracowaliśmy we współpracy z firmą Trifacta. Jeśli w profilu konta masz ustawioną zgodę na otrzymywanie ogłoszeń, ofert i nowych informacji o usługach, Twoje dane osobowe mogą być udostępniane tej firmie jako sponsorowi modułu.
Cloud Dataprep firmy Trifacta to inteligentna usługa umożliwiająca przeglądanie, oczyszczanie i przygotowywanie danych do analizy w formie wizualnej. Cloud Dataprep to usługa bezserwerowa działająca na dowolną skalę. Nie wymaga utrzymywania żadnej infrastruktury. Przygotowywanie danych jest proste: nie trzeba pisać kodu, wszystko obsługuje się myszą.
W tym module nauczysz się używać Dataprep do działań na zbiorze danych. Zaimportujesz zbiory danych, poprawisz nieprawidłowe dane, a także przekształcisz dane i dokonasz ich złączenia. Nie przejmuj się, jeśli to dla Ciebie nowość – wszystko stanie się jasne, gdy ukończysz ten moduł.
W tym module dowiesz się, jak użyć Dataprep, żeby wykonać następujące zadania:
Zapoznaj się z tymi instrukcjami. Moduły mają limit czasowy i nie można ich zatrzymać. Gdy klikniesz Rozpocznij moduł, na liczniku wyświetli się informacja o tym, na jak długo udostępniamy Ci zasoby Google Cloud.
W tym praktycznym module możesz spróbować swoich sił w wykonywaniu opisywanych działań w prawdziwym środowisku chmury, a nie w jego symulacji lub wersji demonstracyjnej. Otrzymasz nowe, tymczasowe dane logowania, dzięki którym zalogujesz się i uzyskasz dostęp do Google Cloud na czas trwania modułu.
Do ukończenia modułu potrzebne będą:
Kliknij przycisk Rozpocznij moduł. Jeśli moduł jest odpłatny, otworzy się okno, w którym możesz wybrać formę płatności. Po lewej stronie znajduje się panel Szczegóły modułu z następującymi elementami:
Kliknij Otwórz konsolę Google Cloud (lub kliknij prawym przyciskiem myszy i wybierz Otwórz link w oknie incognito, jeśli korzystasz z przeglądarki Chrome).
Moduł uruchomi zasoby, po czym otworzy nową kartę ze stroną logowania.
Wskazówka: otwórz karty obok siebie w osobnych oknach.
W razie potrzeby skopiuj nazwę użytkownika znajdującą się poniżej i wklej ją w oknie logowania.
Nazwę użytkownika znajdziesz też w panelu Szczegóły modułu.
Kliknij Dalej.
Skopiuj podane niżej hasło i wklej je w oknie powitania.
Hasło znajdziesz też w panelu Szczegóły modułu.
Kliknij Dalej.
Na kolejnych stronach wykonaj następujące czynności:
Poczekaj, aż na karcie otworzy się konsola Google Cloud.
Cloud Shell to maszyna wirtualna oferująca wiele narzędzi dla programistów. Zawiera stały katalog domowy o pojemności 5 GB i działa w Google Cloud. Dzięki wierszowi poleceń Cloud Shell zyskujesz dostęp do swoich zasobów Google Cloud.
Kliknij Aktywuj Cloud Shell na górze konsoli Google Cloud.
Kliknij te okna:
Po połączeniu użytkownik od razu jest uwierzytelniony. Uruchomi się Twój projekt o identyfikatorze Project_ID
gcloud
to narzędzie wiersza poleceń Google Cloud. Jest ono już zainstalowane w Cloud Shell i obsługuje funkcję autouzupełniania po naciśnięciu tabulatora.
Dane wyjściowe:
Dane wyjściowe:
gcloud
w Google Cloud znajdziesz w opisie gcloud CLI.
W konsoli Cloud wybierz Menu nawigacyjne () > Cloud Storage > Zasobniki.
Kliknij Utwórz zasobnik.
W oknie Tworzenie zasobnika nadaj zasobnikowi niepowtarzalną nazwę. W pozostałych ustawieniach pozostaw domyślne wartości.
W sekcji Wybierz sposób kontrolowania dostępu do obiektów
odznacz opcję Wyegzekwuj blokadę dostępu publicznego do tego zasobnika.
Kliknij Utwórz.
Udało Ci się utworzyć zasobnik. Zapamiętaj jego nazwę, przyda się w kolejnych krokach.
Kliknij Sprawdź postępy, aby zobaczyć stan realizacji zadania. Jeśli udało Ci się utworzyć zasobnik Cloud Storage, wyświetli się odpowiedni wynik.
Wyświetli się komunikat informujący o utworzeniu tożsamości usługi.
Wybierz Menu nawigacyjne > Dataprep.
Zaznacz pole wyboru akceptacji Warunków korzystania z usługi Google Dataprep, a następnie kliknij Akceptuję.
Zaznacz pole wyboru zgody na udostępnienie firmie Trifacta informacji o koncie, a następnie kliknij Zgadzam się i chcę przejść dalej.
Kliknij Zezwól, aby zezwolić firmie Trifacta na dostęp do danych projektu.
Kliknij swoją nazwę użytkownika, aby zalogować się w Cloud Dataprep firmy Trifacta. Twoja nazwa użytkownika jest wyświetlana w polu Nazwa użytkownika w panelu po lewej stronie modułu.
Kliknij Zezwól, aby przyznać Cloud Dataprep dostęp do Twojego konta modułu Google Cloud.
Zaznacz pole wyboru zgody na Warunki korzystania z usługi firmy Trifacta, a następnie kliknij Akceptuję.
Na ekranie First time setup kliknij Continue, aby utworzyć domyślną lokalizację przechowywania danych.
Otworzy się usługa Dataprep.
Kliknij Sprawdź postępy, aby zobaczyć stan realizacji zadania. Jeśli udało Ci się zainicjować Cloud Dataprep z domyślną lokalizacją miejsca na dane, wyświetli się odpowiedni wynik.
Cloud Dataprep uzyskuje dostęp do zbiorów danych i manipuluje nimi w obszarze roboczym przepływu
.
Otworzy się strona przepływu FEC-2016.
W tej sekcji zaimportujesz i dodasz dane do przepływu FEC-2016.
Kliknij Add Datasets, a następnie wybierz link Import Datasets.
W panelu menu po lewej stronie wybierz Cloud Storage, aby zaimportować zbiory danych z Google Cloud Storage, a następnie kliknij ikonę ołówka i zmień ścieżkę pliku.
gs://spls/gsp105
i kliknij Go.Przyciski Go i Cancel mogą pojawić się dopiero po rozszerzeniu okna przeglądarki.
Kliknij us-fec/.
Kliknij ikonę + znajdującą się obok pliku cn-2016.txt,
aby utworzyć zbiór danych widoczny w prawym panelu. W panelu po prawej stronie kliknij tytuł zbioru danych i zmień go na „Candidate Master 2016” (Informacje o kandydatach w 2016 r.).
W ten sam sposób dodaj zbiór danych itcont-2016-orig.txt
i zmień jego nazwę na „Campaign Contributions 2016” (Fundusze wpłacane na kampanię w 2016 r.).
Oba zbiory danych pojawią się w panelu po prawej stronie. Kliknij Import & Add to Flow.
Oba zbiory danych są wyświetlane w formie przepływu.
W widoku siatki otworzy się strona Transformer dla zbioru danych Candidate Master 2016.
Na stronie Transformer tworzony jest przepis na przekształcenie. Są na niej widoczne także wyniki zastosowania przepisu do próbki danych. Jeśli zadowala Cię to, co widzisz, wykonaj zadanie na swoim zbiorze danych.
Zwróć uwagę na to, że gdy klikniesz nazwę kolumny, po prawej stronie pojawia się panel Details.
Aby zamknąć panel Details, w jego prawym górnym rogu kliknij X.
Wykonując kolejne kroki, zapoznasz się z danymi w widoku siatki i dodasz kroki przekształcenia do przepisu.
Spowoduje to utworzenie kroku, w którym wybrane zostaną zaznaczone wartości.
W panelu Recipe po prawej stronie znajduje się teraz ten krok:
Keep rows where(DATE(2016, 1, 1) <= column5) && (column5 < DATE(2018, 1, 1))
Przewiń ekran w dół do czerwonego wyróżnienia, aby znaleźć nieprawidłowe wartości. Zwróć uwagę na to, że większość tych rekordów ma wartość „P” w kolumnie column7 i „US” w kolumnie column6. Nieprawidłowość polega na tym, że kolumna column6 jest oznaczona jako „State” – na co wskazuje ikona flagi – a rekordy zawierają wartości, które nie oznaczają stanów (np. „US”).
Nie ma już nieprawidłowości – znacznik kolumny ma teraz kolor zielony.
Na stronie Join możesz dodać aktualny zbiór danych do innego zbioru danych lub przepisu, łącząc je na podstawie wspólnych informacji w obu zbiorach danych.
Zanim utworzysz złączenie pliku z informacjami o funduszach z plikiem z informacjami o kandydatach, oczyść plik z informacjami o funduszach.
Kliknij, aby wybrać wyszarzoną pozycję Campaign Contributions 2016.
W panelu po prawej stronie kliknij Add > Recipe, a następnie kliknij Edit Recipe.
Kliknij ikonę przepisu w prawym górnym rogu strony, a następnie kliknij Add New Step.
Usuń zbędne ograniczniki ze zbioru danych.
Usługa Transformation Builder analizuje polecenie w języku Wrangle i wypełnia pola przekształcenia Find i Replace.
Kliknij Add, aby dodać to przekształcenie do przepisu.
Dodaj do przepisu kolejny nowy krok. Kliknij New Step, a następnie wpisz „Join” w polu wyszukiwania.
Kliknij Join datasets, aby otworzyć stronę Join.
Kliknij zbiór danych „Candidate Master 2016”, aby złączyć go ze zbiorem Campaign Contributions 2016, a następnie w prawym dolnym rogu kliknij Accept.
Dataprep automatycznie ustawia wspólne klucze. Istnieje wiele wspólnych wartości, które Dataprep sugeruje jako klucze złączenia.
Otworzą się kolumny 2 i 11. Możesz je przejrzeć.
Wygeneruj użyteczne podsumowanie, agregując, uśredniając i zliczając wpłaty funduszy w kolumnie 16 i grupując kandydatów według identyfikatora, imienia i nazwiska oraz przynależności partyjnej. Dane te znajdują się w kolumnach 2, 24 i 8.
Wyświetlana jest początkowa próbka złączonych i zagregowanych danych. Jest to tabela podsumowania kandydatów na urząd prezydenta USA wraz ze wskaźnikami dotyczącymi wpłat funduszy na kampanię w 2016 r.
Możesz ułatwić interpretację danych, zmieniając nazwy kolumn.
Następnie kliknij Add.
Dodaj ten ostatni nowy krok, aby zaokrąglić kwotę średniej wpłaty funduszy:
Wynik powinien być podobny do tego:
Udało Ci się dodać zbiór danych i utworzyć przepisy w Dataprep, przekształcając dane w znaczące wyniki z użyciem języka Wrangle.
Ten moduł należy do serii modułów Qwik Start. Opracowaliśmy je, aby dać Ci przedsmak bogactwa funkcji dostępnych w Google Cloud. Wyszukaj „Qwik Start” w katalogu modułów i znajdź kolejny interesujący Cię moduł.
…pomogą Ci wykorzystać wszystkie możliwości technologii Google Cloud. Nasze zajęcia obejmują umiejętności techniczne oraz sprawdzone metody, które ułatwią Ci szybką naukę i umożliwią jej kontynuację. Oferujemy szkolenia na poziomach od podstawowego po zaawansowany prowadzone w trybach wirtualnym, na żądanie i na żywo, dzięki czemu możesz dopasować program szkoleń do swojego napiętego harmonogramu. Certyfikaty umożliwią udokumentowanie i potwierdzenie Twoich umiejętności oraz doświadczenia w zakresie technologii Google Cloud.
Ostatnia aktualizacja instrukcji: 6 czerwca 2024 r.
Ostatni test modułu: 6 czerwca 2024 r.
Copyright 2025 Google LLC. Wszelkie prawa zastrzeżone. Google i logo Google są znakami towarowymi Google LLC. Wszelkie inne nazwy firm i produktów mogą być znakami towarowymi odpowiednich podmiotów, z którymi są powiązane.
Ta treść jest obecnie niedostępna
Kiedy dostępność się zmieni, wyślemy Ci e-maila z powiadomieniem
Świetnie
Kiedy dostępność się zmieni, skontaktujemy się z Tobą e-mailem
One lab at a time
Confirm to end all existing labs and start this one