
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create a Cloud Storage bucket
/ 50
Run an Example Pipeline Remotely
/ 50
Pakiet Apache Beam SDK to model programowania typu open source przeznaczony dla potoków danych. W Google Cloud możesz zdefiniować potok przy użyciu programu Apache Beam i następnie uruchomić ten potok za pomocą Dataflow.
W tym module dowiesz się, jak skonfigurować środowisko programistyczne Pythona dla Dataflow (za pomocą pakietu Apache Beam SDK for Python) i uruchomić przykładowy potok Dataflow.
Z tego modułu dowiesz się, jak:
Zapoznaj się z tymi instrukcjami. Moduły mają limit czasowy i nie można ich zatrzymać. Gdy klikniesz Rozpocznij moduł, na liczniku wyświetli się informacja o tym, na jak długo udostępniamy Ci zasoby Google Cloud.
W tym praktycznym module możesz spróbować swoich sił w wykonywaniu opisywanych działań w prawdziwym środowisku chmury, a nie w jego symulacji lub wersji demonstracyjnej. Otrzymasz nowe, tymczasowe dane logowania, dzięki którym zalogujesz się i uzyskasz dostęp do Google Cloud na czas trwania modułu.
Do ukończenia modułu potrzebne będą:
Kliknij przycisk Rozpocznij moduł. Jeśli moduł jest odpłatny, otworzy się okno, w którym możesz wybrać formę płatności. Po lewej stronie znajduje się panel Szczegóły modułu z następującymi elementami:
Kliknij Otwórz konsolę Google Cloud (lub kliknij prawym przyciskiem myszy i wybierz Otwórz link w oknie incognito, jeśli korzystasz z przeglądarki Chrome).
Moduł uruchomi zasoby, po czym otworzy nową kartę ze stroną logowania.
Wskazówka: otwórz karty obok siebie w osobnych oknach.
W razie potrzeby skopiuj nazwę użytkownika znajdującą się poniżej i wklej ją w oknie logowania.
Nazwę użytkownika znajdziesz też w panelu Szczegóły modułu.
Kliknij Dalej.
Skopiuj podane niżej hasło i wklej je w oknie powitania.
Hasło znajdziesz też w panelu Szczegóły modułu.
Kliknij Dalej.
Na kolejnych stronach wykonaj następujące czynności:
Poczekaj, aż na karcie otworzy się konsola Google Cloud.
Cloud Shell to maszyna wirtualna oferująca wiele narzędzi dla programistów. Zawiera stały katalog domowy o pojemności 5 GB i działa w Google Cloud. Dzięki wierszowi poleceń Cloud Shell zyskujesz dostęp do swoich zasobów Google Cloud.
Po połączeniu użytkownik od razu jest uwierzytelniony. Uruchomi się Twój projekt o identyfikatorze PROJECT_ID. Dane wyjściowe zawierają wiersz z zadeklarowanym identyfikatorem PROJECT_ID dla tej sesji:
gcloud
to narzędzie wiersza poleceń Google Cloud. Jest ono już zainstalowane w Cloud Shell i obsługuje funkcję autouzupełniania po naciśnięciu tabulatora.
Kliknij Autoryzuj.
Dane wyjściowe powinny wyglądać tak:
Dane wyjściowe:
Dane wyjściowe:
Przykładowe dane wyjściowe:
gcloud
w Google Cloud znajdziesz w opisie narzędzia wiersza poleceń gcloud.
Aby zapewnić dostęp do potrzebnego interfejsu API, ponownie uruchom połączenie z Dataflow API.
W konsoli Cloud wpisz „Dataflow API” na pasku wyszukiwania u góry. Kliknij wynik z Dataflow API.
Kliknij Zarządzaj.
Kliknij Wyłącz API.
Jeśli pojawi się prośba o potwierdzenie, kliknij Wyłącz.
Gdy interfejs API zostanie włączony, na stronie pojawi się opcja jego wyłączenia.
Kiedy uruchomisz potok przy użyciu Dataflow, uzyskane wyniki zostaną zapisane w zasobniku Cloud Storage. W tym zadaniu utworzysz zasobnik Cloud Storage do przechowywania wyników potoku, który uruchomisz w późniejszym zadaniu.
us
Kliknij Utwórz.
Jeśli otworzy się okno „Dostęp publiczny zostanie zablokowany”, kliknij Potwierdź.
Testowanie ukończonego zadania
Kliknij Sprawdź postępy, aby zobaczyć stan realizacji zadania. Jeśli udało Ci się ukończyć zadanie, wyświetli się wynik.
Python3.9
, aby mieć pewność, że używasz obsługiwanej wersji Pythona:To polecenie pobiera kontener Dockera z najnowszą stabilną wersją Pythona 3.9, po czym otwiera powłokę poleceń, aby uruchomić podane poniżej polecenia w kontenerze.
Wyświetlą się ostrzeżenia związane z zależnościami. W tym module możesz je bezpiecznie zignorować.
wordcount.py
, korzystając z następującego polecenia:W związku z tym może pojawić się podobny komunikat:
Możesz go zignorować.
OUTPUT_FILE
(pliku wyjściowego):OUTPUT_FILE
(pliku wyjściowego) i otwórz go za pomocą polecenia cat
:W wynikach wyświetli się każde słowo występujące w pliku wraz z informacją, ile razy dane słowo się pojawia.
wordcount.py
:Poczekaj, aż w danych wyjściowych zobaczysz następujący komunikat:
Następnie kontynuuj moduł.
Zadanie wordcount powinno być widoczne na początku i mieć stan Uruchomiono.
Po zakończeniu procesu stan zmieni się na Ukończono.
Testowanie ukończonego zadania
Kliknij Sprawdź postępy, aby zobaczyć stan realizacji zadania. Jeśli udało Ci się ukończyć zadanie, wyświetli się wynik.
W konsoli Google Cloud kliknij Menu nawigacyjne > Cloud Storage.
Wybierz nazwę swojego zasobnika. W zasobniku powinny wyświetlić się wyniki i katalogi etapów przejściowych.
Po kliknięciu folderu wyników powinny wyświetlić się pliki wyjściowe powstałe wskutek utworzonego przez Ciebie zadania.
Kliknij plik, aby sprawdzić, ile słów zawiera.
Poniżej znajdziesz pytanie jednokrotnego wyboru, które pomoże Ci utrwalić wiedzę zdobytą w tym module. Odpowiedz na nie najlepiej, jak potrafisz.
Wiesz już, jak skonfigurować środowisko programistyczne Pythona dla Dataflow (za pomocą pakietu Apache Beam SDK for Python) i uruchomić przykładowy potok Dataflow.
Ten moduł należy do serii modułów Qwik Start. Opracowano je tak, aby dać Ci przedsmak bogactwa funkcji dostępnych w Google Cloud. Wyszukaj „Qwik Start” w katalogu Google Cloud Skills Boost i znajdź kolejny interesujący Cię moduł.
Zdobądź własny egzemplarz książki, na podstawie której opracowano ten moduł: Data Science on the Google Cloud Platform – O'Reilly Media, Inc (książka dostępna w języku angielskim).
…pomogą Ci wykorzystać wszystkie możliwości technologii Google Cloud. Nasze zajęcia obejmują umiejętności techniczne oraz sprawdzone metody, które ułatwią Ci szybką naukę i umożliwią jej kontynuację. Oferujemy szkolenia na poziomach od podstawowego po zaawansowany prowadzone w trybach wirtualnym, na żądanie i na żywo, dzięki czemu możesz dopasować program szkoleń do swojego napiętego harmonogramu. Certyfikaty umożliwią udokumentowanie i potwierdzenie Twoich umiejętności oraz doświadczenia w zakresie technologii Google Cloud.
Ostatnia aktualizacja instrukcji: 4 lutego 2024 r.
Ostatni test modułu: 4 maja 2023 r.
Copyright 2025 Google LLC. Wszelkie prawa zastrzeżone. Google i logo Google są znakami towarowymi Google LLC. Wszelkie inne nazwy firm i produktów mogą być znakami towarowymi odpowiednich podmiotów, z którymi są powiązane.
Ta treść jest obecnie niedostępna
Kiedy dostępność się zmieni, wyślemy Ci e-maila z powiadomieniem
Świetnie
Kiedy dostępność się zmieni, skontaktujemy się z Tobą e-mailem
One lab at a time
Confirm to end all existing labs and start this one