Punkty kontrolne
Create a lake
/ 20
Add zone to your lake
/ 20
Attach an asset to a zone
/ 40
Delete assets, zones, and lakes
/ 20
Dataplex: Qwik Start – konsola
GSP1143
Opis
Dataplex to inteligentna tkanina danych, która umożliwia organizacjom centralne wykrywanie i monitorowanie danych w jeziorach, hurtowniach i składnicach danych oraz zarządzanie nimi na potrzeby analiz przeprowadzanych na dużą skalę. Dataplex możesz wykorzystać konkretnie do zbudowania architektury siatki danych – to organizacyjne i techniczne podejście, które decentralizuje własność danych wśród właścicieli danych z domeny.
Dataplex zarządza danymi w sposób niewymagający ich przenoszenia ani duplikowania. W miarę jak dodawane są nowe zasoby z danymi, Dataplex zbiera metadane z uporządkowanych i nieuporządkowanych danych i automatycznie rejestruje wszystkie metadane w bezpiecznym, ujednoliconym magazynie metadanych. Dane i metadane mogą być potem oceniane przez usługi Google Cloud, takie jak Data Catalog czy BigQuery.
W tym module dowiesz się, jak zacząć tworzyć siatkę danych przez tworzenie i usuwanie jezior danych, stref i zasobów w Dataplex za pomocą konsoli Google Cloud.
Jakie zadania wykonasz
- Włączanie Dataplex API
- Tworzenie jezior
- Dodawanie strefy do jeziora danych
- Podłączanie i odłączanie zasobów
- Usuwanie stref i jezior danych
Konfiguracja i wymagania
Zanim klikniesz przycisk Rozpocznij moduł
Zapoznaj się z tymi instrukcjami. Moduły mają limit czasowy i nie można ich zatrzymać. Gdy klikniesz Rozpocznij moduł, na liczniku wyświetli się informacja o tym, na jak długo udostępniamy Ci zasoby Google Cloud.
W tym praktycznym module możesz spróbować swoich sił w wykonywaniu opisywanych działań w prawdziwym środowisku chmury, a nie w jego symulacji lub wersji demonstracyjnej. Otrzymasz nowe, tymczasowe dane logowania, dzięki którym zalogujesz się i uzyskasz dostęp do Google Cloud na czas trwania modułu.
Do ukończenia modułu potrzebne będą:
- dostęp do standardowej przeglądarki internetowej (zalecamy korzystanie z przeglądarki Chrome).
- Odpowiednia ilość czasu na ukończenie modułu – pamiętaj, że gdy rozpoczniesz, nie możesz go wstrzymać.
Rozpoczynanie modułu i logowanie się w konsoli Google Cloud
-
Kliknij przycisk Rozpocznij moduł. Jeśli moduł jest odpłatny, otworzy się wyskakujące okienko, w którym możesz wybrać formę płatności. Po lewej stronie znajduje się panel Szczegóły modułu z następującymi elementami:
- przyciskiem Otwórz konsolę Google Cloud;
- czasem, który Ci pozostał;
- tymczasowymi danymi logowania, których musisz użyć w tym module;
- innymi informacjami potrzebnymi do ukończenia modułu.
-
Kliknij Otwórz konsolę Google Cloud (lub kliknij prawym przyciskiem myszy i wybierz Otwórz link w oknie incognito, jeśli korzystasz z przeglądarki Chrome).
Moduł uruchomi zasoby, po czym otworzy nową kartę ze stroną logowania.
Wskazówka: otwórz karty obok siebie w osobnych oknach.
Uwaga: jeśli pojawi się okno Wybierz konto, kliknij Użyj innego konta. -
W razie potrzeby skopiuj nazwę użytkownika znajdującą się poniżej i wklej ją w oknie logowania.
{{{user_0.username | "Username"}}} Nazwę użytkownika znajdziesz też w panelu Szczegóły modułu.
-
Kliknij Dalej.
-
Skopiuj podane niżej hasło i wklej je w oknie powitania.
{{{user_0.password | "Password"}}} Hasło znajdziesz też w panelu Szczegóły modułu.
-
Kliknij Dalej.
Ważne: musisz użyć danych logowania podanych w module. Nie używaj danych logowania na swoje konto Google Cloud. Uwaga: korzystanie z własnego konta Google Cloud w tym module może wiązać się z dodatkowymi opłatami. -
Na kolejnych stronach wykonaj następujące czynności:
- Zaakceptuj Warunki korzystania z usługi.
- Nie dodawaj opcji odzyskiwania ani uwierzytelniania dwuskładnikowego (ponieważ konto ma charakter tymczasowy).
- Nie rejestruj się w bezpłatnych wersjach próbnych.
Poczekaj, aż na karcie otworzy się konsola Google Cloud.
Włączanie Cloud Dataplex API
-
Na pasku wyszukiwania u góry konsoli Google Cloud wpisz Cloud Dataplex API.
-
Kliknij wynik z interfejsem Cloud Dataplex API w sekcji Marketplace.
-
Kliknij Włącz.
Zadanie 1. Tworzenie jezior
W Dataplex jezioro danych to domena organizacyjna najwyższego poziomu, która reprezentuje konkretny obszar danych lub jednostkę biznesową. Możesz na przykład utworzyć jezioro dla każdego działu lub domeny danych w swojej organizacji, co pozwoli Ci porządkować dane dla konkretnych grup użytkowników i dostarczać im te dane.
W tym zadaniu utworzysz jezioro, aby zacząć budować siatkę danych.
- W Menu nawigacyjnym () konsoli Google Cloud kliknij Analityka > Dataplex.
Jeśli pojawi się okno Witamy w nowej usłudze Dataplex
, kliknij Zamknij.
-
W sekcji Zarządzanie jeziorami kliknij Zarządzaj.
-
Kliknij Utwórz jezioro danych.
-
Wpisz informacje potrzebne do utworzenia nowego jeziora:
Właściwość | Wartość |
---|---|
Wyświetlana nazwa | sensors |
Identyfikator | Pozostaw wartość domyślną. |
Region |
W pozostałych opcjach pozostaw wartości domyślne.
- Kliknij Utwórz.
Utworzenie jeziora może zająć do 3 minut.
Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło.
Zadanie 2. Dodawanie strefy do jeziora danych
Po utworzeniu jeziora możesz dodać do niego strefy. Strefy to subdomeny w jeziorze, których możesz używać do dalszego kategoryzowania danych. Możesz kategoryzować dane na przykład według etapu, wykorzystania lub ograniczeń.
Wyróżniamy 2 typy stref:
- Strefy nieprzetworzone zawierają dane w formatach nieprzetworzonych (takich jak pliki w zasobnikach Cloud Storage) i nie podlegają rygorystycznemu sprawdzaniu typu.
- Strefy wybrane zawierają dane oczyszczone, sformatowane i gotowe do analizy, np. w tabelach BigQuery.
W tym zadaniu utworzysz strefę nieprzetworzoną do pracy z plikami w zasobniku Cloud Storage.
-
Na karcie Zarządzanie kliknij nazwę jeziora.
-
Kliknij Dodaj strefę.
-
Wpisz informacje potrzebne do utworzenia nowej strefy:
Właściwość | Wartość |
---|---|
Wyświetlana nazwa | temperature raw data |
Identyfikator | Pozostaw wartość domyślną. |
Typ | Strefa nieprzetworzona |
Lokalizacje danych | Region |
W pozostałych opcjach pozostaw wartości domyślne.
Przykładowo: opcja Włącz wykrywanie metadanych w sekcji Ustawienia wykrywania jest domyślnie włączona i pozwala uprawnionym użytkownikom wykrywać dane w strefie.
- Kliknij Utwórz.
Utworzenie strefy może zająć do 2 minut.
Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło.
Zadanie 3. Podłączanie zasobu do strefy
Dane przechowywane w zasobnikach Cloud Storage lub zbiorach danych BigQuery można podłączać jako zasoby do stref w jeziorze Dataplex.
W tym zadaniu podłączysz zasobnik Cloud Storage utworzony w konsoli Google Cloud.
-
Kliknij nazwę strefy na karcie Strefy.
-
Na karcie Zasoby kliknij Dodaj zasoby.
-
Kliknij Dodaj zasób.
-
Wpisz informacje potrzebne do dołączenia nowego zasobu:
Właściwość | Wartość |
---|---|
Typ | Zasobnik na dane |
Wyświetlana nazwa | measurements |
Identyfikator | Pozostaw wartość domyślną. |
W pozostałych opcjach pozostaw wartości domyślne.
- W sekcji Zasobnik kliknij Przeglądaj.
Możesz podłączyć istniejący zasobnik Cloud Storage lub utworzyć nowy bez opuszczania Dataplex. W kolejnych krokach utworzysz nowy zasobnik Cloud Storage i podłączysz go do strefy.
-
Kliknij Utwórz nowy zasobnik ().
-
Podaj identyfikator projektu i nazwę zasobnika (
), a potem kliknij Dalej. -
Jako Typ lokalizacji wybierz Region, a następnie
.
W pozostałych opcjach pozostaw wartości domyślne.
- Kliknij Utwórz.
Jeśli otworzy się okno Dostęp publiczny będzie zablokowany
, kliknij Potwierdź.
-
Kliknij Wybierz, aby wskazać utworzony przez siebie zasobnik, a potem kliknij Dalej.
-
W Ustawieniach wykrywania wybierz Odziedzicz, aby odziedziczyć ustawienia wykrywania z poziomu strefy. Następnie kliknij Dalej.
-
Kliknij Prześlij.
Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło.
Zadanie 4. Usuwanie zasobów, stref i jezior
Aby usunąć jezioro, musisz najpierw odłączyć zasoby, a potem usunąć strefy.
W tym zadaniu odłączysz zasób od strefy, potem usuniesz strefę, a na końcu usuniesz jezioro.
Odłączanie zasobu
-
W menu po lewej stronie kliknij kartę Zarządzaj, a potem nazwę swojego jeziora.
-
Kliknij nazwę strefy na karcie Strefy.
-
Na karcie Zasoby zaznacz pole wyboru po lewej stronie nazwy zasobu.
-
Kliknij Usuń zasoby.
-
Kliknij Usuń, aby potwierdzić.
To działanie nie usuwa danych bazowych w zasobniku Cloud Storage. Uniemożliwia tylko wykrywanie zasobnika Cloud Storage i dostęp do niego za pomocą jeziora Dataplex.
Usuwanie strefy
-
W menu po lewej stronie kliknij kartę Zarządzaj, a potem nazwę swojego jeziora.
-
Na karcie Strefy zaznacz pole wyboru po lewej stronie nazwy strefy.
-
Kliknij Usuń strefę.
-
Kliknij Usuń, aby potwierdzić.
Usuwanie jeziora
-
W menu po lewej stronie kliknij kartę Zarządzaj, a potem nazwę swojego jeziora.
-
U góry strony kliknij Usuń.
-
Potwierdź usunięcie, wpisując delete w polu tekstowym.
-
Kliknij Usuń jezioro danych, aby potwierdzić.
Kliknij Sprawdź postępy, aby zobaczyć, jak Ci poszło.
Gratulacje!
Teraz już wiesz, jak używać konsoli Google Cloud, aby tworzyć i usuwać jeziora danych, strefy oraz zasoby w Dataplex.
Szkolenia i certyfikaty Google Cloud
…pomogą Ci wykorzystać wszystkie możliwości technologii Google Cloud. Nasze zajęcia obejmują umiejętności techniczne oraz sprawdzone metody, które ułatwią Ci szybką naukę i umożliwią jej kontynuację. Oferujemy szkolenia na poziomach od podstawowego po zaawansowany prowadzone w trybach wirtualnym, na żądanie i na żywo, dzięki czemu możesz dopasować program szkoleń do swojego napiętego harmonogramu. Certyfikaty umożliwią udokumentowanie i potwierdzenie Twoich umiejętności oraz doświadczenia w zakresie technologii Google Cloud.
Ostatnia aktualizacja instrukcji: 20 września 2023 r.
Ostatni test modułu: 20 września 2023 r.
Copyright 2024 Google LLC. Wszelkie prawa zastrzeżone. Google i logo Google są znakami towarowymi Google LLC. Wszelkie inne nazwy firm i produktów mogą być znakami towarowymi odpowiednich podmiotów, z którymi są powiązane.