arrow_back

Dataplex: Qwik Start – консоль

Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Dataplex: Qwik Start – консоль

Lab 30 годин universal_currency_alt 1 кредит show_chart Початковий
info This lab may incorporate AI tools to support your learning.
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP1143

Логотип Google Cloud Self-Paced Labs

Огляд

Dataplex – це інтелектуальна матриця даних, завдяки якій організації можуть централізовано шукати, контролювати й відстежувати дані, а також керувати ними в озерах, сховищах і вітринах із метою аналізу у великих масштабах. Фактично за допомогою Dataplex можна побудувати структуру сітки даних. Це архітектура, яка передбачає технологічний підхід до даних організацій і дає змогу розподіляти права на їх власність між власниками областей даних.

Dataplex керує даними, не переміщуючи й не копіюючи їх при цьому. Коли ви додаєте нові об’єкти, Dataplex зчитує метадані структурованих і неструктурованих даних та автоматично реєструє їх у захищеному уніфікованому сховищі. Доступ до даних і метаданих можна отримати за допомогою таких сервісів Google Cloud як Data Catalog і BigQuery.

Під час цієї практичної роботи ви дізнаєтеся про основи побудови сітки даних у Dataplex за допомогою Google Cloud Console на прикладі створення й вилучення озер даних, зон і об’єктів.

Завдання

  • Увімкніть Dataplex API
  • Створіть озеро даних
  • Додайте зону в озеро даних
  • Додайте й вилучіть об’єкти
  • Видаліть зони й озера даних

Налаштування й вимоги

Перш ніж натиснути кнопку Start Lab (Почати практичну роботу)

Ознайомтеся з наведеними нижче вказівками. На виконання практичної роботи відводиться обмежений час, і її не можна призупинити. Щойно ви натиснете Start Lab (Почати практичну роботу), з’явиться таймер, який показуватиме, скільки часу для роботи з ресурсами Google Cloud у вас залишилося.

Ви зможете виконати практичну роботу в дійсному робочому хмарному середовищі (не в симуляції або демонстраційному середовищі). Для цього на час виконання практичної роботи вам надаються тимчасові облікові дані для реєстрації і входу в Google Cloud.

Щоб виконати цю практичну роботу, потрібно мати:

  • стандартний веб-переглядач, наприклад Chrome (рекомендовано)
Примітка. Виконуйте практичну роботу в режимі анонімного перегляду. Так ви уникнете додаткової плати, що може стягуватися з вашого особистого облікового запису внаслідок його конфліктів з обліковим записом для навчання.
  • достатню кількість часу, оскільки почавши практичну роботу, ви не зможете призупинити її
Примітка. Якщо ви маєте особистий обліковий запис або проект Google Cloud, не використовуйте їх для доступу до цієї практичної роботи. Так ви уникнете додаткових стягнень з вашого облікового запису.

Як почати виконувати практичну роботу й увійти в Google Cloud Console

  1. Натисніть кнопку Start Lab (Почати практичну роботу). Якщо за практичну роботу необхідно заплатити, відкриється спливаюче вікно, де ви зможете обрати спосіб оплати. Ліворуч розміщено панель Lab Details (Відомості про практичну роботу) з такими даними:

    • кнопка Open Google Cloud console (Відкрити Google Cloud Console);
    • час до закінчення;
    • тимчасові облікові дані, які потрібно використовувати для доступу до цієї практичної роботи;
    • інша інформація, необхідна для виконання цієї практичної роботи.
  2. Натисніть Open Google Cloud console (Відкрити Google Cloud Console) або натисніть правою кнопкою миші й виберіть Open Link in Incognito Window (Відкрити посилання в анонімному вікні), якщо ви використовуєте вебпереглядач Chrome.

    Завантажаться необхідні ресурси. Потім відкриється нова вкладка зі сторінкою Sign in (Вхід).

    Порада. Упорядковуйте вкладки в окремих вікнах, розміщуючи їх поруч.

    Примітка. Якщо з’явиться вікно Choose an account (Виберіть обліковий запис), натисніть Use Another Account (Увійти в інший обліковий запис).
  3. За потреби скопіюйте значення в полі Username (Ім’я користувача) нижче й вставте його у вікні Sign in (Вхід).

    {{{user_0.username | "Username"}}}

    Поле Username (Ім’я користувача) також можна знайти на панелі Lab Details (Відомості про практичну роботу).

  4. Натисніть Next (Далі).

  5. Скопіюйте значення в полі Password (Пароль) нижче й вставте його у вікні Welcome (Привітання).

    {{{user_0.password | "Password"}}}

    Поле Password (Пароль) також можна знайти на панелі Lab Details (Відомості про практичну роботу).

  6. Натисніть Next (Далі).

    Важливо. Обов’язково використовуйте облікові дані, призначені для відповідної практичної роботи. Не використовуйте облікові дані Google Cloud. Примітка. Якщо ввійти у власний обліковий запис Google Cloud, може стягуватися додаткова плата.
  7. Виконайте наведені нижче дії.

    • Прийміть Умови використання.
    • Не додавайте способи відновлення й двохетапну перевірку (оскільки це тимчасовий обліковий запис).
    • Не реєструйте безкоштовні пробні версії.

Через кілька секунд Google Cloud Console відкриється в новій вкладці.

Примітка. Щоб переглянути меню зі списком продуктів і сервісів Google Cloud, натисніть меню навігації вгорі ліворуч. Значок меню навігації

Увімкніть Cloud Dataplex API

  1. У рядку пошуку вгорі Google Cloud Console введіть Cloud Dataplex API.

  2. Виберіть серед результатів у розділі Marketplace Cloud Dataplex API.

  3. Натисніть Enable (Увімкнути).

Завдання 1. Створіть озеро даних

У Dataplex озеро даних – це найвища організаційна одиниця, що відповідає певній області даних або підрозділу компанії. Наприклад, ви можете створити озеро для кожного підрозділу або області даних у своїй організації, щоб упорядковувати дані й надавати доступ до них певним групам користувачів.

У цьому завданні ви створюєте озеро даних, щоб почати складати сітку даних.

  1. У меню навігації (Меню навігації) Google Cloud Console натисніть Analytics (Аналітика) > Dataplex.

Якщо з’явиться запит Welcome to the new Dataplex experience (Вітаємо в новому інтерфейсі Dataplex), натисніть Close (Закрити).

  1. У розділі Manage lakes (Керувати озерами даних) натисніть Manage (Керувати).

  2. Виберіть Create lake (Створити озеро даних).

  3. Введіть необхідну інформацію.

Властивість Значення
Відображувана назва sensors
Ідентифікатор Залиште значення за умовчанням.
Регіон

Залиште інші значення за умовчанням.

  1. Натисніть Create (Створити).

Озеро даних буде створено протягом 3 хвилин.

Щоб підтвердити виконання завдання, натисніть Підтвердити виконання. Створіть озеро даних із назвою sensors.

Завдання 2. Додайте зону в озеро даних

Створивши озеро даних, ви зможете додавати в нього зони. Зони – це підобласті всередині озера даних, за допомогою яких ці дані можна впорядковувати, зокрема за типом, призначенням чи обмеженнями щодо використання.

Є два типи зон, наведені нижче.

  • Необроблені зони, які містять дані в необроблених форматах (як-от файли в сегментах Cloud Storage) і не підлягають суворій перевірці типів даних.
  • Спеціально підібрані зони, які містять очищені й відформатовані дані, придатні для аналізу (як-от таблиці BigQuery).

У цьому завданні ви створюєте необроблену зону для роботи з файлами в сегменті Cloud Storage.

  1. Натисніть назву потрібного озера на вкладці Manage (Керувати).

  2. Виберіть Add zone (Додати зону).

  3. Введіть необхідну інформацію.

Властивість Значення
Відображувана назва temperature raw data
Ідентифікатор Залиште значення за умовчанням.
Тип Необроблена зона
Місцезнаходження даних Регіональне

Залиште інші значення за умовчанням.

Наприклад, за умовчанням буде ввімкнено параметр Enable metadata discovery (Увімкнути пошук метаданих) у розділі Discovery settings (Налаштування пошуку), який дає авторизованим користувачам змогу знаходити дані в зоні.

  1. Натисніть Create (Створити).

Зону буде створено протягом 2 хвилин.

Коли статус зони зміниться на Active (Активна), перейдіть до наступного завдання.

Щоб підтвердити виконання завдання, натисніть Підтвердити виконання. Додайте зону temperature raw data в озеро даних "sensors".

Завдання 3. Додайте об’єкт у зону

Дані, які зберігаються в сегментах Cloud Storage і наборах даних BigQuery, можна додавати в зони всередині озер даних Dataplex як об’єкти.

У цьому завданні ви додаєте сегмент Cloud Storage, створений у Google Cloud Console.

  1. Натисніть назву потрібної зони на вкладці Zones (Зони).

  2. Виберіть Add assets (Додати об’єкти) на вкладці Assets (Об’єкти).

  3. Натисніть Add an asset (Додати об’єкт).

  4. Введіть необхідну інформацію.

Властивість Значення
Тип Сегмент Cloud Storage
Відображувана назва measurements
Ідентифікатор Залиште значення за умовчанням.

Залиште інші значення за умовчанням.

  1. Натисніть Browse (Переглянути) біля опції Bucket (Сегмент).

Ви можете включити наявний сегмент Cloud Storage або створити новий безпосередньо в Dataplex. У наступних кроках ви створите новий сегмент Cloud Storage і додасте його в зону.

  1. Натисніть Create new bucket (Створити новий сегмент) (значок кошика).

  2. У полі назви сегмента введіть ідентифікатор проекту (), а потім натисніть Continue (Продовжити).

  3. У полі Location type (Тип місцезнаходження) виберіть опцію Region (Регіон), а потім – .

Залиште інші значення за умовчанням.

  1. Натисніть Create (Створити).

Якщо з’явиться вікно Public access will be prevented (Загальний доступ буде заборонено), натисніть Confirm (Підтвердити).

  1. Щоб позначити сегмент, який ви щойно створили, натисніть Select (Вибрати), а потім – Continue (Продовжити).

  2. У розділі Discovery settings (Налаштування пошуку) виберіть параметр Inherit (Успадкувати), щоб об’єкт успадкував налаштування пошуку на рівні зони, а потім натисніть Continue (Продовжити).

  3. Натисніть Submit (Надіслати).

Щоб підтвердити виконання завдання, натисніть Підтвердити виконання. Створіть сегмент Cloud Storage і додайте об’єкт measurements у зону temperature raw data.

Завдання 4. Видаліть об’єкти, зони й озера даних

Перш ніж видаляти озеро даних, потрібно спершу вилучити об’єкти й зони (у вказаному порядку).

У цьому завданні ви вилучаєте із зони об’єкт, далі видаляєте цю зону й лише потім – озеро даних.

Вилучіть об’єкт

  1. У меню ліворуч натисніть вкладку Manage (Керувати), а потім виберіть назву потрібного озера даних.

  2. Натисніть назву потрібної зони на вкладці Zones (Зони).

  3. Поставте прапорець ліворуч від назви потрібного об’єкта на вкладці Assets (Об’єкти).

  4. Натисніть Delete assets (Видалити об’єкти).

  5. Натисніть Delete (Видалити), щоб підтвердити дію.

Коли ви це зробите, буде видалено відповідні дані в сегменті Cloud Storage, а сам сегмент більше не відображатиметься в озері даних у Dataplex і ви не зможете отримати до нього доступ.

Видаліть зону

  1. У меню ліворуч натисніть вкладку Manage (Керувати), а потім виберіть назву потрібного озера даних.

  2. Поставте прапорець ліворуч від назви потрібної зони на вкладці Zones (Зони).

  3. Натисніть Delete zone (Видалити зону).

  4. Натисніть Delete (Видалити), щоб підтвердити дію.

Видаліть озеро даних

  1. У меню ліворуч натисніть вкладку Manage (Керувати), а потім виберіть назву потрібного озера даних.

  2. Угорі сторінки натисніть Delete (Видалити).

  3. Щоб підтвердити видалення, введіть delete у текстовому полі.

  4. Натисніть Delete lake (Видалити озеро даних).

Щоб підтвердити виконання завдання, натисніть Підтвердити виконання. Видаліть озеро даних sensors і ресурси, які воно містить.

Вітаємо!

Ви навчилися створювати й видаляти озера даних, зони та об’єкти в Dataplex за допомогою Google Cloud Console.

Навчання й сертифікація Google Cloud

…допомагають ефективно використовувати технології Google Cloud. Наші курси передбачають опанування технічних навичок, а також ознайомлення з рекомендаціями, що допоможуть вам швидко зорієнтуватися й вивчити матеріал. Ми пропонуємо курси різних рівнів – від базового до високого. Ви можете вибрати формат навчання (за запитом, онлайн або офлайн) відповідно до власного розкладу. Пройшовши сертифікацію, ви перевірите й підтвердите свої навички та досвід роботи з технологіями Google Cloud.

Посібник востаннє оновлено 20 вересня 2023 року

Практичну роботу востаннє протестовано 20 вересня 2023 року

© Google LLC 2024. Усі права захищено. Назва та логотип Google є торговельними марками Google LLC. Усі інші назви компаній і продуктів можуть бути торговельними марками відповідних компаній, з якими вони пов’язані.

This content is not currently available

We will notify you via email when it becomes available

Great!

We will contact you via email if it becomes available