arrow_back

Практична робота підвищеного рівня складності "Створення сітки даних за допомогою Dataplex"

Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

Практична робота підвищеного рівня складності "Створення сітки даних за допомогою Dataplex"

Lab 1 година 30 годин universal_currency_alt 1 кредит show_chart Початковий
info This lab may incorporate AI tools to support your learning.
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP514

Логотип Google Cloud Self-Paced Labs

Огляд

Практична робота підвищеного рівня складності передбачає сценарій і кілька завдань. Покрокових інструкцій немає. Натомість ви маєте застосувати навички, які здобули під час практичних робіт курсу, і самостійно з’ясувати, як виконувати завдання. Автоматична система оцінювання (показана на цій сторінці) згенерує відгук щодо того, чи правильно виконано завдання.

Під час практичної роботи підвищеного рівня складності ви не вивчаєте нові поняття Google Cloud, а розвиваєте опановані навички (наприклад, змінюєте значення за умовчанням і переглядаєте повідомлення про помилки для їх виправлення).

Щоб набрати 100%, слід правильно виконати всі завдання за визначений період часу.

Налаштування

Перш ніж натиснути кнопку Start Lab (Почати практичну роботу)

Ознайомтеся з наведеними нижче вказівками. На виконання практичної роботи відводиться обмежений час, і її не можна призупинити. Щойно ви натиснете Start Lab (Почати практичну роботу), з’явиться таймер, який показуватиме, скільки часу для роботи з ресурсами Google Cloud у вас залишилося.

Ви зможете виконати практичну роботу в дійсному робочому хмарному середовищі (не в симуляції або демонстраційному середовищі). Для цього на час виконання практичної роботи вам надаються тимчасові облікові дані для реєстрації і входу в Google Cloud.

Щоб виконати цю практичну роботу, потрібно мати:

  • стандартний веб-переглядач, наприклад Chrome (рекомендовано)
Примітка. Виконуйте практичну роботу в режимі анонімного перегляду. Так ви уникнете додаткової плати, що може стягуватися з вашого особистого облікового запису внаслідок його конфліктів з обліковим записом для навчання.
  • достатню кількість часу, оскільки почавши практичну роботу, ви не зможете призупинити її
Примітка. Якщо ви маєте особистий обліковий запис або проект Google Cloud, не використовуйте їх для доступу до цієї практичної роботи. Так ви уникнете додаткових стягнень з вашого облікового запису.

Сценарій

Ви починаєте працювати на посаді молодшого розробника даних і вже допомагали команді розробників створювати й налаштовувати об’єкти Dataplex.

Очікується, що ви вже маєте знання й навички для виконання таких завдань.

Ваше завдання

Вам потрібно допомогти нещодавно зібраній команді розробників скласти нову сітку даних за допомогою Dataplex, зокрема створивши озеро даних із кількома зонами й об’єктами. Вам також знадобиться позначити ці об’єкти тегами в новому озері даних і оцінити якість інформації, яку вони містять. Для цього буде необхідно виконати наведені нижче завдання.

  • Створіть озеро даних Dataplex із двома зонами й двома об’єктами.
  • Створіть шаблон тегу й позначте за його допомогою всі дані в зоні як захищені.
  • Призначте роль Dataplex IAM іншому користувачу.
  • Створіть і завантажте файл зі специфікацією якості даних у Cloud Storage.
  • Налаштуйте й запустіть завдання з перевірки якості даних у Dataplex.

Слід дотримуватися описаних нижче стандартів.

  • Усі необхідні для роботи API, зокрема Dataplex, Data Catalog і Dataproc, має бути ввімкнено.
  • Створювати всі ресурси в регіоні , якщо немає інших вказівок.

Нижче детально описано кожне завдання. Бажаємо успіху!

Завдання 1. Створіть озеро даних Dataplex із двома зонами й двома об’єктами

Сегмент Cloud Storage і набір даних BigQuery, які необхідні для виконання кроку 2 цього завдання, було створено попередньо.

  1. Створіть озеро даних Dataplex під назвою Sales Lake із двома регіональними зонами:
  • необробленою зоною з даними клієнтів Raw Customer Zone;
  • спеціально підібраною зоною з даними клієнтів Curated Customer Zone.
  1. Додайте по одному попередньо створеному об’єкту в кожну зону.
  • У необроблену зону додайте сегмент Cloud Storage під назвою -customer-online-sessions як новий об’єкт взаємодій із клієнтами Customer Engagements.
  • У спеціально підібрану зону додайте набір даних BigQuery під назвою .customer_orders як новий об’єкт замовлень клієнтів Customer Orders.

Щоб підтвердити виконання завдання, натисніть Check my progress (Підтвердити виконання). Створіть озеро даних Dataplex із двома зонами й двома об’єктами.

Завдання 2. Створіть шаблон тегу й застосуйте його до зони

  1. Створіть загальнодоступний шаблон тегу захищених даних клієнтів під назвою Protected Customer Data Template із двома полями з наборами значень.
  • Перше поле для позначки вихідних даних Raw Data Flag із двома значеннями Yes і No.
  • Друге поле для позначки захищеної контактної інформації Protected Contact Information Flag із двома значеннями Yes і No.
  1. За допомогою цього шаблона призначте зоні Raw Customer Zone значення Yes для обох позначок.

Щоб підтвердити виконання завдання, натисніть Check my progress (Підтвердити виконання). Створіть шаблон тегу й застосуйте його до зони.

Завдання 3. Призначте роль Dataplex IAM іншому користувачу

  • За принципом мінімальних повноважень призначте Користувачу 2 () роль Dataplex IAM, яка дасть йому змогу завантажувати нові файли Cloud Storage в об’єкт Dataplex під назвою Customer Engagements.

Щоб підтвердити виконання завдання, натисніть Check my progress (Підтвердити виконання). Призначте роль Dataplex IAM іншому користувачу.

Завдання 4. Створіть і завантажте файл зі специфікацією якості даних у Cloud Storage

Сегмент Cloud Storage, необхідний для виконання кроку 2 цього завдання, було створено попередньо.

  1. Створіть файл зі специфікацією якості даних під назвою dq-customer-orders.yaml із наведеними нижче параметрами.
  • Правило NOT NULL застосовано до стовпця user_id в таблиці customer_orders.ordered_items.
  • Правило NOT NULL застосовано до стовпця order_id в таблиці customer_orders.ordered_items.
  1. Завантажте цей файл у сегмент Cloud Storage під назвою -dq-config.

Щоб підтвердити виконання завдання, натисніть Check my progress (Підтвердити виконання). Створіть і завантажте файл зі специфікацією якості даних.

Завдання 5. Налаштуйте й запустіть завдання з перевірки якості даних у Dataplex

Набір даних BigQuery, необхідний для виконання кроку 1 цього завдання, було створено попередньо.

  1. Налаштуйте завдання з перевірки якості даних за допомогою файлу dq-customer-orders.yaml із наведеними нижче параметрами.
Властивість Значення
Назва завдання з перевірки якості даних Завдання з перевірки якості даних про замовлення клієнтів
Цільова таблиця BigQuery для результатів .orders_dq_dataset.results
Сервісний обліковий запис користувача Стандартний сервісний обліковий запис Compute Engine
  1. Указавши потрібну інформацію, одразу запустіть завдання з перевірки якості даних.
Виконання завдання може зайняти кілька хвилин. Можливо, вам доведеться оновити сторінку.

Щоб підтвердити виконання завдання, натисніть Check my progress (Підтвердити виконання). Налаштуйте й запустіть завдання з перевірки якості даних у Dataplex.

Вітаємо!

Значок за створення сітки даних за допомогою Dataplex

Отримайте наступний значок

Цю практичну роботу можна виконувати у власному темпі, і вона входить до квесту Build a Data Mesh with Dataplex. Пройшовши квест, ви отримаєте значок як відзнаку за досягнення. Додайте значок у своє резюме й на сторінки в соціальних мережах. Розкажіть про свої досягнення за допомогою хештегу #GoogleCloudBadge.

Навчання й сертифікація Google Cloud

…допомагають ефективно використовувати технології Google Cloud. Наші курси передбачають опанування технічних навичок, а також ознайомлення з рекомендаціями, що допоможуть вам швидко зорієнтуватися й вивчити матеріал. Ми пропонуємо курси різних рівнів – від базового до високого. Ви можете вибрати формат навчання (за запитом, онлайн або офлайн) відповідно до власного розкладу. Пройшовши сертифікацію, ви перевірите й підтвердите свої навички та досвід роботи з технологіями Google Cloud.

Посібник востаннє оновлено 4 липня 2023 року

Практичну роботу востаннє протестовано 4 липня 2023 року

© Google LLC 2024. Усі права захищено. Назва та логотип Google є торговельними марками Google LLC. Усі інші назви компаній і продуктів можуть бути торговельними марками відповідних компаній, з якими вони пов’язані.

This content is not currently available

We will notify you via email when it becomes available

Great!

We will contact you via email if it becomes available