Контрольні точки
Create a Dataplex lake with two zones and two assets
/ 20
Create and apply a tag template to a zone
/ 20
Assign a Dataplex IAM role to another user
/ 20
Create and upload a data quality specification file
/ 20
Define and run a data quality job
/ 20
Практична робота підвищеного рівня складності "Створення сітки даних за допомогою Dataplex"
- GSP514
- Огляд
- Налаштування
- Сценарій
- Завдання 1. Створіть озеро даних Dataplex із двома зонами й двома об’єктами
- Завдання 2. Створіть шаблон тегу й застосуйте його до зони
- Завдання 3. Призначте роль Dataplex IAM іншому користувачу
- Завдання 4. Створіть і завантажте файл зі специфікацією якості даних у Cloud Storage
- Завдання 5. Налаштуйте й запустіть завдання з перевірки якості даних у Dataplex
- Вітаємо!
GSP514
Огляд
Практична робота підвищеного рівня складності передбачає сценарій і кілька завдань. Покрокових інструкцій немає. Натомість ви маєте застосувати навички, які здобули під час практичних робіт курсу, і самостійно з’ясувати, як виконувати завдання. Автоматична система оцінювання (показана на цій сторінці) згенерує відгук щодо того, чи правильно виконано завдання.
Під час практичної роботи підвищеного рівня складності ви не вивчаєте нові поняття Google Cloud, а розвиваєте опановані навички (наприклад, змінюєте значення за умовчанням і переглядаєте повідомлення про помилки для їх виправлення).
Щоб набрати 100%, слід правильно виконати всі завдання за визначений період часу.
Налаштування
Перш ніж натиснути кнопку Start Lab (Почати практичну роботу)
Ознайомтеся з наведеними нижче вказівками. На виконання практичної роботи відводиться обмежений час, і її не можна призупинити. Щойно ви натиснете Start Lab (Почати практичну роботу), з’явиться таймер, який показуватиме, скільки часу для роботи з ресурсами Google Cloud у вас залишилося.
Ви зможете виконати практичну роботу в дійсному робочому хмарному середовищі (не в симуляції або демонстраційному середовищі). Для цього на час виконання практичної роботи вам надаються тимчасові облікові дані для реєстрації і входу в Google Cloud.
Щоб виконати цю практичну роботу, потрібно мати:
- стандартний веб-переглядач, наприклад Chrome (рекомендовано)
- достатню кількість часу, оскільки почавши практичну роботу, ви не зможете призупинити її
Сценарій
Ви починаєте працювати на посаді молодшого розробника даних і вже допомагали команді розробників створювати й налаштовувати об’єкти Dataplex.
Очікується, що ви вже маєте знання й навички для виконання таких завдань.
Ваше завдання
Вам потрібно допомогти нещодавно зібраній команді розробників скласти нову сітку даних за допомогою Dataplex, зокрема створивши озеро даних із кількома зонами й об’єктами. Вам також знадобиться позначити ці об’єкти тегами в новому озері даних і оцінити якість інформації, яку вони містять. Для цього буде необхідно виконати наведені нижче завдання.
- Створіть озеро даних Dataplex із двома зонами й двома об’єктами.
- Створіть шаблон тегу й позначте за його допомогою всі дані в зоні як захищені.
- Призначте роль Dataplex IAM іншому користувачу.
- Створіть і завантажте файл зі специфікацією якості даних у Cloud Storage.
- Налаштуйте й запустіть завдання з перевірки якості даних у Dataplex.
Слід дотримуватися описаних нижче стандартів.
- Усі необхідні для роботи API, зокрема Dataplex, Data Catalog і Dataproc, має бути ввімкнено.
- Створювати всі ресурси в регіоні
, якщо немає інших вказівок.
Нижче детально описано кожне завдання. Бажаємо успіху!
Завдання 1. Створіть озеро даних Dataplex із двома зонами й двома об’єктами
Сегмент Cloud Storage і набір даних BigQuery, які необхідні для виконання кроку 2 цього завдання, було створено попередньо.
- Створіть озеро даних Dataplex під назвою Sales Lake із двома регіональними зонами:
- необробленою зоною з даними клієнтів Raw Customer Zone;
- спеціально підібраною зоною з даними клієнтів Curated Customer Zone.
- Додайте по одному попередньо створеному об’єкту в кожну зону.
- У необроблену зону додайте сегмент Cloud Storage під назвою
-customer-online-sessions як новий об’єкт взаємодій із клієнтами Customer Engagements. - У спеціально підібрану зону додайте набір даних BigQuery під назвою
.customer_orders як новий об’єкт замовлень клієнтів Customer Orders.
Щоб підтвердити виконання завдання, натисніть Check my progress (Підтвердити виконання).
Завдання 2. Створіть шаблон тегу й застосуйте його до зони
- Створіть загальнодоступний шаблон тегу захищених даних клієнтів під назвою Protected Customer Data Template із двома полями з наборами значень.
- Перше поле для позначки вихідних даних Raw Data Flag із двома значеннями
Yes
іNo
. - Друге поле для позначки захищеної контактної інформації Protected Contact Information Flag із двома значеннями
Yes
іNo
.
- За допомогою цього шаблона призначте зоні Raw Customer Zone значення
Yes
для обох позначок.
Щоб підтвердити виконання завдання, натисніть Check my progress (Підтвердити виконання).
Завдання 3. Призначте роль Dataplex IAM іншому користувачу
- За принципом мінімальних повноважень призначте Користувачу 2 (
) роль Dataplex IAM, яка дасть йому змогу завантажувати нові файли Cloud Storage в об’єкт Dataplex під назвою Customer Engagements.
Щоб підтвердити виконання завдання, натисніть Check my progress (Підтвердити виконання).
Завдання 4. Створіть і завантажте файл зі специфікацією якості даних у Cloud Storage
Сегмент Cloud Storage, необхідний для виконання кроку 2 цього завдання, було створено попередньо.
- Створіть файл зі специфікацією якості даних під назвою dq-customer-orders.yaml із наведеними нижче параметрами.
- Правило NOT NULL застосовано до стовпця user_id в таблиці customer_orders.ordered_items.
- Правило NOT NULL застосовано до стовпця order_id в таблиці customer_orders.ordered_items.
- Завантажте цей файл у сегмент Cloud Storage під назвою
-dq-config.
Щоб підтвердити виконання завдання, натисніть Check my progress (Підтвердити виконання).
Завдання 5. Налаштуйте й запустіть завдання з перевірки якості даних у Dataplex
Набір даних BigQuery, необхідний для виконання кроку 1 цього завдання, було створено попередньо.
- Налаштуйте завдання з перевірки якості даних за допомогою файлу dq-customer-orders.yaml із наведеними нижче параметрами.
Властивість | Значення |
---|---|
Назва завдання з перевірки якості даних | Завдання з перевірки якості даних про замовлення клієнтів |
Цільова таблиця BigQuery для результатів | |
Сервісний обліковий запис користувача | Стандартний сервісний обліковий запис Compute Engine |
- Указавши потрібну інформацію, одразу запустіть завдання з перевірки якості даних.
Щоб підтвердити виконання завдання, натисніть Check my progress (Підтвердити виконання).
Вітаємо!
Отримайте наступний значок
Цю практичну роботу можна виконувати у власному темпі, і вона входить до квесту Build a Data Mesh with Dataplex. Пройшовши квест, ви отримаєте значок як відзнаку за досягнення. Додайте значок у своє резюме й на сторінки в соціальних мережах. Розкажіть про свої досягнення за допомогою хештегу #GoogleCloudBadge.
Навчання й сертифікація Google Cloud
…допомагають ефективно використовувати технології Google Cloud. Наші курси передбачають опанування технічних навичок, а також ознайомлення з рекомендаціями, що допоможуть вам швидко зорієнтуватися й вивчити матеріал. Ми пропонуємо курси різних рівнів – від базового до високого. Ви можете вибрати формат навчання (за запитом, онлайн або офлайн) відповідно до власного розкладу. Пройшовши сертифікацію, ви перевірите й підтвердите свої навички та досвід роботи з технологіями Google Cloud.
Посібник востаннє оновлено 4 липня 2023 року
Практичну роботу востаннє протестовано 4 липня 2023 року
© Google LLC 2024. Усі права захищено. Назва та логотип Google є торговельними марками Google LLC. Усі інші назви компаній і продуктів можуть бути торговельними марками відповідних компаній, з якими вони пов’язані.