
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create a Cloud Storage bucket
/ 50
Run an Example Pipeline Remotely
/ 50
Apache Beam SDK – це модель програмування з відкритим кодом для конвеєрів обробки даних. У Google Cloud можна визначати конвеєри за допомогою програми Apache Beam, а потім запускати їх у Dataflow.
Під час цієї практичної роботи ви налаштуєте середовище для розробки на Python для Dataflow за допомогою Apache Beam SDK для Python і запустите тестовий конвеєр Dataflow.
У цій практичній роботі ви навчитеся виконувати наведені нижче дії.
Ознайомтеся з наведеними нижче вказівками. На виконання практичної роботи відводиться обмежений час, і її не можна призупинити. Щойно ви натиснете Start Lab (Почати практичну роботу), з’явиться таймер, який показуватиме, скільки часу для роботи з ресурсами Google Cloud у вас залишилося.
Ви зможете виконати практичну роботу в дійсному робочому хмарному середовищі (не в симуляції або демонстраційному середовищі). Для цього на час виконання практичної роботи вам надаються тимчасові облікові дані для реєстрації і входу в Google Cloud.
Щоб виконати цю практичну роботу, потрібно мати:
Натисніть кнопку Start Lab (Почати практичне заняття). Якщо за практичне заняття необхідно заплатити, відкриється вікно, де ви зможете обрати спосіб оплати. Ліворуч розміщено панель "Відомості про практичне заняття" з такими компонентами:
Натисніть Відкрити консоль Google або натисніть правою кнопкою миші й виберіть Відкрити анонімне вікно, якщо ви використовуєте вебпереглядач Chrome.
Завантажаться необхідні ресурси. Потім відкриється нова вкладка зі сторінкою "Увійти".
Порада. Упорядковуйте вкладки в окремих вікнах, розміщуючи їх поруч.
За потреби скопіюйте значення в полі Username (Ім’я користувача) нижче й вставте його у вікні Вхід.
Поле "Ім’я користувача" також можна знайти на панелі "Відомості про практичне заняття".
Натисніть Далі.
Скопіюйте значення в полі Password (Пароль) нижче й вставте його у вікні Welcome (Привітання).
Поле "Пароль" також можна знайти на панелі "Відомості про практичне заняття".
Натисніть Далі.
Що від вас очікується
Через кілька секунд консоль Google Cloud відкриється в новій вкладці.
Cloud Shell – це віртуальна машина з попередньо завантаженими інструментами для розробників. Вона містить головний каталог обсягом 5 ГБ постійної пам’яті й працює в середовищі Google Cloud. Cloud Shell надає доступ до ресурсів Google Cloud через командний рядок.
Щойно ви підключитеся, вас буде автентифіковано, а проект отримає ваш PROJECT_ID (ІДЕНТИФІКАТОР ПРОЕКТУ). Вивід міститиме рядок зі значенням PROJECT_ID (ІДЕНТИФІКАТОР ПРОЕКТУ) для цього сеансу:
gcloud
– це інструмент командного рядка для Google Cloud. Він входить у пакет Cloud Shell і підтримує функцію автозавершення клавішею TAB.
Натисніть Authorize (Авторизувати).
Вихідні дані матимуть такий вигляд:
Вивід:
Вивід:
Приклад виводу:
gcloud
, перегляньте посібник з інтерфейсу командного рядка gcloud у Google Cloud.
Щоб переконатися, що потрібний API підключений, перезапустіть підключення до Dataflow API.
У рядку пошуку вгорі Cloud Console введіть "Dataflow API". Виберіть серед результатів Dataflow API.
Натисніть Manage (Керувати).
Виберіть Disable API (Вимкнути API).
Якщо з’явиться запит із пропозицією підтвердити дію, натисніть Disable (Вимкнути).
Коли API ввімкнеться, на сторінці з’явиться опція вимкнути його.
Під час запуску конвеєра за допомогою Dataflow результати зберігатимуться в сегменті Cloud Storage. У цьому завданні ви створюєте сегмент Cloud Storage для результатів обробки конвеєра, який ви запустите під час виконання наступного завдання.
us
Натисніть Create (Створити).
Якщо з’явиться вікно Public access will be prevented (Загальний доступ буде заборонено), натисніть Confirm (Підтвердити).
Перевірка виконаного завдання
Щоб підтвердити виконання завдання, натисніть Check my progress (Підтвердити виконання). Якщо завдання виконано правильно, з’явиться оцінка.
Python3.9
:Ця команда дає змогу отримати контейнер Docker з останньою стабільною версією Python 3.9 і відкриває командну оболонку, за допомогою якої всередині контейнера можна виконати наведені нижче команди.
Можуть з’явитися попередження щодо залежностей. Під час виконання цієї практичної роботи на них можна не зважати.
wordcount.py
локально, виконавши таку команду:Також може з’явитися схоже повідомлення:
Це повідомлення можна ігнорувати.
OUTPUT_FILE
:OUTPUT_FILE
і вставте її в команду cat
:У результаті буде виведено всі слова у файлі й кількість повторень для кожного слова.
wordcount.py
віддалено:Зачекайте, доки у виводі з’явиться таке повідомлення:
Продовжте виконання практичної роботи.
Спочатку для завдання wordcount в полі status (статус) відображатиметься значення Running (Активне).
Після завершення процесу статус зміниться на Succeeded (Виконано).
Перевірка виконаного завдання
Щоб підтвердити виконання завдання, натисніть Підтвердити виконання. Якщо завдання виконано правильно, з’явиться оцінка.
У Cloud Console натисніть меню навігації > Cloud Storage.
Натисніть назву сегмента. Ви маєте побачити каталоги results (результати) і staging (підоготовчий).
Відкрийте папку під назвою results (результати). У ній мають міститися файли виводу, створені під час виконання вашого завдання.
Натисніть файл, щоб переглянути дані про кількість слів у ньому.
Дайте відповідь на запитання з кількома варіантами відповіді нижче, щоб закріпити розуміння понять, які зустрічаються в практичній роботі.
Ви навчилися налаштовувати середовище для розробки на Python для Dataflow за допомогою Apache Beam SDK для Python і запустили тестовий конвеєр Dataflow.
Ця робота також входить до низки практичних робіт під назвою Qwik Starts. Вони призначені для ознайомлення з функціями Google Cloud. Перелік практичних робіт Qwik Starts наведено в каталозі Google Cloud Skills Boost.
Якщо вас зацікавила книга, на основі якої створено цю практичну роботу, це Data Science on the Google Cloud Platform (Наука про дані з Google Cloud Platform, видавництво O’Reilly Media, Inc).
…допомагають ефективно використовувати технології Google Cloud. Наші курси передбачають опанування технічних навичок, а також ознайомлення з рекомендаціями, що допоможуть вам швидко зорієнтуватися й вивчити матеріал. Ми пропонуємо курси різних рівнів – від базового до високого. Ви можете вибрати формат навчання (за запитом, онлайн або офлайн) відповідно до власного розкладу. Пройшовши сертифікацію, ви перевірите й підтвердите свої навички та досвід роботи з технологіями Google Cloud.
Посібник востаннє оновлено 4 лютого 2024 року
Практичну роботу востаннє протестовано 4 травня 2023 року
© Google LLC 2025. Усі права захищено. Назва та логотип Google є торговельними марками Google LLC. Усі інші назви компаній і продуктів можуть бути торговельними марками відповідних компаній, з якими вони пов’язані.
This content is not currently available
We will notify you via email when it becomes available
Great!
We will contact you via email if it becomes available
One lab at a time
Confirm to end all existing labs and start this one