检查点
Create a Dataplex lake with two zones and two assets
/ 20
Create and apply a tag template to a zone
/ 20
Assign a Dataplex IAM role to another user
/ 20
Create and upload a data quality specification file
/ 20
Define and run a data quality job
/ 20
Build a Data Mesh with Dataplex:挑戰研究室
GSP514
總覽
在挑戰研究室中,您會在特定情境下完成一系列任務。挑戰研究室不會提供逐步說明,您將運用從課程研究室學到的技巧,自行找出方法完成任務!自動評分系統 (如本頁所示) 將根據您是否正確完成任務來提供意見回饋。
在您完成任務的期間,挑戰研究室不會介紹新的 Google Cloud 概念。您須靈活運用所學技巧,例如變更預設值或詳讀並研究錯誤訊息,解決遇到的問題。
若想滿分達標,就必須在時限內成功完成所有任務!
設定
點選「Start Lab」按鈕前的須知事項
請詳閱以下操作說明。研究室活動會計時,而且中途無法暫停。點選「Start Lab」 後就會開始計時,讓您瞭解有多少時間可以使用 Google Cloud 資源。
您將在真正的雲端環境中完成實作研究室活動,而不是在模擬或示範環境。為達此目的,我們會提供新的暫時憑證,讓您用來在研究室活動期間登入及存取 Google Cloud。
如要完成這個研究室活動,請先確認:
- 您可以使用標準的網際網路瀏覽器 (Chrome 瀏覽器為佳)。
- 是時候完成研究室活動了!別忘了,活動一開始將無法暫停。
挑戰情境
您剛以「初階資料工程師」的職銜進入公司,目前已協助多個團隊建立及管理 Dataplex 資產。
公司預期您具備執行這些工作所需的技能與知識。
您的挑戰
您必須協助新建立的開發團隊,使用 Dataplex 建構新的資料網格。具體而言,您需要建立含有多個可用區和資產的 Dataplex 湖泊,還需要在新湖泊中標記資產,並評估資產的資料品質。您收到了下列工作與相應要求:
- 建立含有兩個可用區及兩項資產的 Dataplex 湖泊。
- 建立標記範本並套用至整個可用區,將可用區標記為受保護資料。
- 將 Dataplex IAM 角色指派給其他使用者。
- 建立資料品質規格檔案並上傳至 Cloud Storage。
- 在 Dataplex 中定義並執行資料品質工作。
您必須符合下列標準:
- 確認已成功啟用所有必要 API,例如 Dataplex、Data Catalog 和 Dataproc。
- 如未特別指定,所有資源均須建立於
區域。
以下詳細說明各項工作,祝您好運!
工作 1:建立含有兩個可用區及兩項資產的 Dataplex 湖泊
本研究室已預先建立步驟 2 要使用的 Cloud Storage 值區和 BigQuery 資料集。
- 建立含有兩個區域性可用區的 Dataplex 湖泊,並命名為銷售湖泊:
- 名為原始客戶可用區的原始可用區
- 名為收錄客戶可用區的收錄可用區
- 將預先建立的資產附加至每個可用區:
- 將名為
-customer-online-sessions 的 Cloud Storage 值區做為新資產,命名為客戶參與度並附加至原始可用區。 - 將名為
.customer_orders 的 BigQuery 資料集做為新資產,命名為客戶訂單並附加至收錄可用區。
點選「Check my progress」,確認目標已達成。
工作 2:建立代碼範本並套用至可用區
- 建立名為受保護客戶資料範本的公開標記範本,在當中加入兩個列舉欄位:
- 第一個欄位名稱為原始資料旗標,包含兩個值:
Yes
及No
。 - 第二個欄位名稱為受保護聯絡資訊旗標,包含兩個值:
Yes
及No
。
- 使用這個範本標記原始客戶可用區,並將兩個旗標的值設為
Yes
。
點選「Check my progress」,確認目標已達成。
工作 3:將 Dataplex IAM 角色指派給其他使用者
- 運用最低權限原則,將適當的 Dataplex IAM 角色指派給使用者 2 (
),讓使用者可將新的 Cloud Storage 檔案,上傳至名為客戶參與度的 Dataplex 資產。
點選「Check my progress」,確認目標已達成。
工作 4:建立資料品質規格檔案並上傳至 Cloud Storage
本研究室已預先建立步驟 2 要使用的 Cloud Storage 值區。
- 建立含有下列規格的資料品質規格檔案,並命名為 dq-customer-orders.yaml:
- NOT NULL 規則已套用至 customer_orders.ordered_items 資料表中的 user_id 欄
- NOT NULL 規則已套用至 customer_orders.ordered_items 資料表中的 order_id 欄
- 將檔案上傳到名為
-dq-config 的 Cloud Storage 值區。
點選「Check my progress」,確認目標已達成。
工作 5:在 Dataplex 中定義並執行資料品質工作
本研究室已預先建立步驟 1 要使用的 BigQuery 資料集。
- 使用含有下列規格的 dq-customer-orders.yaml 檔案,定義資料品質工作:
屬性 | 值 |
---|---|
資料品質工作名稱 | 客戶訂單資料品質工作 |
結果的 BigQuery 目的地資料表 | |
使用者服務帳戶 | Compute Engine 預設服務帳戶 |
- 立即執行資料品質工作。
點選「Check my progress」,確認目標已達成。
恭喜!
取得下一枚技能徽章
這個自修研究室屬於「Build a Data Mesh with Dataplex」技能徽章任務的一部分。完成這項技能徽章任務即可獲得上方的徽章,表彰您的成就。您可以在履歷表和社群平台中分享徽章,並使用 #GoogleCloudBadge 公開成就。
Google Cloud 教育訓練與認證
協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。
使用手冊上次更新日期:2023 年 7 月 4 日
研究室上次測試日期:2023 年 7 月 4 日
Copyright 2024 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。