检查点
Create a lake, zone, and asset in Dataplex
/ 30
Create a tag template
/ 30
Apply a tag template to Dataplex assets
/ 40
標記 Dataplex 資產
GSP1145
總覽
Dataplex 是智慧型資料架構,可讓機構集中探索、控管、監控及管理資料湖泊、資料倉儲和資料市集裡的資料,以便大規模分析數據。
Data Catalog 是 Dataplex 中可擴充的全代管中繼資料管理服務,能用於標記資料資產,以及搜尋您有權存取的資產。您可以運用標記,附加自訂中繼資料欄位到特定資料資產 (例如將某些資產標記為私密/機密或受保護的資料),輕鬆識別及擷取內容。此外,還能建立可重複使用的標記範本,快速指派相同標記給不同資料資產。
本研究室將說明如何透過 Dataplex 中的 Data Catalog,建立標記範本、將範本套用至 Dataplex 資產,並使用標記搜尋資產。
學習目標
- 啟用 Dataplex API 和 Data Catalog API
- 在 Dataplex 中建立湖泊、可用區和資產
- 建立標記範本
- 將標記範本套用至 Dataplex 資產
- 使用標記搜尋資產
設定和需求
點選「Start Lab」按鈕前的須知事項
請詳閱以下操作說明。研究室活動會計時,而且中途無法暫停。點選「Start Lab」 後就會開始計時,讓您瞭解有多少時間可以使用 Google Cloud 資源。
您將在真正的雲端環境中完成實作研究室活動,而不是在模擬或示範環境。為達此目的,我們會提供新的暫時憑證,讓您用來在研究室活動期間登入及存取 Google Cloud。
如要完成這個研究室活動,請先確認:
- 您可以使用標準的網際網路瀏覽器 (Chrome 瀏覽器為佳)。
- 是時候完成研究室活動了!別忘了,活動一開始將無法暫停。
如何開始研究室及登入 Google Cloud 控制台
-
按一下「Start Lab」(開始研究室) 按鈕。如果研究室會產生費用,畫面中會出現選擇付款方式的彈出式視窗。左側的「Lab Details」窗格會顯示下列項目:
- 「Open Google Cloud console」按鈕
- 剩餘時間
- 必須在這個研究室中使用的暫時憑證
- 完成這個實驗室所需的其他資訊 (如有)
-
點選「Open Google Cloud console」;如果使用 Chrome 瀏覽器,也能按一下滑鼠右鍵,然後選取「在無痕式視窗中開啟連結」。
接著,實驗室會啟動相關資源並開啟另一個分頁,當中顯示「登入」頁面。
提示:您可以在不同的視窗中並排開啟分頁。
注意:如果頁面中顯示「選擇帳戶」對話方塊,請點選「使用其他帳戶」。 -
如有必要,請將下方的 Username 貼到「登入」對話方塊。
{{{user_0.username | "Username"}}} 您也可以在「Lab Details」窗格找到 Username。
-
點選「下一步」。
-
複製下方的 Password,並貼到「歡迎使用」對話方塊。
{{{user_0.password | "Password"}}} 您也可以在「Lab Details」窗格找到 Password。
-
點選「下一步」。
重要事項:請務必使用實驗室提供的憑證,而非自己的 Google Cloud 帳戶憑證。 注意:如果使用自己的 Google Cloud 帳戶來進行這個實驗室,可能會產生額外費用。 -
按過後續的所有頁面:
- 接受條款及細則。
- 由於這是臨時帳戶,請勿新增救援選項或雙重驗證機制。
- 請勿申請免費試用。
Google Cloud 控制台稍後會在這個分頁開啟。
啟用 Dataplex API 和 Data Catalog API
-
在 Google Cloud 控制台頂端的搜尋列中,輸入 Cloud Dataplex API。
-
點選「Marketplace」下方的「Cloud Dataplex API」搜尋結果。
-
按一下「啟用」。
-
重複步驟 1 至 3,找出並啟用 Google Cloud Data Catalog API。
工作 1:建立湖泊、可用區和資產
在這項工作中,您將建立新的 Dataplex 湖泊來儲存消費者訂單資訊、在湖泊中新增收錄的可用區,然後附加預先建立的 BigQuery 資料集,做為可用區中的新資產。
建立湖泊
- 在 Google Cloud 控制台,按一下「導覽選單」圖示 ,依序前往「數據分析」>「Dataplex」。
如果出現「歡迎使用新版 Dataplex 服務」提示,請點選「關閉」。
-
在「管理湖泊」下方,點選「管理」。
-
按一下「建立湖泊」。
-
輸入必要資訊來建立新湖泊:
屬性 | 值 |
---|---|
顯示名稱 | Orders Lake |
ID | 保留預設值。 |
區域 |
保留其他預設值。
- 點選「建立」。
湖泊會在 3 分鐘內建立完成。
在湖泊中新增可用區
-
在「管理」分頁中,點選湖泊名稱。
-
點選「新增可用區」。
-
輸入必要資訊來建立新的可用區:
屬性 | 值 |
---|---|
顯示名稱 | Customer Curated Zone |
ID | 保留預設值。 |
類型 | 收錄的可用區 |
資料位置 | 區域性 |
保留其他預設值。
舉例來說,「探索功能設定」下方的「啟用中繼資料探索功能」選項預設為啟用,可讓已獲授權的使用者探索可用區中的資料。
- 點選「建立」。
可用區會在 2 分鐘內建立完成。
將資產附加至可用區
-
在「可用區」分頁中,點選可用區名稱。
-
在「資產」分頁中,按一下「新增資產」。
-
點選「新增資產」。
-
輸入必要資訊來附加新資產:
屬性 | 值 |
---|---|
類型 | BigQuery 資料集 |
顯示名稱 | Customer Details Dataset |
ID | 保留預設值。 |
資料集 |
|
保留其他預設值。
-
按一下「完成」。
-
點選「繼續」。
-
在「探索功能設定」下方,選取「繼承」來繼承可用區層級的探索功能設定,然後按一下「繼續」。
-
點選「提交」。
工作 2:建立標記範本
您需要先建立一或多個標記範本,才能開始標記資料。標記範本可以是公開或私人範本。當您建立新的標記範本時,預設的建議選項為建立公開範本。如果使用者具有資料資產的必要查看權限,即可檢視與該資產相關聯的所有公開標記。這有助於簡化探索內容的搜尋作業,同時一併遵循基礎資料已採用的資料存取權控管機制。
在這項工作中,您將建立公開標記範本,將 BigQuery 資料表的資料欄標記為受保護狀態。如果使用者有權存取基礎 BigQuery 資料表的資料欄,就能透過公開標記範本,查看資料欄套用的標記。
-
在左選單中,點選「管理目錄」下方的「標記範本」。
-
按一下「建立標記範本」。
-
輸入必要資訊來定義標記範本:
屬性 | 值 |
---|---|
範本顯示名稱 | Protected Data Template |
範本 ID | 保留預設值。 |
位置 | |
瀏覽權限 | 公開 |
- 按一下「新增欄位」,並輸入必要資訊,在範本中新增欄位:
屬性 | 值 |
---|---|
欄位顯示名稱 | Protected Data Flag |
欄位 ID | 保留預設值。 |
類型 | 列舉 |
-
在「列舉值」下方的「值 1」欄位中輸入
YES
。 -
點選「新增值」,並在「值 2」欄位中輸入
NO
。 -
按一下「完成」。
-
點選「建立」。
工作 3:將標記範本套用至 Dataplex 資產
建立標記範本後,即可使用範本,將標記套用到您有權存取的所需資料資產 (數量不限)。
在這項工作中,您會將先前建立的標記範本,套用到 BigQuery 資料表中要標記為受保護資料狀態的特定資料欄。
-
在左選單中,點選「探索」下方的「搜尋」。
-
在「篩選器」下方的「系統」部分,勾選「Dataplex」核取方塊。
-
按一下 customer_details 資料表。
如果找不到 customer_details 資料表,請先稍等幾分鐘再重新整理頁面,讓系統更新 Dataplex 資產清單。
-
按一下「附加標記」。
-
在「選擇要加上標記的內容」下方選單中,勾選下列資料欄的核取方塊:
- zip
- state
- last_name
- country
- latitude
- first_name
- city
- longitude
-
按一下「確定」。
-
在「選擇標記範本」下方選單中,選取「Protected Data Template」。
-
在「Protected Data Flag」下方選單中,選取「YES」。
-
按一下「儲存」。
工作 4:使用標記搜尋資產
標記資料資產後,即可使用 Dataplex 中的 Data Catalog,搜尋這些資產。
在這項工作中,您將搜尋已套用 Protected Data 標記範本的資產。
-
在左選單中,點選「探索」下方的「搜尋」。
-
在「篩選器」下方的「標記」部分,勾選「Protected Data Template」核取方塊。
-
按一下 customer_details 資料表。
-
點選「結構定義與資料欄標記」分頁標籤,查看指定資料欄的 Protected Data 標記。
恭喜!
您已透過 Dataplex 中的 Data Catalog,建立標記範本、將範本套用至 Dataplex 資產,並使用標記搜尋資產。
Google Cloud 教育訓練與認證
協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。
使用手冊上次更新日期:2023 年 9 月 20 日
研究室上次測試日期:2023 年 9 月 20 日
Copyright 2024 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。