检查点
Create a Vertex AI Notebook
/ 30
Clone the lab repository
/ 30
Create a BigQuery dataset
/ 30
Create a BQML model to predict user churn
/ 30
Evaluate BQML model
/ 30
Batch predict user churn
/ 30
在 Vertex AI 中部署用於線上預測的 BigQuery ML 客戶流失分類器
GSP944
總覽
在本實驗室中,我們將講解如何利用 BigQuery ML XGBoost 模型進行訓練、調整、評估及解讀,並產生批次及線上預測結果。您將利用實際行動應用程式「Flood it!」(Android 應用程式;iOS 應用程式) 中的 Google Analytics 4 資料集,判定使用者回訪應用程式的機率。此外,您也會運用 BigQuery ML 模型產生批次預測結果,並且使用 Vertex Python SDK,將該模型匯出並部署至 Vertex AI,以利線上預測。
BigQuery ML 可讓您使用標準 SQL 查詢,在 BigQuery 中借助機器學習模型訓練並執行批次推論,這樣不但能減少程式碼行數,也無需移動資料。
Vertex AI 是 Google Cloud 隨附的新一代整合式平台,適用於機器學習開發作業。只要在 Vertex AI 上開發和部署 BigQuery ML 機器學習解決方案,即可採用可擴充的線上預測服務和 MLOps 工具,重新訓練及監控模型,不僅可大幅提升開發效率,還能調度工作流程資源、依據資料做決策,並加速創造價值。
注意:BQML 現稱為 BigQuery ML。
本實驗室內容取材自「Churn prediction for game developers using Google Analytics 4 (GA4) and BigQuery ML (遊戲開發人員使用 Google Analytics 4 (GA4) 和 BigQuery ML 預測流失情形)」,並由此延伸。請參閱網誌文章和隨附的教學課程,進一步瞭解這類用途和 BigQuery ML。
本實驗室會進一步探討,並著重於 Vertex AI 如何藉由線上預測,讓 BigQuery ML 功能更加完善。如此一來,您就能在 Looker 資訊主頁這類決策 UI 中整合客戶流失預測結果,還可直接將線上預測結果導入客戶應用程式,提升鎖定獎勵等目標式干預策略的成效。
目標
本實驗室的內容包括:
- 在 BigQuery 中探索和預先處理用於機器學習的 Google Analytics 4 資料樣本。
- 訓練 BigQuery ML XGBoost 分類器,預測手遊應用程式的使用者流失率。
- 使用 BigQuery ML 超參數微調功能,調整 BigQuery ML XGBoost 分類器。
- 評估 BigQuery ML XGBoost 分類器的成效。
- 使用 BigQuery ML Explainable AI 全域特徵歸因功能,解讀 XGBoost 模型。
- 使用 BigQuery ML XGBoost 模型,產生批次預測結果。
- 將 BigQuery ML XGBoost 模型匯出至 Google Cloud Storage bucket。
- 將 BigQuery ML XGBoost 模型上傳及部署至 Vertex AI Prediction 端點,以利線上預測。
設定和需求
點選「Start Lab」按鈕前的須知事項
請詳閱以下操作說明。研究室活動會計時,而且中途無法暫停。點選「Start Lab」 後就會開始計時,讓您瞭解有多少時間可以使用 Google Cloud 資源。
您將在真正的雲端環境中完成實作研究室活動,而不是在模擬或示範環境。為達此目的,我們會提供新的暫時憑證,讓您用來在研究室活動期間登入及存取 Google Cloud。
如要完成這個研究室活動,請先確認:
- 您可以使用標準的網際網路瀏覽器 (Chrome 瀏覽器為佳)。
- 是時候完成研究室活動了!別忘了,活動一開始將無法暫停。
啟動 Cloud Shell
Cloud Shell 是搭載多項開發工具的虛擬機器,提供永久的 5 GB 主目錄,而且在 Google Cloud 中運作。Cloud Shell 提供指令列存取權,方便您使用 Google Cloud 資源。
- 點按 Google Cloud 控制台上方的「啟用 Cloud Shell」圖示 。
連線完成即代表已通過驗證,且專案已設為您的 PROJECT_ID。輸出內容中有一行宣告本工作階段 PROJECT_ID 的文字:
gcloud
是 Google Cloud 的指令列工具,已預先安裝於 Cloud Shell,並支援 Tab 鍵自動完成功能。
- (選用) 您可以執行下列指令來列出使用中的帳戶:
-
點按「授權」。
-
輸出畫面應如下所示:
輸出內容:
- (選用) 您可以使用下列指令來列出專案 ID:
輸出內容:
輸出內容範例:
gcloud
的完整說明,請前往 Google Cloud 並參閱「gcloud CLI overview guide」(gcloud CLI 總覽指南)。
工作 1:啟用 Google Cloud 服務
- 前往 Cloud Shell,使用
gcloud
指令啟用本實驗室會用到的服務:
工作 2:部署 Vertex 筆記本執行個體
-
按一下「導覽選單」圖示 () >「Vertex AI」>「Workbench」。
-
在「Customize new instance」頁面,前往「User-Managed Notebooks」分頁,然後按一下「Create New」。
-
在「Customize new instance」選單中,選取「Environment」並選擇「TensorFlow Enterprise 2.11」版本。
-
在「New instance」對話方塊中,為「Region」選取「
」、「Zone」的部分則選取「 」,然後保留所有其他欄位預設的選項,並按一下「Create」。
幾分鐘後,Vertex AI 控制台將會顯示執行個體名稱,後面接著 Open Jupyterlab
。
- 點選「Open JupyterLab」。
這樣,筆記本就設定完成了。
點選「Check my progress」,確認目標已達成。
工作 3:複製實驗室存放區
接著,請在 JupyterLab 執行個體中複製 training-data-analyst
筆記本。
- 點選 JupyterLab 中的「Terminal」圖示,開啟新的終端機。
。- 為複製
training-data-analyst
GitHub 存放區,請輸入下列指令,然後按下 Enter 鍵:
- 如要確認是否已複製存放區,請按兩下
training-data-analyst
目錄,確定可以查看內容。
點選「Check my progress」,確認目標已達成。
前往實驗室筆記本
-
在筆記本中,依序點選「training-data-analyst」>「quests」>「vertex-ai」>「vertex-bqml」,然後開啟「lab_exercise.ipynb」。
-
在筆記本中繼續完成實驗室工作,然後點選畫面頂端的「執行」圖示 ,逐一執行儲存格。或者,您也可以按下 Shift + Enter 鍵,執行儲存格中的程式碼。
請閱讀相關說明,確定您瞭解每個儲存格的狀況。您可以隨著實驗室筆記本的工作進度,返回查看這些操作說明,以便完成練習,取得評分。
工作 4:建立 BigQuery 資料集
點選「Check my progress」,確認目標已達成。
工作 5:建立 BigQuery ML XGBoost 流失傾向模型。
點選「Check my progress」,確認目標已達成。
工作 6:評估 BigQuery ML 模型
點選「Check my progress」,確認目標已達成。
工作 7:使用 BigQuery ML 模型批次預測使用者流失情況
點選「Check my progress」,確認目標已達成。
恭喜!
在本實驗室中,您訓練、調整、解讀了 BigQuery ML 使用者流失模型,並將其部署到 Vertex AI 中,用來產生對業務極具影響力的批次和線上流失預測結果。有了這些結果,您就能對可能流失的客戶採取干預策略,例如提供遊戲獎勵和提醒通知。
後續步驟/瞭解詳情
請參閱 Vertex AI 說明文件,進一步瞭解 Vertex AI。
Google Cloud 教育訓練與認證
協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。
使用手冊上次更新日期:2024 年 4 月 17 日
實驗室上次測試日期:2024 年 4 月 17 日
Copyright 2024 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。