检查点
Create a Vertex AI Notebook
/ 30
Clone the lab repository
/ 30
Create a BigQuery dataset
/ 30
Create a BQML model to predict user churn
/ 30
Evaluate BQML model
/ 30
Batch predict user churn
/ 30
将 BigQuery ML 客户流失分类器部署到 Vertex AI 以进行在线预测
GSP944
概览
在本实验中,您将训练、调优、评估、解释一个 BigQuery ML XGBoost 模型,并使用该模型执行批量预测和在线预测。您将使用来自真实移动应用“Flood it!”(Android 应用、iOS 应用)的 Google Analytics 4 数据集,来确定用户重新使用该应用的可能性。您将使用 BigQuery ML 模型执行批量预测,将模型导出并部署到Vertex AI,以便使用 Vertex Python SDK 进行在线预测。
借助 BigQuery ML,您可通过标准 SQL 查询在 BigQuery 中训练机器学习模型并使用这些模型进行批量推理,整个过程更加快速,因为您无需移动数据且代码行数更少。
Vertex AI 是 Google Cloud 的免费下一代机器学习统一开发平台。通过在 Vertex AI 上开发和部署 BigQuery ML 机器学习解决方案,您可以利用可扩缩的在线预测服务和 MLOps 工具重新训练和监控模型,从而显著提高开发效率、增强利用数据扩缩工作流和进行决策的能力,并缩短实现价值的时间。
注意:BQML 现更名为 BigQuery ML。
本实验参考了Churn prediction for game developers using Google Analytics 4 (GA4) and BigQuery ML(使用 Google Analytics 4 [GA4] 和 BigQuery ML 为游戏开发者提供用户流失预测),并对其进行了拓展。请阅读该博文及附带的教程,以便进一步了解此用例和 BigQuery ML。
在本实验中,您将进一步重点了解 Vertex AI 如何通过在线预测来扩展 BigQuery ML 的功能,使您不仅能够将客户流失预测结果整合到 Looker 信息中心等决策界面中,还能将在线预测直接整合到客户应用中,以支持实施有针对性的干预措施,比如提供定向激励等。
目标
在本实验中,您将学习如何完成以下操作:
- 在 BigQuery 中探索并预处理用于机器学习的 Google Analytics 4 数据样本。
- 训练 BigQuery ML XGBoost 分类器,以预测一款手游应用的用户流失情况。
- 使用 BigQuery ML 超参数调优功能对 BigQuery ML XGBoost 分类器进行调优。
- 评估 BigQuery ML XGBoost 分类器的性能。
- 使用 BigQuery ML Explainable AI 全局特征归因来解释您的 XGBoost 模型。
- 使用您的 BigQuery ML XGBoost 模型执行批量预测。
- 将 BigQuery ML XGBoost 模型导出至 Google Cloud Storage 存储桶中。
- 将 BigQuery ML XGBoost 模型上传并部署到 Vertex AI 预测端点以进行在线预测。
设置和要求
点击“开始实验”按钮前的注意事项
请阅读以下说明。实验是计时的,并且您无法暂停实验。计时器在您点击开始实验后即开始计时,显示 Google Cloud 资源可供您使用多长时间。
此实操实验可让您在真实的云环境中开展实验活动,免受模拟或演示环境的局限。我们会为您提供新的临时凭据,让您可以在实验规定的时间内用来登录和访问 Google Cloud。
为完成此实验,您需要:
- 能够使用标准的互联网浏览器(建议使用 Chrome 浏览器)。
- 完成实验的时间 - 请注意,实验开始后无法暂停。
激活 Cloud Shell
Cloud Shell 是一种装有开发者工具的虚拟机。它提供了一个永久性的 5GB 主目录,并且在 Google Cloud 上运行。Cloud Shell 提供可用于访问您的 Google Cloud 资源的命令行工具。
- 点击 Google Cloud 控制台顶部的激活 Cloud Shell 。
如果您连接成功,即表示您已通过身份验证,且当前项目会被设为您的 PROJECT_ID 环境变量所指的项目。输出内容中有一行说明了此会话的 PROJECT_ID:
gcloud
是 Google Cloud 的命令行工具。它已预先安装在 Cloud Shell 上,且支持 Tab 自动补全功能。
- (可选)您可以通过此命令列出活跃账号名称:
-
点击授权。
-
现在,输出的内容应如下所示:
输出:
- (可选)您可以通过此命令列出项目 ID:
输出:
输出示例:
gcloud
, in Google Cloud, refer to the gcloud CLI overview guide.
任务 1. 启用 Google Cloud 服务
- 在 Cloud Shell 中,使用
gcloud
命令启用实验中要用到的服务:
任务 2. 部署 Vertex 笔记本实例
-
点击导航菜单 () > Vertex AI > Workbench。
-
在笔记本实例页面中,导航到用户管理的笔记本标签页并点击新建。
-
在自定义新建实例菜单中,点击环境并选择 TensorFlow 企业版 2.11 版本。
-
在新建实例对话框中,对于区域,选择
,对于可用区,选择 ,保留所有其他字段的默认选项,然后点击创建。
几分钟后,Vertex AI 控制台中将显示您的实例名称,名称后会显示打开 Jupyterlab
。
- 点击打开 JupyterLab。
您的笔记本现已设置完毕。
点击检查我的进度以验证是否完成了以下目标:
任务 3. 克隆实验代码库
接下来您需要将 training-data-analyst
笔记本克隆到您的 JupyterLab 实例。
- 在 JupyterLab 中,点击终端图标以打开新终端。
取消
。- 如需克隆
training-data-analyst
GitHub 代码库,请输入以下命令,然后按 Enter 键。
- 如需确认已克隆该代码库,请双击
training-data-analyst
目录,确认您能看到其内容。
点击检查我的进度以验证是否完成了以下目标:
前往实验笔记本
-
在笔记本中,前往 training-data-analyst > quests > vertex-ai > vertex-bqml,打开 lab_exercise.ipynb。
-
在笔记本中继续本实验,并通过点击屏幕顶部的运行 () 图标来运行每个单元。您也可以使用 Shift + Enter 来执行单元中的代码。
阅读相关说明并确保了解每个单元中发生的情况。在完成实验笔记本的过程中,请回来查看这些说明以完成评分练习。
任务 4. 创建 BigQuery 数据集
点击检查我的进度以验证是否完成了以下目标:
任务 5. 创建 BigQuery ML XGBoost 流失倾向模型
点击检查我的进度以验证是否完成了以下目标:
任务 6. 评估您的 BigQuery ML 模型
点击检查我的进度以验证是否完成了以下目标:
任务 7. 使用您的 BigQuery ML 模型执行用户流失批量预测
点击检查我的进度以验证是否完成了以下目标:
恭喜!
在本实验中,您训练、调优、解释了 BigQuery ML 用户流失模型,并将其部署到 Vertex AI 上,以执行具有重大业务影响的用户流失批量预测和在线预测,从而针对可能流失的用户采取干预措施,如游戏内奖励和提醒通知。
后续步骤/了解详情
如需详细了解 Vertex AI,请参阅 Vertex AI 文档。
Google Cloud 培训和认证
…可帮助您充分利用 Google Cloud 技术。我们的课程会讲解各项技能与最佳实践,可帮助您迅速上手使用并继续学习更深入的知识。我们提供从基础到高级的全方位培训,并有点播、直播和虚拟三种方式选择,让您可以按照自己的日程安排学习时间。各项认证可以帮助您核实并证明您在 Google Cloud 技术方面的技能与专业知识。
本手册的最后更新时间:2024 年 4 月 17 日
本实验的最后测试时间:2024 年 4 月 17 日
版权所有 2024 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名和产品名可能是其各自相关公司的商标。