正在加载…
未找到任何结果。

    03

    Gemini for Data Scientists and Analysts - 简体中文

    Quick tip: Review the prerequisites before you run the lab
    Use an Incognito or private browser window to run this lab. This prevents any conflicts between your personal account and the student account, which may cause extra charges incurred to your personal account.
    欢迎加入我们的社区,一起测试和分享您的知识!
    done
    学习 700 多个动手实验和课程并获得相关技能徽章

    在 Gemini 的协助下分析数据

    实验 1 小时 10 分钟 universal_currency_alt 5 个积分 show_chart 入门级
    info 此实验可能会提供 AI 工具来支持您学习。
    欢迎加入我们的社区,一起测试和分享您的知识!
    done
    学习 700 多个动手实验和课程并获得相关技能徽章

    概览

    在本实验中,您要把自己想象成一名数据分析师,将使用 Gemini 和 BigQuery 分析数据并预测产品销售情况,这是 Cymbal Superstore 概念验证项目的一部分。在这个项目中,您还需要确定 Gemini 是否能够帮助分析师生成新的 SQL 查询,以及是否能够完成查询和解释复杂的查询。

    实验中所用的数据基于 BigQuery 公共数据集,特别是 bigquery-public-data.thelook_ecommerce 数据集,其中包含电子商务和数字营销综合数据。

    本实验假定您熟悉结构化查询语言 (SQL) 和基本的数据分析任务。您不一定要了解 Google Cloud 产品。如果您刚开始接触 BigQuery,请参阅 BigQuery 快速入门

    注意:Duet AI 已更名为 Gemini,这是我们的新一代模型。此实验已更新,以反映此变化。在按照实验说明操作时,界面或文档中任何提到 Duet AI 的地方都应视为指的是 Gemini。 注意:作为一项尚处于早期发展阶段的技术,Gemini 可能会生成看似合理但实际上不正确的输出。我们建议您先验证 Gemini 的所有输出,然后再使用。如需了解详情,请参阅适用于 Google Cloud 的 Gemini 和 Responsible AI

    目标

    在本实验中,您将学习如何执行以下任务:

    • 使用 Gemini 回答有关 Google Cloud 数据分析产品和应用场景的问题。
    • 输入提示,让 Gemini 在 BigQuery 中解释并生成 SQL 查询。
    • 构建机器学习 (ML) 模型,预测未来周期。

    设置

    对于每个实验,您都会免费获得一个新的 Google Cloud 项目及一组资源,它们都有固定的使用时限。

    1. 点击开始实验按钮。如果该实验需要付费,系统会打开一个弹出式窗口供您选择付款方式。左侧是实验详细信息面板,其中包含以下各项:

      • 打开 Google Cloud 控制台按钮
      • 剩余时间
      • 进行该实验时必须使用的临时凭据
      • 帮助您逐步完成本实验所需的其他信息(如果需要)
    2. 点击打开 Google Cloud 控制台(如果您使用的是 Chrome 浏览器,请右键点击并选择在无痕式窗口中打开链接)。

      该实验会启动资源并打开另一个标签页,显示登录页面。

      提示:将这些标签页安排在不同的窗口中,并排显示。

      注意:如果您看见选择账号对话框,请点击使用其他账号
    3. 如有必要,请复制下方的用户名,然后将其粘贴到登录对话框中。

      {{{user_0.username | "<用户名>"}}}

      您也可以在实验详细信息面板中找到用户名

    4. 点击下一步

    5. 复制下面的密码,然后将其粘贴到欢迎对话框中。

      {{{user_0.password | "<密码>"}}}

      您也可以在实验详细信息面板中找到密码

    6. 点击下一步

      重要提示:您必须使用实验提供的凭据。请勿使用您的 Google Cloud 账号凭据。 注意:在本实验中使用您自己的 Google Cloud 账号可能会产生额外费用。
    7. 继续在后续页面中点击以完成相应操作:

      • 接受条款及条件。
      • 由于这是临时账号,请勿添加账号恢复选项或双重验证。
      • 请勿注册免费试用。

    片刻之后,系统会在此标签页中打开 Google Cloud 控制台。

    注意:如需查看列有 Google Cloud 产品和服务的菜单,请点击左上角的导航菜单

    激活 Cloud Shell

    Cloud Shell 是一种包含开发工具的虚拟机。它提供了一个 5 GB 的永久性主目录,并且在 Google Cloud 上运行。Cloud Shell 可让您通过命令行访问 Google Cloud 资源。gcloud 是 Google Cloud 的命令行工具。它会预先安装在 Cloud Shell 上,且支持 Tab 键自动补全功能。

    1. 在 Google Cloud Console 的导航窗格中,点击激活 Cloud Shell ()。

    2. 点击继续
      预配和连接到环境需要一些时间。若连接成功,也就表明您已通过身份验证,且相关项目的 ID 会被设为您的 PROJECT_ID。例如:

    命令示例

    • 列出有效的帐号名称:

    gcloud auth list

    (输出)

    Credentialed accounts: - <myaccount>@<mydomain>.com (active)

    (输出示例)

    Credentialed accounts: - google1623327_student@qwiklabs.net
    • 列出项目 ID:

    gcloud config list project

    (输出)

    [core] project = <project_ID>

    (输出示例)

    [core] project = qwiklabs-gcp-44776a13dea667a6

    任务 1. 配置环境和账号

    在此任务中,您需要配置环境、账号和用户,以便启用 Cloud AI Companion API 以使用 Gemini。

    1. 使用您的实验凭据登录 Google Cloud 控制台,并打开 Cloud Shell 终端窗口。

    2. 如需设置项目 ID 和区域环境变量,请在 Cloud Shell 中运行以下命令:

      PROJECT_ID=$(gcloud config get-value project) REGION={{{project_0.default_region|set at lab start}}} echo "PROJECT_ID=${PROJECT_ID}" echo "REGION=${REGION}"
    3. 如需将已登录的 Google 用户账号存储到环境变量中,请运行以下命令:

      USER=$(gcloud config get-value account 2> /dev/null) echo "USER=${USER}"
    4. 启用 Cloud AI Companion API 以便使用 Gemini:

      gcloud services enable cloudaicompanion.googleapis.com --project ${PROJECT_ID}
    5. 如需使用 Gemini,请为您的 Google Cloud Qwiklabs 用户账号授予必要的 IAM 角色:

      gcloud projects add-iam-policy-binding ${PROJECT_ID} --member user:${USER} --role=roles/cloudaicompanion.user gcloud projects add-iam-policy-binding ${PROJECT_ID} --member user:${USER} --role=roles/serviceusage.serviceUsageViewer

      添加这些角色后,用户即可开始使用 Gemini 助手。

    如需验证是否已完成以下目标,请点击检查我的进度 启用相关 API 并设置 IAM 角色。

    任务 2. 在 BigQuery 中创建数据集并启用 Gemini 功能

    在此任务中,您将在 BigQuery 中创建数据集并启用 Gemini 功能。

    创建数据集

    1. 在 Google Cloud 控制台中,依次选择导航菜单 () 和 BigQuery。如果出现提示,请点击完成

    2. 探索器面板中,针对 选择查看操作 (),然后选择创建数据集

      您可以创建数据集来存储数据库对象,包括表和模型。

    3. 创建数据集窗格中,输入以下信息:

      字段
      数据集 ID bqml_tutorial
      位置类型 选择多区域

      将其他字段保留默认值。

    4. 点击创建数据集

    在 BigQuery 中启用 Gemini 功能

    1. 如需在 BigQuery 中查看 Gemini 功能,请点击工具栏中的 Gemini ()。如果未显示,请刷新页面。

    2. Gemini in BigQuery SQL 编辑器列表中,选择以下所有选项:

      • 自动补全

      • 自动生成

      • 解释

    注意:若要在 BigQuery 中停用 Gemini 功能,请取消选择要停用的 Gemini 功能。

    如需验证是否已完成以下目标,请点击检查我的进度 创建数据集。

    任务 3. 使用 Gemini 分析数据

    Gemini 可帮助您发现和分析可用数据。

    在查询数据之前,您需要知道自己可以访问哪些数据。各个数据产品整理和存储数据的方式是不同的。如需获取帮助,您可以向 Gemini 发送自然语言语句(或称为提示),例如:“如何查看我可以在 BigQuery 中使用的数据集和表?”

    如果您想了解不同数据查询系统的特征,可以输入提示来向 Gemini 询问具体的产品信息,如下所示:

    • “如何开始使用 BigQuery?”

    • “使用 BigQuery 进行数据分析有什么好处?”

    • “BigQuery 如何处理查询的自动扩缩?”

    在此任务中,您将输入提示来让 Gemini 回答有关数据的问题。

    输入提示来让 Gemini 回答有关数据的问题

    1. 在 Google Cloud 控制台中,依次选择导航菜单 () 和 BigQuery

    2. 在 Google Cloud 控制台的工具栏中,点击打开 Gemini ()。

    3. 点击启用以启用 Gemini for Google Cloud API。

    4. Gemini 窗格中将显示“欢迎使用 Cloud 控制台中的 Gemini”。然后点击开始聊天

      注意:如果开始聊天按钮未启用,请刷新页面,然后再次打开 Gemini。
    5. 在 Gemini 窗格中,输入以下提示:

      How do I learn which datasets and tables are available to me in BigQuery?
    6. 点击发送提示 ()。

      Gemini 不会将您的提示或其回答用作训练模型的数据。如需了解详情,请参阅 Gemini for Google Cloud 如何使用您的数据

      Gemini 给出的回答可能类似于以下内容:

      There are a few ways to learn which datasets and tables are available to you in BigQuery. You can use the Google Cloud console to browse the public datasets that are available. You can use the bq command-line tool to list the datasets and tables in your project. You can make calls to the BigQuery REST API to get a list of the datasets and tables in your project.
    7. 如需选择重置聊天记录,请在 Gemini 窗格中点击重置聊天 ()。

    注意:聊天记录状态仅保留在内存中,在您切换到另一个工作区或关闭 Google Cloud 控制台时,这些内容将会丢失。

    任务 4. 输入提示,让 Gemini 解释在销售数据集中如何使用 SQL 查询

    Gemini 可以帮助您使用 SQL。例如,如果您使用其他人编写的 SQL 查询,Gemini in BigQuery 可以使用简明易懂的语言解释复杂的查询。此类解释有助于您了解查询语法、底层架构和业务情境。

    如需输入提示来让 Gemini 解释 SQL 查询示例,请按照以下步骤操作:

    1. 在 Google Cloud 控制台中,依次选择导航菜单 () 和 BigQuery

    2. 在“欢迎使用 BigQuery Studio!”下方,点击 SQL 查询,以创建新的 SQL 查询。

    3. 在查询编辑器中,粘贴您想让 Gemini 解释的查询。

      例如,您可能想了解销售数据集内数据表和查询之间的关系,可能还希望获得帮助来编写使用该数据集的查询。在以下查询示例中,您也许可以看懂使用了哪些表,但对于查询的其他部分,您可能需要花些时间仔细分析才能理解。

      SELECT u.id as user_id, u.first_name, u.last_name, avg(oi.sale_price) as avg_sale_price FROM `bigquery-public-data.thelook_ecommerce.users` as u JOIN `bigquery-public-data.thelook_ecommerce.order_items` as oi ON u.id = oi.user_id GROUP BY 1,2,3 ORDER BY avg_sale_price DESC LIMIT 10
    4. 选择想让 Gemini 解释的查询,然后右键点击该所选查询。在菜单中,点击解释当前选择

      SQL 解释即会显示在 Gemini 窗格中。

      如果使用上一步中的示例查询,Gemini 返回的解释可能类似于以下内容:

      The intent of this query is to find the top 10 users by average sale price. The query first joins the users and order_items tables on the user_id column. It then groups the results by user_id , first_name , and last_name, and calculates the average sale price for each group. The results are then ordered by average sale price in descending order, and the top 10 results are returned.

    如需验证是否已完成以下目标,请点击检查我的进度 输入提示,让 Gemini 解释在销售数据集中如何使用 SQL 查询。

    任务 5. 生成 SQL 查询,按天和产品对销售额进行分组

    您可以在 Gemini 中输入提示,让其根据您的数据架构生成 SQL 查询。即使您手头没有查询代码,对数据架构的了解有限,或者对 SQL 语法只有基本了解,Gemini 也可以推荐一个或多个 SQL 语句。

    在此任务中,您会生成一个查询,列出每天的热销产品。这类查询通常比较复杂,但您可以使用 Gemini 自动创建语句。然后,使用 thelook_ecommerce 数据集内的表,输入提示来让 Gemini 生成查询,以按订单商品和商品名称计算销售额。

    查看公共数据集中的“order_items”和“products”表

    1. 在 Google Cloud 控制台中,依次选择导航菜单 () 和 BigQuery

    2. 在导航菜单中,点击 BigQuery Studio

    3. 在“探索器”窗格中,点击 + 添加

    4. 在“添加”对话框中的“搜索数据源”字段内输入 public datasets

    5. Enter 键。列表中即会显示公共数据集。

    6. 点击公共数据集。您会看到 Marketplace 中的公共数据集列表。

    7. 搜索 thelook。“TheLook Ecommerce”公共数据集将显示在列表中。

    8. 点击 thelook Ecommerce 两次。

    9. 点击查看数据集

    10. 展开添加到“探索器”面板的 bigquery-public-data

    11. 向下滚动并找到 thelook_ecommerce,然后展开该数据集。您会看到 order_itemsproducts 表。

    12. 点击 order_items 表。该表的数据架构即会显示。

    13. 返回“探索器”面板。

    14. 点击 products 表。该表的数据架构即会显示。

      注意:先查看表架构,然后再根据 Gemini 中的提示运行查询,有助于避免出现错误和潜在幻觉。

    输入提示来生成查询

    1. 点击 打开一个新的未命名查询标签页。

    2. 在查询编辑器中,输入以下提示,然后按 ENTER 键。井号字符 (#) 用于提示 Gemini 生成 SQL 查询。

      # select the sum of sales by date, and product_id casted to day from order_items, joined with products. Include the product name in the results. Round the total_sales field to two decimal places and order results by total_sales descending.

      Gemini 建议的 SQL 查询可能类似于以下内容:如果您到任何错误,请重新运行提示,或者执行以下命令。

      # select the sum of sales by date, and product_id casted to day from order_items, joined with products. Include the product name in the results. Round the total_sales field to two decimal places and order results by total_sales descending. SELECT DATE(order_items.created_at) AS order_date, order_items.product_id, products.name AS product_name, ROUND(SUM(order_items.sale_price), 2) AS total_sales FROM `bigquery-public-data.thelook_ecommerce.order_items` AS order_items LEFT JOIN `bigquery-public-data.thelook_ecommerce.products` AS products ON order_items.product_id = products.id GROUP BY order_date, order_items.product_id, product_name ORDER BY total_sales DESC; 注意:Gemini 可能会根据您的提示推荐多个 SQL 查询语句。
    3. 若要接受建议的代码,请按 Tab 键,然后点击运行以执行 SQL 语句。您还可以滚动浏览建议的 SQL 语句,并接受语句中建议的具体字词。

    4. 查询结果窗格中,查看查询结果。

    如需验证是否已完成以下目标,请点击检查我的进度 生成 SQL 查询,按天和产品对销售额进行分组。

    任务 6. 构建预测模型并查看结果

    在此任务中,您将使用 BigQuery ML 构建一个预测模型,并输入 Gemini 提示来使用该模型查询数据。

    构建模型

    您可以使用以下示例查询,并将实际销售额作为模型的输入。该查询是用于创建 ML 模型的一部分代码。

    1. 若要创建预测 ML 模型,请在 BigQuery SQL 编辑器中运行以下 SQL 命令:

      CREATE MODEL bqml_tutorial.sales_forecasting_model OPTIONS(MODEL_TYPE='ARIMA_PLUS', time_series_timestamp_col='date_col', time_series_data_col='total_sales', time_series_id_col='product_id') AS SELECT sum(sale_price) as total_sales, DATE(created_at) as date_col, product_id FROM `bigquery-public-data.thelook_ecommerce.order_items` AS t1 INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2 ON t1.product_id = t2.id GROUP BY 2, 3;

    您可以借助 Gemini 来理解此查询

    注意:此查询大约需要 10 分钟才能完成。在模型运行期间,您还可以向 Gemini 提出一些问题,例如什么是 ARIMA_PLUS 模型类型?

    模型创建后,“结果”窗格中会显示类似于以下内容的消息:

    Successfully created model named sales_forecasting_model.

    输入提示,使用该模型查询数据

    1. 点击 打开一个新的未命名查询标签页。

    2. 在查询编辑器中,输入以下提示,然后按 ENTER 键。井号字符 (#) 用于提示 Gemini 生成 SQL 查询。

      # Use sales_forecasting_model from the bqml_tutorial dataset in my project to generate a forecast and return all the resulting data.

      Gemini 建议的 SQL 查询可能类似于以下内容:如果您到任何错误,请重新运行提示,或者执行以下命令。

      # Use sales_forecasting_model from the bqml_tutorial dataset in my project to generate a forecast and return all the resulting data. SELECT * FROM ML.FORECAST(MODEL `bqml_tutorial.sales_forecasting_model`) 注意:Gemini 可能会根据您的提示推荐多个 SQL 查询语句。
    3. 若要接受建议的代码,请按 Tab 键,然后点击运行以执行 SQL 语句。您还可以滚动浏览建议的 SQL 语句,并接受语句中建议的具体字词。

    4. 查询结果窗格中,查看查询结果。

    如需验证是否已完成以下目标,请点击检查我的进度 构建预测模型并查看结果。

    恭喜!

    在本实验中,您学习了如何执行以下任务:

    • 使用 Gemini 回答有关 Google Cloud 数据分析产品和应用场景的问题。
    • 输入提示,让 Gemini 在 BigQuery 中解释并生成 SQL 查询。
    • 构建机器学习 (ML) 模型,预测未来周期。

    可选读物

    现在,您已了解如何在 BigQuery 中使用 Gemini 分析数据,如果您想详细了解 Gemini,请参阅撰写更好的 Gemini for Google Cloud 提示

    结束实验

    完成实验后,请点击结束实验。Qwiklabs 会移除您使用过的资源并为您清理帐号。

    系统会提示您为实验体验评分。请选择相应的评分星级,输入评论,然后点击提交

    星级的含义如下:

    • 1 颗星 = 非常不满意
    • 2 颗星 = 不满意
    • 3 颗星 = 一般
    • 4 颗星 = 满意
    • 5 颗星 = 非常满意

    如果您不想提供反馈,可以关闭该对话框。

    如果要留言反馈、提出建议或做出更正,请使用支持标签页。

    版权所有 2024 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名称和产品名称可能是其各自相关公司的商标。

    上一步 下一步

    Before you begin

    1. Labs create a Google Cloud project and resources for a fixed time
    2. Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
    3. On the top left of your screen, click Start lab to begin

    此内容目前不可用

    一旦可用,我们会通过电子邮件告知您

    太好了!

    一旦可用,我们会通过电子邮件告知您

    One lab at a time

    Confirm to end all existing labs and start this one

    Use private browsing to run the lab

    Use an Incognito or private browser window to run this lab. This prevents any conflicts between your personal account and the Student account, which may cause extra charges incurred to your personal account.
    预览