arrow_back

在 Gemini 協助下分析資料

登录 加入
Quick tip: Review the prerequisites before you run the lab
Use an Incognito or private browser window to run this lab. This prevents any conflicts between your personal account and the student account, which may cause extra charges incurred to your personal account.
欢迎加入我们的社区,一起测试和分享您的知识!
done
学习 700 多个动手实验和课程并获得相关技能徽章

在 Gemini 協助下分析資料

实验 1 小时 10 分钟 universal_currency_alt 5 积分 show_chart 入门级
info 此实验可能会提供 AI 工具来支持您学习。
欢迎加入我们的社区,一起测试和分享您的知识!
done
学习 700 多个动手实验和课程并获得相关技能徽章

總覽

在本實驗室中,您將擔任資料分析師,使用 Gemini 和 BigQuery 分析資料並預測產品銷售情形,做為 Cymbal Superstore 概念驗證專案的一環。在這項專案中,您也將判斷分析師能否使用 Gemini,協助產生新的 SQL 查詢、補全查詢和瞭解複雜查詢。

本實驗室使用的資料依據為 BigQuery 公開資料集,尤其是 bigquery-public-data.thelook_ecommerce 資料集,其中含有電子商務和數位行銷的合成資料。

本實驗室假設您熟悉 SQL (結構化查詢語言) 和基本的資料分析工作,但不必具備 Google Cloud 產品知識。如果您剛開始使用 BigQuery,請參考 BigQuery 快速入門導覽課程

注意:Duet AI 已更名為 Gemini,這是我們的新一代模型,本研究室的內容也已據此更新。參考研究室指示時,在使用者介面或說明文件中若有任何內容提及 Duet AI,請視為 Gemini。 注意:Gemini 仍處於早期技術階段,因此可能會輸出看似合理卻與事實不符的內容。使用輸出內容前,請先確認內容是否屬實。如要瞭解詳情,請參閱 Gemini 版 Google Cloud 和負責任的 AI 技術

目標

本實驗室將說明如何執行下列工作:

  • 讓 Gemini 解答您對 Google Cloud 資料分析產品和用途的疑問。
  • 透過提示讓 Gemini 提供說明,並在 BigQuery 中產生 SQL 查詢。
  • 建構機器學習 (ML) 模型,預測未來週期。

設定

每個實驗室都會提供新的 Google Cloud 專案和一組資源,讓您在時限內免費使用。

  1. 按一下「Start Lab」按鈕。如果研究室會產生費用,畫面中會出現選擇付款方式的彈出式視窗。左側的「Lab Details」窗格會顯示下列項目:

    • 「Open Google Cloud console」按鈕
    • 剩餘時間
    • 必須在這個研究室中使用的臨時憑證
    • 完成這個實驗室所需的其他資訊 (如有)
  2. 點選「Open Google Cloud console」;如果使用 Chrome 瀏覽器,也能按一下滑鼠右鍵,選取「在無痕視窗中開啟連結」

    接著,實驗室會啟動相關資源並開啟另一個分頁,當中顯示「登入」頁面。

    提示:您可以在不同的視窗中並排開啟分頁。

    注意:如果頁面中顯示「選擇帳戶」對話方塊,請點選「使用其他帳戶」
  3. 如有必要,請將下方的 Username 貼到「登入」對話方塊。

    {{{user_0.username | "Username"}}}

    您也可以在「Lab Details」窗格找到 Username

  4. 點選「下一步」

  5. 複製下方的 Password,並貼到「歡迎使用」對話方塊。

    {{{user_0.password | "Password"}}}

    您也可以在「Lab Details」窗格找到 Password

  6. 點選「下一步」

    重要事項:請務必使用實驗室提供的憑證,而非自己的 Google Cloud 帳戶憑證。 注意:如果使用自己的 Google Cloud 帳戶來進行這個實驗室,可能會產生額外費用。
  7. 按過後續的所有頁面:

    • 接受條款及細則。
    • 由於這是臨時帳戶,請勿新增救援選項或雙重驗證機制。
    • 請勿申請免費試用。

Google Cloud 控制台稍後會在這個分頁開啟。

注意:如要查看列出 Google Cloud 產品和服務的選單,請點選左上角的「導覽選單」

啟用 Cloud Shell

Cloud Shell 是含有多項開發工具的虛擬機器,提供永久的 5 GB 主目錄,並在 Google Cloud 中運作。Cloud Shell 可讓您透過指令列存取 Google Cloud 資源。gcloud 是 Google Cloud 的指令列工具,已預先安裝於 Cloud Shell,並支援 Tab 鍵完成功能。

  1. 在控制台的右上方,點按「啟用 Cloud Shell」按鈕

  2. 點按「繼續」
    請稍候片刻,等待系統完成佈建作業並連線至環境。連線建立後,即代表您已通過驗證,且專案已設為「PROJECT_ID」

指令範例

  • 列出目前使用的帳戶名稱:
gcloud auth list

輸出內容

Credentialed accounts: - <myaccount>@<mydomain>.com (active)

輸出內容範例

Credentialed accounts: - google1623327_student@qwiklabs.net
  • 列出專案 ID:
gcloud config list project

輸出內容

[core] project = <project_ID>

輸出內容範例

[core] project = qwiklabs-gcp-44776a13dea667a6 注意:如需 gcloud 的完整說明,請參閱 gcloud CLI 總覽指南

工作 1:設定環境和帳戶

在這項工作中,您將設定環境、帳戶和使用者,以便使用 Gemini 的 Cloud AI Companion API。

  1. 使用實驗室憑證登入 Google Cloud 控制台,然後開啟 Cloud Shell 終端機視窗。

  2. 執行下列指令,在 Cloud Shell 設定專案 ID 和區域環境變數:

    PROJECT_ID=$(gcloud config get-value project) REGION={{{project_0.default_region|set at lab start}}} echo "PROJECT_ID=${PROJECT_ID}" echo "REGION=${REGION}"
  3. 執行下列指令,將已登入的 Google 使用者帳戶儲存在環境變數中:

    USER=$(gcloud config get-value account 2> /dev/null) echo "USER=${USER}"
  4. 為 Gemini 啟用 Cloud AI Companion API:

    gcloud services enable cloudaicompanion.googleapis.com --project ${PROJECT_ID}
  5. 為您的 Google Cloud Qwiklabs 使用者帳戶授予必要的 IAM 角色,以便使用 Gemini:

    gcloud projects add-iam-policy-binding ${PROJECT_ID} --member user:${USER} --role=roles/cloudaicompanion.user gcloud projects add-iam-policy-binding ${PROJECT_ID} --member user:${USER} --role=roles/serviceusage.serviceUsageViewer

    新增角色後,使用者即可透過 Gemini 取得協助。

點按「Check my progress」,確認目標已達成。啟用相關 API 並設定 IAM 角色。

工作 2:建立資料集,並在 BigQuery 啟用 Gemini 功能

在這項工作中,您將建立資料集,並在 BigQuery 啟用 Gemini 功能。

建立資料集

  1. 前往 Google Cloud 控制台,依序選取「導覽選單」圖示 和「BigQuery」。如果出現提示訊息,請點按「完成」

  2. 在「Explorer」面板中找到 ,依序選取「查看動作」圖示 和「建立資料集」

    透過建立資料集,您可以儲存資料庫物件,包括資料表和模型。

  3. 在「建立資料集」窗格,輸入以下資訊:

    欄位
    資料集 ID bqml_tutorial
    位置類型 選取「多區域」

    其他欄位均保留預設值。

  4. 按一下「建立資料集」

在 BigQuery 啟用 Gemini 功能

  1. 如要在 BigQuery 查看 Gemini 功能,請點按工具列中的「Gemini」圖示 。如果找不到圖示,請重新整理頁面。

  2. 在「Gemini in BigQuery SQL editor」清單中,選取下列所有選項:

    • 自動補全

    • 自動產生

    • 說明

注意:如要在 BigQuery 停用 Gemini 功能,請取消選取要停用的 Gemini 功能。

點按「Check my progress」,確認目標已達成。建立資料集。

工作 3:使用 Gemini 分析資料

Gemini 可協助發掘及分析可用的資料。

在開始查詢資料前,您需要知道自己可存取哪些資料。每種資料產品整理和儲存資料的方式不盡相同。如需說明,可以向 Gemini 傳送自然語言陳述式 (即提示),例如「How do I view which datasets and tables are available to me in BigQuery?」(如何查看我可以在 BigQuery 使用哪些資料集和資料表?)。

如果想瞭解不同資料查詢系統的特性,可以使用類似如下的提示,要求 Gemini 提供特定產品資訊:

  • 「How do I get started with BigQuery?」(如何開始使用 BigQuery?)

  • 「What are the benefits of using BigQuery for data analysis?」(將 BigQuery 用於資料分析的好處為何?)

  • 「How does BigQuery handle auto-scaling for queries?」(BigQuery 如何針對查詢自動調整資源配置?)

在這項工作中,您將透過提示,讓 Gemini 解答資料相關疑問。

透過提示讓 Gemini 解答資料相關疑問

  1. 前往 Google Cloud 控制台,依序選取「導覽選單」圖示 和「BigQuery」

  2. 在 Google Cloud 控制台工具列,點按「開啟 Gemini」圖示

  3. 點按「啟用」來啟用 Gemini for Google Cloud API。

  4. Gemini 窗格會顯示「Welcome to Gemini in Cloud Console」訊息。按一下「開始對話」

    注意:如果「開始對話」按鈕未啟用,請重新整理頁面,並重新開啟 Gemini。
  5. 在「Gemini」窗格中輸入以下提示:

    How do I learn which datasets and tables are available to me in BigQuery?
  6. 點選「傳送提示」圖示

    我們不會將您的提示或 Gemini 的回覆用做模型訓練資料。詳情請參閱「Gemini for Google Cloud 如何使用您的資料」。

    Gemini 的回應會類似如下:

    There are a few ways to learn which datasets and tables are available to you in BigQuery. You can use the Google Cloud console to browse the public datasets that are available. You can use the bq command-line tool to list the datasets and tables in your project. You can make calls to the BigQuery REST API to get a list of the datasets and tables in your project.
  7. 點選「Gemini」窗格中的「重設對話」圖示 ,即可視需要重設對話記錄。

注意:對話記錄狀態只會保存在記憶體中,您切換至其他工作區或關閉 Google Cloud 控制台後,系統並不會保留這類資料。

工作 4:透過提示讓 Gemini 說明銷售資料集內的 SQL 查詢

Gemini 可協助您使用 SQL。舉例來說,如果您使用其他開發人員撰寫的 SQL 查詢,Gemini 可在 BigQuery 中以淺顯的用語說明複雜的查詢。有了這類說明,您就能瞭解查詢語法、底層結構定義和業務情境。

請按照下列步驟,透過提示讓 Gemini 說明範例 SQL 查詢:

  1. 前往 Google Cloud 控制台,依序選取「導覽選單」圖示 和「BigQuery」

  2. 在「歡迎使用 BigQuery Studio」字樣下方,點按「SQL 查詢」來建立新的 SQL 查詢。

  3. 在查詢編輯器中,貼上要讓 Gemini 說明的查詢。

    舉例來說,您可能想瞭解銷售資料集中的資料表和查詢有何關聯,並希望 Gemini 協助撰寫使用該資料集的查詢。在以下範例查詢中,您或許瞭解所使用的資料表,但可能需要一段時間,才能剖析和瞭解查詢的其他部分。

    SELECT u.id as user_id, u.first_name, u.last_name, avg(oi.sale_price) as avg_sale_price FROM `bigquery-public-data.thelook_ecommerce.users` as u JOIN `bigquery-public-data.thelook_ecommerce.order_items` as oi ON u.id = oi.user_id GROUP BY 1,2,3 ORDER BY avg_sale_price DESC LIMIT 10
  4. 選取要讓 Gemini 說明的查詢,然後按一下滑鼠右鍵,點按選單中的「說明目前選取的查詢」

    SQL 說明會顯示在「Gemini」窗格中。

    Gemini 會使用前一步驟中的範例查詢,提供類似如下的說明:

    The intent of this query is to find the top 10 users by average sale price. The query first joins the users and order_items tables on the user_id column. It then groups the results by user_id , first_name , and last_name, and calculates the average sale price for each group. The results are then ordered by average sale price in descending order, and the top 10 results are returned.

點按「Check my progress」,確認目標已達成。透過提示讓 Gemini 說明銷售資料集內的 SQL 查詢。

工作 5:產生 SQL 查詢,根據日期和產品分類銷售資料

您可以使用提示,要求 Gemini 根據資料結構定義產生 SQL 查詢。即使您沒有編寫程式碼、不太瞭解資料結構定義,或只具備 SQL 語法的基礎知識,Gemini 都可以建議一或多個 SQL 陳述式。

在這項工作中,您將產生查詢,列出每天的熱銷產品。這類查詢通常很複雜,但您可以使用 Gemini 自動建立陳述式。接著,您可以使用 thelook_ecommerce 資料集中的資料表,提示 Gemini 生成查詢,根據訂單產品和產品名稱計算銷售量。

查看公開資料集中的 order_items 和 products 資料表

  1. 前往 Google Cloud 控制台,依序選取「導覽選單」圖示 和「BigQuery」

  2. 從「導覽選單」點按「BigQuery Studio」

  3. 在「Explorer」窗格中,點按「+ 新增」

  4. 在「新增」對話方塊的「尋找資料來源」欄位中,輸入 public datasets

  5. 按下 Enter 鍵,畫面上隨即會列出公開資料集。

  6. 點按「公開資料集」後,就會看見 Marketplace 中的公開資料集清單。

  7. 搜尋 thelook,清單中將出現「TheLook Ecommerce」公開資料集。

  8. 按兩下「theLook Ecommerce」

  9. 點按「查看資料集」

  10. 展開「Explorer」面板中新增的「bigquery-public-data」

  11. 向下捲動並找出「thelook_ecommerce」,然後展開該資料集,當中列出「order_items」和「products」資料表。

  12. 點按「order_items」資料表,資料結構定義隨即顯示。

  13. 返回「Explorer」面板。

  14. 點按「products」資料表,資料結構定義隨即顯示。

    注意:依據 Gemini 提示執行查詢前,建議您先檢查資料表的結構定義,避免出現錯誤和幻覺。

使用提示生成查詢

  1. 點按 圖示,開啟新的「未命名的查詢」分頁。

  2. 在查詢編輯器中輸入下列提示,然後按下 Enter 鍵。井字 (#) 字元會提示 Gemini 生成 SQL。

    # select the sum of sales by date, and product_id casted to day from order_items, joined with products. Include the product name in the results. Round the total_sales field to two decimal places and order results by total_sales descending.

    Gemini 會提議如下的 SQL 查詢。如果發生錯誤,請重新執行提示或執行下列指令。

    # select the sum of sales by date, and product_id casted to day from order_items, joined with products. Include the product name in the results. Round the total_sales field to two decimal places and order results by total_sales descending. SELECT DATE(order_items.created_at) AS order_date, order_items.product_id, products.name AS product_name, ROUND(SUM(order_items.sale_price), 2) AS total_sales FROM `bigquery-public-data.thelook_ecommerce.order_items` AS order_items LEFT JOIN `bigquery-public-data.thelook_ecommerce.products` AS products ON order_items.product_id = products.id GROUP BY order_date, order_items.product_id, product_name ORDER BY total_sales DESC; 注意:Gemini 可能會針對您的提示,建議多個 SQL 陳述式。
  3. 如要接受建議的程式碼,請按下 Tab 鍵並點按「執行」,開始執行 SQL 陳述式。您也可以捲動瀏覽建議的 SQL,接受陳述式建議的特定字詞。

  4. 在「查詢結果」窗格,檢視查詢結果。

點按「Check my progress」,確認目標已達成。產生 SQL 查詢,根據日期和產品分類銷售資料。

工作 6:建構預測模型並查看結果

在這項工作中,您將使用 BigQuery ML 建構預測模型,並依據 Gemini 提示進行查詢。

建構模型

您將搭配使用下列範例查詢與實際銷售資料,讓系統將這些資料輸入至模型。查詢會用來建立機器學習模型。

  1. 如要建立機器學習預測模型,請在「BigQuery SQL 編輯器」執行下列 SQL:

    CREATE MODEL bqml_tutorial.sales_forecasting_model OPTIONS(MODEL_TYPE='ARIMA_PLUS', time_series_timestamp_col='date_col', time_series_data_col='total_sales', time_series_id_col='product_id') AS SELECT sum(sale_price) as total_sales, DATE(created_at) as date_col, product_id FROM `bigquery-public-data.thelook_ecommerce.order_items` AS t1 INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2 ON t1.product_id = t2.id GROUP BY 2, 3;

您可以透過 Gemini 瞭解這項查詢

注意:這項查詢約需 10 分鐘才能完成。模型執行期間,您也可以透過提示詢問 Gemini,例如「What is an ARIMA_PLUS model type?」(什麼是 ARIMA_PLUS 模型類型?)。

模型建立後,「結果」窗格會顯示訊息,類似如下:

Successfully created model named sales_forecasting_model.

使用提示查詢模型

  1. 點按 圖示,開啟新的「未命名的查詢」分頁。

  2. 在查詢編輯器中輸入下列提示,然後按下 Enter 鍵。井字 (#) 字元會提示 Gemini 生成 SQL。

    # Use sales_forecasting_model from the bqml_tutorial dataset in my project to generate a forecast and return all the resulting data.

    Gemini 會提議如下的 SQL 查詢。如果發生錯誤,請重新執行提示或執行下列指令。

    # Use sales_forecasting_model from the bqml_tutorial dataset in my project to generate a forecast and return all the resulting data. SELECT * FROM ML.FORECAST(MODEL `bqml_tutorial.sales_forecasting_model`) 注意:Gemini 可能會針對您的提示,建議多個 SQL 陳述式。
  3. 如要接受建議的程式碼,請按下 Tab 鍵並點按「執行」,開始執行 SQL 陳述式。您也可以捲動瀏覽建議的 SQL,接受陳述式建議的特定字詞。

  4. 在「查詢結果」窗格,檢視查詢結果。

點按「Check my progress」,確認目標已達成。建構預測模型並查看結果。

恭喜!

在本實驗室中,您學到了以下技能:

  • 讓 Gemini 解答您對 Google Cloud 資料分析產品和用途的疑問。
  • 透過提示讓 Gemini 提供說明,並在 BigQuery 中產生 SQL 查詢。
  • 建構機器學習 (ML) 模型,預測未來週期。

參考資料 (選用)

您已學到如何透過 Gemini 使用 BigQuery 分析資料,如果想進一步瞭解 Gemini,請參閱「在 Google Cloud 撰寫更有效的 Gemini 提示」。

關閉研究室

如果您已完成研究室,請按一下「End Lab」(關閉研究室)。Qwiklabs 會移除您已用的資源,並清除使用帳戶。

您可以為研究室的使用體驗評分。請選取合適的星級評等並提供意見,然後按一下「Submit」(提交)

星級評等代表您的滿意程度:

  • 1 星 = 非常不滿意
  • 2 星 = 不滿意
  • 3 星 = 普通
  • 4 星 = 滿意
  • 5 星 = 非常滿意

如果不想提供意見回饋,您可以直接關閉對話方塊。

如有任何想法、建議或指教,請透過「Support」(支援) 分頁提交。

Copyright 2024 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。

Before you begin

  1. Labs create a Google Cloud project and resources for a fixed time
  2. Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
  3. On the top left of your screen, click Start lab to begin

此内容目前不可用

一旦可用,我们会通过电子邮件告知您

太好了!

一旦可用,我们会通过电子邮件告知您

One lab at a time

Confirm to end all existing labs and start this one

Use private browsing to run the lab

Use an Incognito or private browser window to run this lab. This prevents any conflicts between your personal account and the Student account, which may cause extra charges incurred to your personal account.