
Before you begin
- Labs create a Google Cloud project and resources for a fixed time
- Labs have a time limit and no pause feature. If you end the lab, you'll have to restart from the beginning.
- On the top left of your screen, click Start lab to begin
Create a BigQuery dataset
/ 20
Create a model to predict visitor transaction
/ 20
Evaluate the model
/ 20
Predict purchases per country
/ 20
Predict purchases per user
/ 20
BigQuery ML 可讓使用者運用 SQL 查詢,在 BigQuery 建立並執行機器學習模型,目標是讓 SQL 使用者能透過現有的工具建立模型,而且不必移動資料,可加快開發速度,使所有人都能輕鬆使用機器學習技術。
BigQuery 已載入電子商務資料集,其中包含數百萬筆 Google Analytics 的 Google 商品網路商店記錄。在本實驗室中,您將使用這些資料建立模型,預測訪客是否會完成交易。
本實驗室的內容包括:
為最大化學習效益,建議先具備 SQL 或 BigQuery 的基礎知識。
請詳閱以下操作說明。實驗室活動會計時,且中途無法暫停。點選「Start Lab」後就會開始計時,顯示可使用 Google Cloud 資源的時間。
您將在真正的雲端環境完成實作實驗室活動,而不是模擬或示範環境。為此,我們會提供新的暫時憑證,供您在實驗室活動期間登入及存取 Google Cloud。
為了順利完成這個實驗室,請先確認:
點選「Start Lab」按鈕。如果實驗室會產生費用,畫面上會出現選擇付款方式的對話方塊。左側的「Lab Details」窗格會顯示下列項目:
點選「Open Google Cloud console」;如果使用 Chrome 瀏覽器,也能按一下滑鼠右鍵,選取「在無痕視窗中開啟連結」。
接著,實驗室會啟動相關資源,並開啟另一個分頁,顯示「登入」頁面。
提示:您可以在不同的視窗中並排開啟分頁。
如有必要,請將下方的 Username 貼到「登入」對話方塊。
您也可以在「Lab Details」窗格找到 Username。
點選「下一步」。
複製下方的 Password,並貼到「歡迎使用」對話方塊。
您也可以在「Lab Details」窗格找到 Password。
點選「下一步」。
按過後續的所有頁面:
Google Cloud 控制台稍後會在這個分頁開啟。
接著,畫面中會顯示「歡迎使用 Cloud 控制台中的 BigQuery」訊息方塊,當中會列出快速入門導覽課程指南的連結和版本資訊。
BigQuery 控制台會隨即開啟。
bqml_lab
,然後點選「建立資料集」。點選「Check my progress」,確認工作已完成。如果順利完成,就會看見評估分數。
接著進行您的工作!
這裡使用以下條件判斷訪客是否會完成交易:訪客使用的作業系統、該裝置是否為行動裝置、訪客的國家/地區,以及網頁瀏覽次數。
在本例中,bqml_lab
是資料集名稱,而 sample_model
則是模型名稱。指定的模型類型是二元邏輯迴歸。在本例中,label
是您調整的依據。
input_label_cols
的替代方法。
訓練資料僅限於從 2016 年 8 月 1 日到 2017 年 6 月 30 日收集的資料,以保留最後一個月的資料來用於「預測」。為了節省時間,進一步將資料點限制為 100,000 個。
執行 CREATE MODEL
指令會建立非同步執行的查詢工作,這樣就能關閉或重新整理 BigQuery UI 視窗等。
點選「Check my progress」,確認工作已完成。如果順利完成,就會看見評估分數。
如果感興趣,您可以擴充 bqml_lab
資料集,然後點選 UI 中的 sample_model
模型來取得模型資訊。在「詳細資料」分頁下,您會找到一些基本的模型資訊,以及用於產生模型的訓練選項。在「訓練」下,您會看到資料表或圖表,顯示何者視「檢視方式」設定而定:
如果和線性迴歸模型一併使用,上述查詢會傳回下列資料欄:
mean_absolute_error
、mean_squared_error
、mean_squared_log_error
median_absolute_error
、r2_score
、explained_variance
如果和邏輯迴歸模型一併使用,上述查詢會傳回下列資料欄:
precision
、recall
accuracy
、f1_score
log_loss
、roc_auc
請參閱「機器學習詞彙表」或進行 Google 搜尋,瞭解這些指標的計算方式和代表的意義。
您會發現查詢中的 SELECT
和 FROM
部分和訓練時相同。WHERE
部分會反映時間範圍內的變化,而 FROM
部分則顯示您正在呼叫 ml.EVALUATE
。
您會看見類似下方的資料表:
點選「Check my progress」,確認工作已完成。如果順利完成,就會看見評估分數。
透過這項查詢,您將嘗試預測各國家/地區訪客的交易量、排序結果,並選出購買量前 10 多的國家/地區:
這項查詢與前一部分所示的評估查詢非常類似。您這次使用 ml.PREDICT
來取代 ml.EVALUATE
,且查詢的 BigQuery ML 部分是用標準 SQL 指令包裹。在本實驗室中,您感興趣的是國家/地區與各國家/地區的總購買量,所以選擇使用 SELECT
、GROUP BY
和 ORDER BY
。LIMIT
用來確保只會得到購買量前 10 多的結果。
您會看見類似下方的資料表:
點選「Check my progress」,確認工作已完成。如果順利完成,就會看見評估分數。
我們再看另一個例子。這次,您將嘗試預測各訪客的交易量、排序結果,並選出交易量前 10 多的訪客:
您會看見類似下方的資料表:
點選「Check my progress」,確認工作已完成。如果順利完成,就會看見評估分數。
您可透過下列選擇題更清楚瞭解本實驗室的概念。盡力回答即可。
您使用 BigQuery ML 來建立及評估二元邏輯迴歸模型,並使用模型進行預測。
協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。
使用手冊上次更新日期:2024 年 2 月 22 日
實驗室上次測試日期:2024 年 2 月 22 日
Copyright 2025 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。
此内容目前不可用
一旦可用,我们会通过电子邮件告知您
太好了!
一旦可用,我们会通过电子邮件告知您
One lab at a time
Confirm to end all existing labs and start this one