arrow_back

建立記錄指標並設定警告

登录 加入
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

建立記錄指標並設定警告

Lab 1 小时 30 分钟 universal_currency_alt 1 积分 show_chart 入门级
Test and share your knowledge with our community!
done
Get access to over 700 hands-on labs, skill badges, and courses

GSP091

Google Cloud 自修研究室標誌

總覽

記錄指標是以記錄項目為基礎的 Cloud Monitoring 指標。透過這些指標,您能夠辨別趨勢、從記錄中擷取數值,以及藉由建立事件指標,在特定記錄項目發生時收到警告。在 Cloud Monitoring 中,您可以使用系統和使用者定義的記錄指標,建立圖表和警告政策。

記錄指標介面分為兩個指標類型窗格:系統定義的指標和使用者定義的指標。

系統定義的記錄指標是由 Cloud Logging 提供給所有 Google Cloud 專案使用,計算依據是 Logging 擷取的記錄。如果記錄已明確從擷取作業排除,就不會包含在這些指標中。

使用者定義的記錄指標是由您建立,用於追蹤 Google Cloud 專案中的事件。舉例來說,您可以透過建立記錄指標,計算與指定篩選條件相符的記錄項目數量。

使用指標建立警告,就能根據記錄指標建立警告政策。

目標

本實驗室的學習內容包括:

  • 建立記錄式警告
  • 建立系統定義的記錄指標
  • 建立使用者定義的記錄指標
  • 為使用者定義的記錄指標建立警告

設定和需求

點選「Start Lab」按鈕前的須知事項

請詳閱以下操作說明。研究室活動會計時,而且中途無法暫停。點選「Start Lab」 後就會開始計時,讓您瞭解有多少時間可以使用 Google Cloud 資源。

您將在真正的雲端環境中完成實作研究室活動,而不是在模擬或示範環境。為達此目的,我們會提供新的暫時憑證,讓您用來在研究室活動期間登入及存取 Google Cloud。

如要完成這個研究室活動,請先確認:

  • 您可以使用標準的網際網路瀏覽器 (Chrome 瀏覽器為佳)。
注意:請使用無痕模式或私密瀏覽視窗執行此研究室。這可以防止個人帳戶和學生帳戶之間的衝突,避免個人帳戶產生額外費用。
  • 是時候完成研究室活動了!別忘了,活動一開始將無法暫停。
注意:如果您擁有個人 Google Cloud 帳戶或專案,請勿用於本研究室,以免產生額外費用。

如何開始研究室及登入 Google Cloud 控制台

  1. 按一下「Start Lab」(開始研究室) 按鈕。如果研究室會產生費用,畫面中會出現選擇付款方式的彈出式視窗。左側的「Lab Details」(研究室詳細資料) 面板會顯示下列項目:

    • 「Open Google Console」(開啟 Google 控制台) 按鈕
    • 剩餘時間
    • 必須在這個研究室中使用的暫時憑證
    • 完成這個研究室所需的其他資訊 (如有)
  2. 按一下「Open Google Console」(開啟 Google 控制台)。接著,研究室會啟動相關資源並開啟另一個分頁,當中會顯示「Sign in」(登入) 頁面。

    提示:您可以在不同的視窗中並排開啟分頁。

    注意事項:如果頁面中顯示了「Choose an account」(選擇帳戶) 對話方塊,請按一下「Use Another Account」(使用其他帳戶)
  3. 如有必要,請複製「Lab Details」(研究室詳細資料) 面板中的使用者名稱,然後貼到「Sign in」(登入) 對話方塊。按一下「Next」(下一步)

  4. 複製「Lab Details」(研究室詳細資料) 面板中的密碼,然後貼到「Welcome」(歡迎使用) 對話方塊。按一下「Next」(下一步)

    重要注意事項:請務必使用左側面板中的憑證,而非 Google Cloud 技能重點加強的憑證。 注意事項:如果使用自己的 Google Cloud 帳戶來進行這個研究室,可能會產生額外費用。
  5. 按過後續的所有頁面:

    • 接受條款及細則。
    • 由於這是臨時帳戶,請勿新增救援選項或雙重驗證機制。
    • 請勿申請免費試用。

Cloud 控制台稍後會在這個分頁中開啟。

注意事項:按一下畫面左上方的導覽選單,即可在選單中查看 Google Cloud 產品與服務的清單。「導覽選單」圖示

啟動 Cloud Shell

Cloud Shell 是搭載多項開發工具的虛擬機器,提供永久的 5 GB 主目錄,而且在 Google Cloud 中運作。Cloud Shell 提供指令列存取權,方便您使用 Google Cloud 資源。

  1. 點按 Google Cloud 控制台上方的「啟用 Cloud Shell」圖示 「啟動 Cloud Shell」圖示

連線完成即代表已通過驗證,且專案已設為您的 PROJECT_ID。輸出內容中有一行宣告本工作階段 PROJECT_ID 的文字:

您在本工作階段中的 Cloud Platform 專案會設為「YOUR_PROJECT_ID」

gcloud 是 Google Cloud 的指令列工具,已預先安裝於 Cloud Shell,並支援 Tab 鍵自動完成功能。

  1. (選用) 您可以執行下列指令來列出使用中的帳戶:
gcloud auth list
  1. 點按「授權」

  2. 輸出畫面應如下所示:

輸出內容:

ACTIVE: * ACCOUNT: student-01-xxxxxxxxxxxx@qwiklabs.net To set the active account, run: $ gcloud config set account `ACCOUNT`
  1. (選用) 您可以使用下列指令來列出專案 ID:
gcloud config list project

輸出內容:

[core] project = <project_ID>

輸出內容範例:

[core] project = qwiklabs-gcp-44776a13dea667a6 附註:如需有關 gcloud 的完整說明,請前往 Google Cloud 並參閱「gcloud CLI overview guide」(gcloud CLI 總覽指南)。

本實驗室開始時會建立虛擬機器。繼續之前,請先確認您開始實驗室的頁面中,有「實驗室進行中」的綠色燈號。

此外,請連線至 Google Kubernetes Engine 叢集,並確認虛擬機器已正確建立。

  1. gcloud 中設定可用區:
gcloud config set compute/zone us-east1-c
  1. 接著,授權 Cloud Shell。

  2. 設定專案 ID:

export PROJECT_ID=$(gcloud info --format='value(config.project)')
  1. 部署標準的 GKE 叢集,該叢集將提示您授權及啟用 GKE API。
gcloud container clusters create gmp-cluster --num-nodes=1 --zone us-east1-c

點按「Check my progress」,確認目標已達成。部署 GKE 叢集

工作 1:記錄式警告

每當記錄中出現特定訊息時,記錄式警告就會通知您。如要試用這項功能,可以設定記錄式警告在 VM 停止運作時通知您。

  1. 在 Cloud 控制台的搜尋列中,輸入「記錄檔探索工具」,然後點按「記錄檔探索工具」結果。

  2. 點按「顯示查詢」滑動列。

  3. 輸入下列參數來建立記錄式警告:

resource.type="gce_instance" protoPayload.methodName="v1.compute.instances.stop"
  1. 點按「建立快訊」連結。

  2. 新增下列參數,點按「下一個」即可前往下一個參數。

  • 快訊名稱:停止 VM
  • Choose logs to include in the alert:會自動填入您輸入的查詢
  • Set notification frequency and autoclose duration:通知間隔時間為 5 min,事件自動關閉期限為 1 hr。點按「下一個」

Who should be notified (optional):

  • 依序點按「通知管道」旁的下拉式箭頭,以及「Manage Notification Channels」。
  • 「通知管道」頁面會在新分頁中開啟。
  • 向下捲動頁面,在「電子郵件」部分點按「新增」。
  • 在「電子郵件地址」欄位中輸入您的個人電子郵件地址,並填寫「顯示名稱」。
  • 點按「儲存」
  • 完成後,返回原本的「記錄檔探索工具」分頁。
  • 重新整理「通知管道」頁面,然後選取您剛剛建立的管道。點按「確定」
  1. 點按「儲存」

點按「Check my progress」,確認目標已達成。建立記錄式警告

您現在要讓 VM 停止。

  1. 前往第二個「Cloud 控制台」分頁,並依序前往「導覽選單」>「Compute Engine」>「VM 執行個體」

  2. 勾選「instance1」旁邊的方塊後,按一下頁面頂端的「停止」,然後於彈出式視窗中再次點按「停止」。停止執行個體後,綠色勾號會變成灰色圓圈。

  3. 在「搜尋列」中,輸入「monitoring」,然後選擇「Monitoring」選項。

  4. 點按「快訊」分頁標籤。您會看到自己的警告已完成註冊。點按「快訊政策」下方的「See all policies」連結,即可看到清單中列出您建立的記錄式警告。

工作 2:記錄指標

透過記錄指標,您可以定義指標來追蹤記錄中的錯誤。如有類似問題和狀況發生,就能在使用者發現前主動因應。

  1. 在本實驗室一開始,您部署了標準 GKE 叢集。請執行以下指令,確認已建立 gmp-cluster 這個叢集:
gcloud container clusters list 如果叢集狀態顯示為 PROVISIONING,請稍候片刻再重新執行上方指令。重複此步驟直到狀態顯示為 RUNNING。
  1. 驗證叢集:
gcloud container clusters get-credentials gmp-cluster

您應該會看到以下訊息:

Fetching cluster endpoint and auth data. kubeconfig entry generated for gmp-cluster.
  1. 建立要使用的命名空間:
kubectl create ns gmp-test
  1. 現在,執行以下指令來部署簡易的應用程式,該應用程式會在 /metrics 端點發出指標:
kubectl -n gmp-test apply -f https://storage.googleapis.com/spls/gsp091/gmp_flask_deployment.yaml kubectl -n gmp-test apply -f https://storage.googleapis.com/spls/gsp091/gmp_flask_service.yaml
  1. 確認命名空間已準備就訊,可發出指標:
kubectl get services -n gmp-test

畫面應顯示如下:

NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE hello LoadBalancer 10.0.12.114 34.83.91.157 80:32058/TCP 71s

點按「Check my progress」,確認目標已達成。部署可發出指標的簡易應用程式

  1. 重複執行指令,直到您看到「External-IP」中已填入位址資訊。

  2. 使用以下指令,確認 Python Flask 應用程式正在提供指標:

curl $(kubectl get services -n gmp-test -o jsonpath='{.items[*].status.loadBalancer.ingress[0].ip}')/metrics

畫面應顯示如下:

# HELP flask_exporter_info Multiprocess metric # TYPE flask_exporter_info gauge flask_exporter_info{version="0.18.5"} 1.0

工作 3:建立記錄指標

  1. 返回「記錄檔探索工具」

  2. 點按「建立指標」連結。

  3. 在「建立指標」頁面中,輸入以下資訊:

  • 指標類型:保留預設設定「計數器」
  • 記錄指標名稱:hello-app-error
  • 選取篩選條件:將「建立篩選器」中的內容更新為下列篩選條件:
severity=ERROR resource.labels.container_name="hello-app" textPayload: "ERROR: 404 Error page not found"
  1. 點按「建立指標」

點按「Check my progress」,確認目標已達成。 建立記錄指標

工作 4:建立指標警告

  1. 在「記錄」視窗的左側窗格中,選取「記錄指標」。接著在使用者定義的指標中,點按指標旁的直向三點圖示,並選取「運用指標建立快訊」

  2. 在「選取指標」下方,指標參數會自動填入。

  • 將「滾動週期」更新為「2 分鐘」
  • 接受其他預設設定。
  • 點按「下一步」
  1. 您必須設定「通知」,可以重複使用稍早在實驗室中建立的管道。

  2. 將警告政策命名為 log based metric alert

  3. 點按「建立政策」

點按「Check my progress」,確認目標已達成。建立指標警告

工作 5:產生一些錯誤

接下來要針對您建立的記錄指標,產生對應的錯誤,以觸發指標警告。

  1. 在 Cloud Shell 中執行以下指令,產生一些錯誤:
timeout 120 bash -c -- 'while true; do curl $(kubectl get services -n gmp-test -o jsonpath='{.items[*].status.loadBalancer.ingress[0].ip}')/error; sleep $((RANDOM % 4)) ; done'
  1. 返回「記錄檔探索工具」頁面,並前往左下方的「嚴重性」部分。點按「錯誤」嚴重性。您可以搜尋 404 Error page not found 錯誤。展開其中一個 404 錯誤訊息即可查看詳情。

  2. 返回「Monitoring」頁面,並點按「快訊」。您會看到自己建立的 2 個政策。

  3. 點按「快訊政策」連結後,您應該會在「事件」部分中看到這 2 個警告,點按任一事件即可查看詳細資料。

注意:記錄指標警告最終會自動關閉。如需更多時間進行調查,請再次執行錯誤指令碼,等待系統再次觸發警告。點按「Check my progress」,確認目標已達成。產生一些錯誤

恭喜!

恭喜!在本實驗室中,您建立了記錄式警告、系統定義的記錄指標、使用者定義的記錄指標,以及指標警告。您也產生一些錯誤來觸發警告。最後,您學會如何查看警告的事件和詳細資料。

後續步驟/瞭解詳情

  • 閱讀這篇網誌文章,瞭解如何搭配使用 BigQuery 和 Cloud Monitoring。
  • 閱讀這篇文章,瞭解如何管理警告政策。
  • 閱讀這篇文章,進一步瞭解如何為記錄指標建立警告政策。

Google Cloud 教育訓練與認證

協助您瞭解如何充分運用 Google Cloud 的技術。我們的課程會介紹專業技能和最佳做法,讓您可以快速掌握要領並持續進修。我們提供從基本到進階等級的訓練課程,並有隨選、線上和虛擬課程等選項,方便您抽空參加。認證可協助您驗證及證明自己在 Google Cloud 技術方面的技能和專業知識。

使用手冊上次更新日期:2024 年 1 月 31 日

實驗室上次測試日期:2023 年 8 月 7 日

Copyright 2024 Google LLC 保留所有權利。Google 和 Google 標誌是 Google LLC 的商標,其他公司和產品名稱則有可能是其關聯公司的商標。