700 以上のラボとコースにアクセス

Configuring Pod Autoscaling and NodePools

ラボ 1時間 universal_currency_alt クレジット: 5 show_chart 入門

info このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。

概要
目標
ラボの設定
タスク 1. ラボの GKE クラスタに接続してサンプルのワークロードをデプロイする
タスク 2. クラスタで自動スケーリングを構成する
タスク 3. ノードプールを管理する
ラボを終了する

700 以上のラボとコースにアクセス

概要

このラボでは、Google Kubernetes Engine（GKE）でアプリケーションを設定してから、HorizontalPodAutoscaler を使用してウェブアプリケーションを自動スケーリングします。その後、タイプの異なる複数のノードプールを操作し、taint と toleration を適用して基盤となるノードプールで Pod のスケジュールを制御します。

目標

このラボでは、次のタスクの実行方法について学びます。

自動スケーリングと HorizontalPodAutoscaler を構成する
ノードプールを追加し、Pod の反アフィニティを適用するためにノードに対して taint を構成する
Pod のマニフェストに toleration を追加して、Node taint の例外を構成する

ラボの設定

Qwiklabs にアクセスする

各ラボでは、新しい Google Cloud プロジェクトとリソースセットを一定時間無料で利用できます。

Qwiklabs にシークレットウィンドウでログインします。
ラボのアクセス時間（例: 1:15:00）に注意し、時間内に完了できるようにしてください。
一時停止機能はありません。必要な場合はやり直せますが、最初からになります。
準備ができたら、[ラボを開始] をクリックします。
ラボの認証情報（ユーザー名とパスワード）をメモしておきます。この情報は、Google Cloud Console にログインする際に使用します。
[Google Console を開く] をクリックします。
[別のアカウントを使用] をクリックし、このラボの認証情報をコピーしてプロンプトに貼り付けます。
他の認証情報を使用すると、エラーが発生したり、料金の請求が発生したりします。
利用規約に同意し、再設定用のリソースページをスキップします。

最初のログイン手順を完了すると、プロジェクトダッシュボードが表示されます。

Google Cloud Shell の有効化

Google Cloud Shell は、開発ツールと一緒に読み込まれる仮想マシンです。5 GB の永続ホームディレクトリが用意されており、Google Cloud で稼働します。

Google Cloud Shell を使用すると、コマンドラインで Google Cloud リソースにアクセスできます。

Google Cloud コンソールで、右上のツールバーにある [Cloud Shell をアクティブにする] ボタンをクリックします。
[続行] をクリックします。

環境がプロビジョニングされ、接続されるまでしばらく待ちます。接続した時点で認証が完了しており、プロジェクトに各自のプロジェクト ID が設定されます。次に例を示します。

gcloud は Google Cloud のコマンドラインツールです。このツールは、Cloud Shell にプリインストールされており、タブ補完がサポートされています。

次のコマンドを使用すると、有効なアカウント名を一覧表示できます。

gcloud auth list

出力:

Credentialed accounts: - @.com (active)

出力例:

Credentialed accounts: - google1623327_student@qwiklabs.net

次のコマンドを使用すると、プロジェクト ID を一覧表示できます。

gcloud config list project

出力:

[core] project =

出力例:

[core] project = qwiklabs-gcp-44776a13dea667a6

注: gcloud ドキュメントの全文については、 gcloud CLI の概要ガイドをご覧ください。

タスク 1. ラボの GKE クラスタに接続してサンプルのワークロードをデプロイする

このタスクでは、ラボの GKE クラスタに接続し、クラスタ内の一連の Pod に関する Deployment マニフェストを作成します。

ラボの GKE クラスタに接続する

Cloud Shell で次のコマンドを入力して、ゾーンとクラスタ名の環境変数を設定します。

export my_zone={{{project_0.default_zone|ZONE}}} export my_cluster=standard-cluster-1

kubectl コマンドラインツールのタブ補完を構成します。

source <(kubectl completion bash)

kubectl がクラスタにアクセスできるよう構成します。

gcloud container clusters get-credentials $my_cluster --zone $my_zone

GKE クラスタにサンプルウェブアプリケーションをデプロイする

すでに作成されている web.yaml Deployment ファイルを使用して、サンプルアプリケーションをクラスタにデプロイします。

apiVersion: apps/v1 kind: Deployment metadata: name: web spec: replicas: 1 selector: matchLabels: run: web template: metadata: labels: run: web spec: containers: - image: gcr.io/google-samples/hello-app:1.0 name: web ports: - containerPort: 8080 protocol: TCP resources: # You must specify requests for CPU to autoscale # based on CPU utilization requests: cpu: "250m"

このマニフェストは、HTTP サーバーのポート 8080 でリッスンするサンプルウェブアプリケーションコンテナのイメージを使用して、Deployment を作成します。

Cloud Shell に次のコマンドを入力して、ラボの Cloud Shell にリポジトリのクローンを作成します。

git clone https://github.com/GoogleCloudPlatform/training-data-analyst

作業ディレクトリへのショートカットとしてソフトリンクを作成します。

ln -s ~/training-data-analyst/courses/ak8s/v1.1 ~/ak8s

このラボのサンプルファイルが含まれているディレクトリに移動します。

cd ~/ak8s/Autoscaling/

次のコマンドを実行して、このファイルから Deployment を作成します。

kubectl create -f web.yaml --save-config

web Deployment に対しポート 8080 を使用する、NodePort タイプの Service リソースを作成します。

kubectl expose deployment web --target-port=8080 --type=NodePort

Service が作成されてノードポートが割り当てられたことを確認します。

kubectl get service web

実際の IP アドレスとポート番号は、以下の出力例とは異なる場合があります。

出力:

NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE web NodePort 10.11.246.185 8080:32056/TCP 12s

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 GKE クラスタにサンプルウェブアプリケーションをデプロイする

タスク 2. クラスタで自動スケーリングを構成する

このタスクでは、先ほどデプロイしたサンプルアプリケーションを自動スケーリングするようにクラスタを構成します。

自動スケーリングを構成する

Deployment のリストを取得して、サンプルウェブアプリケーションがまだ実行中かどうか確認します。

kubectl get deployment

出力は次のようになります。

出力:

NAME READY UP-TO-DATE AVAILABLE AGE web 1/1 1 1 5m48s

アプリケーションの web Deployment が表示されない場合は、タスク 1 に戻ってクラスタに再デプロイします。

次のコマンドを実行して、サンプルアプリケーションを自動スケーリングするように構成します（最大レプリカ数を 4、最小レプリカ数を 1、CPU 使用率の目標を 1% に設定します）。

kubectl autoscale deployment web --max 4 --min 1 --cpu-percent 1

kubectl autoscale を使用するときは、アプリケーションの最大レプリカ数と最小レプリカ数、CPU 使用率の目標を指定します。

Deployment のリストを取得して、ウェブアプリケーションの Deployment がまだ 1 つだけ存在することを確認します。

kubectl get deployment

出力:

NAME READY UP-TO-DATE AVAILABLE AGE web 1/1 1 1 8m21s

HorizontalPodAutoscaler オブジェクトを調べる

前のタスクで使用した kubectl autoscale コマンドによって、HorizontalPodAutoscaler オブジェクトが作成されます。このオブジェクトは、指定したリソース（スケールターゲットと呼ばれます）を対象として、必要に応じてそのリソースをスケールします。

このオートスケーラーは、作成時に指定された平均 CPU 使用率と一致するように、スケールターゲットのレプリカ数を定期的に調整します。

HorizontalPodAutoscaler リソースのリストを取得するには、次のコマンドを実行します。

kubectl get hpa

出力は次のようになります。

出力:

NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE web Deployment/web 0%/1% 1 4 1 1m

HorizontalPodAutoscaler の構成を表形式で確認するには、次のコマンドを実行します。

kubectl describe horizontalpodautoscaler web

出力は次のようになります。

出力:

Name: web Namespace: default Labels: Annotations: CreationTimestamp: Tue, 08 Sep 2020... Reference: Deployment/web Metrics: ( current / target ) resource cpu on pods (as a percentage of request): 0% (0) / 1% Min replicas: 1 Max replicas: 4 Deployment pods: 1 current / 1 desired Conditions: Type Status Reason Message ---- ------ ------ ------- AbleToScale True ScaleDownStabilized recent recommendations [...] ScalingActive True ValidMetricFound the HPA was able to [...] ScalingLimited False DesiredWithinRange the desired count [...] Events:

HorizontalPodAutoscaler の構成を YAML 形式で表示するには、次のコマンドを実行します。

kubectl get horizontalpodautoscaler web -o yaml

出力は次のようになります。

出力:

apiVersion: autoscaling/v1 kind: HorizontalPodAutoscaler metadata: annotations: autoscaling.alpha.kubernetes.io/conditions: [...] autoscaling.alpha.kubernetes.io/current-metrics: [...] creationTimestamp: 2018-11-14T02:59:28Z name: web namespace: default resourceVersion: "14588" selfLink: /apis/autoscaling/v1/namespaces/[...] spec: maxReplicas: 4 minReplicas: 1 scaleTargetRef: apiVersion: apps/v1 kind: Deployment name: web targetCPUUtilizationPercentage: 1 status: currentCPUUtilizationPercentage: 0 currentReplicas: 1 desiredReplicas: 1

自動スケーリングの構成をテストする

ウェブアプリケーションが強制的にスケールアウトするように、アプリケーションに対して大きな負荷をかける必要があります。そこで、4 つのコンテナからなる Deployment を定義する構成ファイルを作成します。これらのコンテナは、サンプルのアプリケーションウェブサーバーに対して HTTP クエリの無限ループを実行します。

ウェブアプリケーションに負荷をかけるために、用意されている loadgen.yaml ファイルを使用して loadgen アプリケーションをデプロイします。

apiVersion: apps/v1 kind: Deployment metadata: name: loadgen spec: replicas: 4 selector: matchLabels: app: loadgen template: metadata: labels: app: loadgen spec: containers: - name: loadgen image: k8s.gcr.io/busybox args: - /bin/sh - -c - while true; do wget -q -O- http://web:8080; done

次のコマンドを実行して、このコンテナをデプロイします。

kubectl apply -f loadgen.yaml

このマニフェストをデプロイすると、web Pod のスケールが開始されます。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。 loadgen アプリケーションをデプロイする

Deployment のリストを取得して、負荷生成ツールが実行中であることを確認します。

kubectl get deployment

出力は次のようになります。

出力:

NAME READY UP-TO-DATE AVAILABLE AGE loadgen 4/4 4 4 26s web 1/1 1 1 14m

HorizontalPodAutoscaler を調べます。

kubectl get hpa

loadgen Pod がトラフィックの生成を開始すると、web Deployment の CPU 使用率が上昇し始めます。以下の出力例では、CPU しきい値が 1% であるのに対して、CPU 使用率の目標は 35% になっています。

出力:

NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE web Deployment/web 35%/1% 1 4 1 8m

数分後に、もう一度 HorizontalPodAutoscaler を調べます。

kubectl get hpa

オートスケーラーによって web Deployment のレプリカが 4 つに増えました。

出力:

NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE web Deployment/web 88%/1% 1 4 4 9m

ウェブアプリケーションに対する負荷を停止するには、loadgen Deployment のレプリカ数を 0 にスケールダウンします。

kubectl scale deployment loadgen --replicas 0

Deployment のリストを取得して、loadgen がスケールダウンされたことを確認します。

kubectl get deployment

loadgen Deployment のレプリカ数は 0 になっています。

出力:

NAME READY UP-TO-DATE AVAILABLE AGE loadgen 0/0 0 0 3m40s web 2/4 4 2 18m

注: Deployment のリストをもう一度表示するには、2～3 分待つ必要があります。

Deployment のリストを取得して、ウェブアプリケーションがスケールダウンされてレプリカ数が 1（オートスケーラーをデプロイしたときに構成したレプリカの最小値）になっていることを確認します。

kubectl get deployment

これで、ウェブアプリケーションの Deployment は 1 つになりました。

出力:

NAME READY UP-TO-DATE AVAILABLE AGE loadgen 0/0 0 0 12m web 1/1 1 1 14m

タスク 3. ノードプールを管理する

このタスクでは、プリエンプティブルインスタンスを使用して新しいノードプールを作成します。その後、web Deployment がプリエンプティブルノード上でのみ実行されるように制限します。

ノードプールを追加する

次のコマンドを実行し、3 つのプリエンプティブル VM インスタンスを使用して新しいノードプールをデプロイします。

gcloud container node-pools create "temp-pool-1" \ --cluster=$my_cluster --zone=$my_zone \ --num-nodes "2" --node-labels=temp=true --preemptible

プリエンプティブルインスタンスが使用できないというエラーが表示された場合は、--preemptible オプションを削除して先に進みます。

ノードのリストを取得して、新しいノードが準備できていることを確認します。

kubectl get nodes

これでノードが 4 つになりました。

実際の名前は以下の出力例と異なります。

出力:

NAME STATUS ROLES AGE VERSION gke-standard-cluster-1-default-pool...xc Ready 33m v1.19.10-gke.1600 gke-standard-cluster-1-default-pool...q8 Ready 33m v1.19.10-gke.1600 gke-standard-cluster-1-temp-pool-1-...vj Ready 32s v1.19.10-gke.1600 gke-standard-cluster-1-temp-pool-1-...xj Ready 37s v1.19.10-gke.1600

ノードプールの作成時に temp=true ラベルを設定したため、追加したすべてのノードにこのラベルが付いています。このラベルがあることで、追加したノードを簡単に見つけて構成できます。

temp=true ラベルが付いているノードだけを一覧表示するには、次のコマンドを実行します。

kubectl get nodes -l temp=true

追加した 2 つのノードだけが表示されます。

実際の名前は以下の出力例と異なります。

出力:

NAME STATUS ROLES AGE VERSION gke-standard-cluster-1-temp-pool-1-...vj Ready 3m26s v1.19.10-gke.1600 gke-standard-cluster-1-temp-pool-1-...xj Ready 3m31s v1.19.10-gke.1600

taint と toleration を適用してスケジュールを制御する

スケジューラが一時的なノードで Pod を実行しないように、一時的なプールの各ノードに taint を追加します。taint は、Pod が特定のノードで実行可能かどうかを決定する効果（NoExecute など）に関連付けられた Key-Value ペアとして実装されます。taint の Key-Value を容認するよう構成されているノードだけが、Pod を実行するようスケジュールされます。

次のコマンドを実行して、新しく作成した各ノードに taint を追加します。

temp=true ラベルを使用すると、この変更をすべての新しいノードに同時に適用できます。

kubectl taint node -l temp=true nodetype=preemptible:NoExecute

taint を追加したノード上でアプリケーションの Pod を実行するには、Deployment の構成に tolerations キーを追加する必要があります。

web.yaml ファイルを編集するには、次のコマンドを実行します。

nano web.yaml

テンプレートの spec セクションに次のキーを追加します。

tolerations: - key: "nodetype" operator: Equal value: "preemptible"

このファイルの spec セクションは、以下のようになります。

... spec: tolerations: - key: "nodetype" operator: Equal value: "preemptible" containers: - image: gcr.io/google-samples/hello-app:1.0 name: web ports: - containerPort: 8080 protocol: TCP resources: # You must specify requests for CPU to autoscale # based on CPU utilization requests: cpu: "250m"

web Deployment で強制的に新しいノードプールを使用するには、テンプレートの spec セクションに nodeSelector キーを追加します。これは、先ほど追加した toleration キーと並行して行います。

nodeSelector: temp: "true"

注: GKE は、ノードが属するノードプールの名前を含む cloud.google.com/gke-nodepool というカスタムラベルを各ノードに追加します。このキーを nodeSelector の一部に使用して、Pod を適切なノードにのみにデプロイすることもできます。

web.yaml Deployment 全体は、以下のようになります。

apiVersion: apps/v1 kind: Deployment metadata: name: web spec: replicas: 1 selector: matchLabels: run: web template: metadata: labels: run: web spec: tolerations: - key: "nodetype" operator: Equal value: "preemptible" nodeSelector: temp: "true" containers: - image: gcr.io/google-samples/hello-app:1.0 name: web ports: - containerPort: 8080 protocol: TCP resources: # You must specify requests for CPU to autoscale # based on CPU utilization requests: cpu: "250m"

CTRL+X キーを押した後、Y キーと Enter キーを押してファイルを保存し、nano エディタを終了します。
次のコマンドを実行して、この変更を適用します。

kubectl apply -f web.yaml

このファイルを適切に編集できない場合は、あらかじめ準備されている web-tolerations.yaml というサンプルファイルを代わりに使用してください。

[進行状況を確認] をクリックして、目標に沿って進んでいることを確認します。ノードプールを管理する

Pod のリストを取得します。

kubectl get pods

実際の名前は以下の出力例と異なる場合があります。

出力:

NAME READY STATUS RESTARTS AGE web-7cb566bccd-pkfst 1/1 Running 0 1m

変更を確認するには、次のコマンドを使用して実行中の web Pod を調べます。

kubectl describe pods -l run=web

nodetype=preemptible が一覧表示されている Tolerations セクションは、（省略された）出力の下部に表示されます。

出力:

Node-Selectors: temp=true Tolerations: node.kubernetes.io/not-ready:NoExecute op=Exists for 300s node.kubernetes.io/unreachable:NoExecute op=Exists for 300s nodetype=preemptible Events:

この出力から、新しいプリエンプティブルノードでは Pod が taint 値を容認することがわかります。つまり、新しいプリエンプティブルノードでの Pod の実行をスケジュールできます。

再度ウェブアプリケーションを強制的にスケールアウトするには、loadgen Deployment のレプリカ数を 4 に戻します。

kubectl scale deployment loadgen --replicas 4

直接スケールできるのはウェブアプリケーションだけですが、loadgen アプリケーションを使用することで、各アプリケーションに適用される taint、tolerations、nodeSelector の設定の違いが、スケジュール対象ノードの選択にどのような影響を及ぼすかを確認できます。

ワイド出力形式を使用して Pod のリストを取得し、Pod を実行しているノードを確認します。

kubectl get pods -o wide

このコマンドを実行すると、loadgen アプリケーションが default-pool ノードでのみ実行されており、ウェブアプリケーションが temp-pool-1 のプリエンプティブルノードでのみ実行されていることが確認できます。

taint を設定すると Pod はプリエンプティブルノードで実行されなくなるため、loadgen アプリケーションはデフォルトプールでのみ実行されます。tolerations を設定すると、ウェブアプリケーションはプリエンプティブルノードで実行されます。nodeSelector を設定すると、ウェブアプリケーション Pod が強制的にプリエンプティブルノードで実行されます。

NAME READY STATUS [...] NODE Loadgen-x0 1/1 Running [...] gke-xx-default-pool-y0 loadgen-x1 1/1 Running [...] gke-xx-default-pool-y2 loadgen-x3 1/1 Running [...] gke-xx-default-pool-y3 loadgen-x4 1/1 Running [...] gke-xx-default-pool-y4 web-x1 1/1 Running [...] gke-xx-temp-pool-1-z1 web-x2 1/1 Running [...] gke-xx-temp-pool-1-z2 web-x3 1/1 Running [...] gke-xx-temp-pool-1-z3 web-x4 1/1 Running [...] gke-xx-temp-pool-1-z4

ラボを終了する

ラボが完了したら、[ラボを終了] をクリックします。ラボで使用したリソースが Google Cloud Skills Boost から削除され、アカウントの情報も消去されます。

ラボの評価を求めるダイアログが表示されたら、星の数を選択してコメントを入力し、[送信] をクリックします。

星の数は、それぞれ次の評価を表します。

星 1 つ = 非常に不満
星 2 つ = 不満
星 3 つ = どちらともいえない
星 4 つ = 満足
星 5 つ = 非常に満足

フィードバックを送信しない場合は、ダイアログボックスを閉じてください。

フィードバックやご提案の送信、修正が必要な箇所をご報告いただく際は、[サポート] タブをご利用ください。

Configuring Pod Autoscaling and NodePools

Configuring Pod Autoscaling and NodePools

概要

目標

ラボの設定

Qwiklabs にアクセスする

Google Cloud Shell の有効化

タスク 1. ラボの GKE クラスタに接続してサンプルのワークロードをデプロイする

ラボの GKE クラスタに接続する

GKE クラスタにサンプル ウェブ アプリケーションをデプロイする

タスク 2. クラスタで自動スケーリングを構成する

自動スケーリングを構成する

HorizontalPodAutoscaler オブジェクトを調べる

自動スケーリングの構成をテストする

タスク 3. ノードプールを管理する

ノードプールを追加する

taint と toleration を適用してスケジュールを制御する

ラボを終了する

始める前に

シークレット ブラウジングを使用する

コンソールにログインする

シークレット ブラウジングを使用してラボを実行する

GKE クラスタにサンプルウェブアプリケーションをデプロイする

シークレットブラウジングを使用する

シークレットブラウジングを使用してラボを実行する