- 概要
- スタートアップガイド
- ユーザガイド
-
リファレンス
-
ABEJA Platform CLI
- CONFIG COMMAND
- DATALAKE COMMAND
- DATASET COMMAND
- TRAINING COMMAND
-
MODEL COMMAND
- check-endpoint-image
- check-endpoint-json
- create-deployment
- create-endpoint
- create-model
- create-service
- create-trigger
- create-version
- delete-deployment
- delete-endpoint
- delete-model
- delete-service
- delete-version
- describe-deployments
- describe-endpoints
- describe-models
- describe-service-logs
- describe-services
- describe-versions
- download-versions
- run-local
- run-local-server
- start-service
- stop-service
- submit-run
- update-endpoint
- startapp command
-
ABEJA Platform CLI
- FAQ
- Appendix
HTTP サービスのオートスケール機能
はじめに
このドキュメントでは、HTTP サービスのオートスケールの仕様について説明します。
オートスケールで設定できるパラメータ
HTTP サービスの作成時には、インスタンス数をオートスケールするかどうかを設定する事ができます。オートスケールはインスタンスのCPU負荷に応じて実行されます。 HTTP サービス作成時に「詳細オプション」をクリックして、オートスケールのパラメータを入力してください。 以下のパラメータを指定する事ができます。
- オートスケールを有効にする:チェックをする事でオートスケールを有効にします。
- インスタンス数:初回起動時のインスタンス数です。
- 最小インスタンス数:オートスケール時の最小インスタンス数です。
- 最大インスタンス数:オートスケール時の最大インスタンス数です。
※ 全てのインスタンス数は 1から64の間で設定できますが、「最小インスタンス数 <= インスタンス数 <= 最大インスタンス数」の条件を満たす必要があります。
オートスケールの条件
- 起動中の全てのインスタンスの平均CPU利用率が60%を超えると、インスタンス数が増えます。
- 起動中の全てのインスタンスの平均CPU利用率が60%を下回ると、インスタンス数が減ります。
- インスタンス数を指定していても、起動後に平均CPU利用率が低いと、最小インスタンス数までインスタンス数が減ることがあります。
オートスケール状況の確認方法
HTTP サービスのメトリクス、もしくは、リソース使用量から確認することができます。