第16章: 使用率

キャパシティはシステムがどれだけできるかを教えてくれます。使用率はシステムがどれだけ行っているかを教えてくれます。使用率はキャパシティのパーセンテージとして表されます:CPU使用率70%のサーバー、85%使用済みのディスク、最大帯域幅の40%を運んでいるネットワークリンク。

高い使用率はリソースが効率的に使用されていることを意味しますが、トラフィックスパイクや予期しない障害に対するヘッドルームがほとんどないことも意味します。低い使用率はシステムがオーバープロビジョニングされていること——リソースに支払っているが使用されていないこと——を意味します。適切なポイントはサービスの要件によって異なります:レイテンシーに敏感なサービスはバーストのための余裕を残すために50%の使用率を目標とするかもしれません。一方、バッチ処理システムは90%を目標とするかもしれません。

使用率はすべてのリソース次元で同時に監視する必要があります。CPUの使用率が低くてもメモリの使用率が高いサーバーは、依然として障害のリスクがあります。ボトルネックリソース——キャパシティに最も近いもの——がシステムの実効キャパシティを決定します。ボトルネックの特定と解消は、コアとなる運用スキルです。

モニタリングサービスは、キャッシュヒット率、キュー深度、リクエストレートなどの使用率メトリクスを追跡します。これらのメトリクスは、CPUやメモリ使用率などのシステムレベルのメトリクスと組み合わせることで、システムのリソースがどれだけ効果的に使用されているかの包括的な画像を提供します。