第35章: メンテナンス

メンテナンスとは、プラネタリスケールコンピュータを健全な状態に保つために必要な継続的な作業です。メンテナンスのためにオフラインにできるパーソナルコンピュータとは異なり、プラネタリスケールコンピュータはユーザーへのサービスを継続しながらメンテナンスを行わなければなりません。これには、メンテナンス活動とインフラ上で実行されているサービス間の慎重な調整が必要です。

計画メンテナンスには、ハードウェア交換(故障したコンポーネントの交換)、ソフトウェアアップデート(オペレーティングシステムのパッチ、ファームウェアアップデート)、容量拡張(新しいサーバーやラックの追加)が含まれます。各メンテナンス作業は、実行中のサービスへの影響を最小限に抑えるようスケジュールされなければならず、スケジューリングと配置システムを使用して、メンテナンスが必要なサーバーからワークを移動させます。

計画外のメンテナンス——予期しない障害への対応——は、より困難なシナリオです。サーバーが予期せず故障した場合、ディスカバリモニタリングサービスが障害を検出し、ルーティングサービスがそのサーバーへのトラフィック送信を停止し、障害を起こしたサーバーがリーダーであった場合はコンセンサスシステムが新しいリーダーを選出します。障害を起こしたサーバーは、その後通常のメンテナンスサイクルの一環として修理または交換されます。