その他サービス

CloudWatch Alarms とは?メトリクス監視と自動アクション

CloudWatch Alarms は メトリクスを監視し、設定したしきい値を超えたら自動的にアクションを実行する仕組み。SNS 通知・Auto Scaling のスケーリング・EC2 の停止等、AWS 運用の自動対応の中核。 ---

メトリクスのしきい値を監視し、超過時にアクションを実行するアラーム機能。


1. 概要(端的に)

CloudWatch Alarms は メトリクスを監視し、設定したしきい値を超えたら自動的にアクションを実行する仕組み。SNS 通知・Auto Scaling のスケーリング・EC2 の停止等、AWS 運用の自動対応の中核。


2. 何ができるか

  • しきい値監視:CPU・メモリ・カスタムメトリクス
  • 複数の状態:OK / ALARM / INSUFFICIENT_DATA
  • アクション:SNS 通知 / EC2 アクション / Auto Scaling
  • 複合アラーム:複数アラームの AND/OR
  • 異常検知:機械学習でベースライン自動学習

3. 特徴

観点特徴
追加料金アラーム単位(標準)+ 機械学習別途
状態OK / ALARM / INSUFFICIENT_DATA
粒度60 秒〜(高分解能 10 / 30 秒)
評価期間N データポイント中 M 個でトリガー

4. 仕組み

Alarms は メトリクスを定期的に評価し、条件に合致すると アラーム状態 に遷移。アクション(SNS 等)を実行する。

状態遷移

[OK]
  ↓ しきい値超過 (M of N)
[ALARM]
  → SNS 通知 / Auto Scaling / etc

データなし
  → [INSUFFICIENT_DATA]

異常検知(Anomaly Detection)

  • 機械学習でメトリクスの正常範囲を学習
  • 範囲外なら ALARM
  • 「CPU 80%」固定しきい値より柔軟

5. ユースケース

ユースケース 1:障害検知

EC2 ステータスチェック失敗 → SNS → 運用者通知。

ユースケース 2:Auto Scaling トリガー

CPU > 70% → スケールアウト、< 30% → スケールイン。

ユースケース 3:コスト監視

請求額アラームで予算超過防止。

ユースケース 4:アプリ品質

エラー率 > 1% でアラート。


6. 関連用語


7. 関連サイト


🎓 試験での出題傾向

試験重要度主な出題パターン
CLFアラームの概念
SAA監視設計、Auto Scaling 連携
DVAアプリ監視実装
SOA運用設計(頻出