メインコンテンツまでスキップ

障害報告

· 約2分

経緯

Apr 12, 2023

原因

  • Apr 12, 2023 0:17 AMにECRへのVPC Endpointsの設定に誤りがあった模様。
    • ECRへのトラフィックを抑制することによるNAT Gatewayへのトラフィック削減のための設定
  • 8:40 AM頃にECSのコンテナの再始動がかかり、その際にECRからdocker imageの取得ができなくなくてサービス自体の停止に至った
  • 8:25 AMにVPC endpointsの設定を削除し、ECS自体は数分〜十数分に1回再始動が行われるのでそのタイミングでdocker imageの取得が行えてサービスの復旧が行われた。
    • ECSのコンテナの再起動は、数分〜数日に1度程度の頻度で発生している。