[障害報告]8月23日に発生した障害に関して
INST石野です。
いつも当社サービスをご利用頂いておりましてありがとうございます。
8月23日に起きた障害に関してご報告とご連絡です。
<障害状況>
・INST Messengerログイン画面からログインができない状態
・予約配信をしていたメッセージが配信できない状態(8社、計2033通)
・APIリクエストを受け付けない状態
・返信フォームに回答ができない状態
<発生期間>
8月23日 13:10~19:43
<対象>
INST Messenger利用中の全顧客
<原因>
当社が利用しているAWS(Amazon Web Service)東京リージョンの通信障害
※後にAmazon社の公式発表によりサーバーの過加熱と判明
<再発防止策>
単一リージョンでのサービス運用→マルチリージョン化の検討
DocumentDBの導入
にて以後、このような利用インフラの大規模障害にも稼働可能時間を増やしていけるよう
開発チームと協議検討を進めてまいります
<お詫びとして>
ご迷惑をおかけしてしまったお詫びとして、INST Messengerの8月分の利用料金を
全顧客5%お値引きとして対応をさせていただきます。
利用顧客数も増え、障害期間中たくさんのお問合せを頂戴いたしました。
皆様の業務に浸透しているサービスとして責任感を持ち、今後も運営してまいりたいと思います。
この度は大変ご迷惑をおかけいたしました。
引き続きご活用のほどどうぞよろしくお願いいたします。
株式会社INST 代表取締役 石野幸助
~編集後記~
今回はYahooニュースTOPにも載るほどの大規模でこれまでにないAWSの障害だったわけでなんとなく「仕方ないよね」的な風潮でもありましたが、そんな中も通常通り稼働させているサービス、こういった危機を予測し回避したサービスなども多々ありました。
AWSを選びサービス提供をするという意思決定をしたのは紛れもなく当社で、今回の障害でお客様にご不便をおかけしてしまったのは当社の全責任と重く受け止めております。
当社もインフラ系のエンジニア(元大手ゲーム会社にてサーバーエンジニア)が在籍しており、こういった事象に関しては万全という認識でおりましたが、まだまだ認識が甘く、多くのお客様にご迷惑をおかけする結果となってしまいました。改めて深くお詫び申し上げます。
障害復旧後、たくさんのお待ちいただいていたお客様が配信をしてくださっている様子(1000通以上の一斉配信があるとSlackに通知が来るようになっているんです)や、障害報告・復旧報告のお知らせメールに「大変ですね」「早い復旧を望みます」という温かいお言葉を頂戴し、更に身の引き締まる思いでした。
今後ともどうぞよろしくお願いいたします。
※そしてなぜか本日10:00以降からblogにアクセスできない事象が発生しておりまして、確認したとことWordpressをインストールしてあるサーバーのIPアドレスが変わっているという。。。現在サーバー事業者に問い合わせ中です。
そのためお知らせが遅くなりまして大変失礼いたしました。
石野