ニュース

「Amazon S3」で大規模障害、大量のWebサイトが一時利用できない状態に 原因は開発チームの入力ミス

コマンドの打ち間違いで、Medium、Imgur、GitHubなどに影響。

advertisement

 米Amazon.com傘下のAWSによるクラウドストレージサービス「Amazon S3」で先日、大規模な障害が発生し、Medium、Imgur、GitHubといったWebサイトが利用できない状態に。この原因が、同サービスの開発チームの操作ミスだったことが明らかになりました。

画像はAWSの発表より

 2月28日(北太平洋時間)、AWSはTwitter上で、バージニア州北部で「S3のエラー率が高くなっている」「その他のサービスにもインパクト」と障害が起きていることを発表。数時間で復旧したものの、膨大な数のWebサイトが閲覧できなくなるなどのトラブルが発生しました(関連記事)。

 発表によると、トラブルの原因はデバッグを行っていた開発チームの操作ミス。メンバーの1人が手順書に従って少数のサーバーを「S3」のシステムから除去しようとしたところ、誤って大量のサーバーを対象とするコマンドを実行してしまったそうです。その中にメタデータや位置情報の管理、操作などに必要なものが含まれており、システムの再起動を行っているあいだ、「S3」はリクエストを受け付けられない状態に。また、それに依存していたAWSの他のサービスにまで影響が及んだことから、障害が大規模なものになってしまったようです。

advertisement

 今回のように広範囲の地域で該当のシステムを再起動させたことは、長年にわたってなかったとのこと。「S3」がここ数年、サービスとして急成長を遂げていることも災いし、復旧までに予想以上の時間がかかったそうです。

「『S3』が高エラー率を出している。懸命に修復作業を行っている」
「そのほかのAWSサービスにも影響している」
利用していたWebサービスはお手上げ状態

 AWSは操作ミスのあったツールにセーフガードを施すなどの再発防止策を明らかにしたうえで「『S3』がユーザーのアプリケーションやビジネスに、どれほど重要かは分かっている」「この出来事を教訓に、さらに利便性を高めていくつもりだ」とコメントしています。

マッハ・キショ松

Copyright © ITmedia, Inc. All Rights Reserved.

記事ランキング

  1. 大きくなったらかっこいいシェパードになると思っていたら…… 予想を上回るビフォーアフターに大反響!→さらに1年半後の今は? 飼い主に聞いた
  2. 高校生の時に出会った2人→つらい闘病生活を経て、10年後…… 山あり谷ありを乗り越えた“現在の姿”が話題
  3. ディズニーシーのお菓子が「異様に美味しい」→実は……“驚愕の事実”に9.6万いいね 「納得した」「これはガチ」
  4. 「こんなことが出来るのか」ハードオフの中古電子辞書Linux化 → “阿部寛のホームページ”にアクセス その表示速度は……「電子辞書にLinuxはロマンある」
  5. 「防音室を買ったVTuberの末路」 本格的な防音室を導入したら居住空間がとんでもないことになった新人VTuberにその後を聞いた
  6. プロが教える「PCをオフにする時はシャットダウンとスリープ、どっちがいいの?」 理想の選択肢は意外にも…… 「有益な情報ありがとう」「感動しました
  7. 間寛平、33年間乗り続ける“希少な国産愛車”を披露 大の車好きで「スカイラインGT-R R34」も所有
  8. 「もしかしてネタバレ?」 “timeleszオーディション”候補者がテレビ局を退社 ディズニーの“船長”としても話題
  9. 走行中の車から同じ速さで後方へ飛び降りると? 体を張った実験に反響「問題文が現実世界で実行」【海外】
  10. グルーミングが出来ない生まれたての子猫、とんでもない体勢になり…… 想像以上のへたくそっぷりに「どこにも届いてないww」「反則級」