Googleが、3月13日にGmailとGoogleドライブで発生したサービス障害(関連記事)の原因について説明しました。

障害は、同社の内部BLOB(バイナリ・ラージ・オブジェクト:データベースで用いられるデータ型の1つ)ストレージサービスで4時間10分にわたって発生。内部BLOBストレージサービスのエラー率が上昇し、このストレージサービスを利用するGmailやGoogleドライブでもエラー率が上昇したといいます。ただしキャッシングや冗長性によってユーザーへの影響は大きく抑えられたとも同社は説明。同様の問題が再発しないよう対策を取ったとしています。
同社は原因について、内部BLOBサービスが使用するメタデータ用のストレージリソースが大幅に増えたという警告をSRE(サイト信頼性エンジニアリング)担当者が受け取り、リソースの使用を減らすために構成を変更した影響と説明。この変更にはBLOBデータの位置を探すシステムの重要な部分をオーバーロードさせる副作用があり、それが連鎖的に障害を引き起こしたとしています。
また14日にはFacebookやInstagramでサービス障害が起きましたが(関連記事)、こちらはサーバ構成の変更が原因だったとFacebookが発表しています。
