さくらのクラウドニュース

さくらのクラウドの最新情報や、開発に役立つ技術情報をお届けします。

おしらせ

ストレージ障害対応経過報告(4)

3月29日に発生したストレージ障害について

さくらのクラウド 障害発生のお知らせでご報告した通り、15時13分より15時34分にかけて、ストレージのアクセスができない状況が発生しておりました。当障害は緊急で行わせていただいたメンテナンス(ご案内はこちら)の作業中に発生したものです。

 

メンテナンスの作業内容は、パフォーマンス向上のためにパラメータを変更するというもので、ディスクアクセスに断が発生しないことを確認した上で実施をしておりました。しかしパラメータを投入後、アクセス状況の確認をするため監視している最中に、アクセス断が発生する事態となりました。

 

アクセス断の原因は、3月19日に発生した長時間に渡るアクセス断の原因になった、テンプレート作成に関係する機能であることが判明しました。該当機能は3月19日の時点で実行されないよう、システム・ソフトウェアの変更を実施しておりましたが、これより以前に起動されたコマンドが休眠状態で残存しており、それが本日(3月29日)に意図せず再開されていることが分りました。現時点で、すべての残存コマンドを削除し、同様のアクセス断が2度と発生しないよう対策を終えています。

 

現在、パラメータ変更作業と、上記残存コマンドの再開との関連について調査をしております。また今後のストレージに対するメンテナンスは、原因が判明し安全が保証できるようにならない限り、実施しないように致します。

 

皆様にご迷惑をお掛けしたことを改めてお詫び申し上げます。