さくらのクラウドの最新情報、技術情報

さくらのクラウドニュース

さくらのクラウドの最新情報や、開発に役立つ技術情報をお届けします。

おしらせ

ストレージ障害対応経過報告(1)

さくらのクラウドにおいて発生している性能低下の問題については、障害情報としてリリースさせていただいております。

 

 

ストレージの問題に端を発するこの度の障害と対応状況について、可能な限りタイムリーに情報を提供させていただくため、さくらのクラウドニュースにおいて逐次報告をさせていただくことと致しました。   ユーザの皆様に対する重要な通知は、今後も障害情報およびメンテナンス情報でお知らせいたしますが、当報告では最新の情報の提供に努めさせていただきます。

3月23日午前中の状況について

現在継続している問題は、ストレージのコントローラにおいて大幅な性能の劣化が観測されていること、これに伴いストレージに対してディスクの作成や削除のコマンドが正しく遅れない状態になっている事です。コントローラの応答が悪くなる現象は、3月19日の夕刻に実施したストレージのファームウェア・アップデート以降に発生し、現在まで解決できておりません。

 

現在、ストレージ・メーカーの全面的な協力を仰ぎ、コントロール・ソフトウェアの問題解析に当たっております。また同時に、現在動作中のストレージの正常化を行うため、ストレージのパラメータを様々に調整する変更作業を行っております。

 

ストレージのコントローラは、完全に動作しなくなっているのではなく、不定期に応答がなくなったり、正常に復帰したりを繰り返す状態となっております。また応答の悪化についても、完全に応答しない場合と非常に遅くはあるものの処理を完了できる場合とがあります。完全に応答しない場合に、すみやかに正常化できるようコマンドを投入することを検討しておりますが、さくらのクラウド障害発生のお知らせ(2012年3月22日) でお知らせした障害はこの作業に端を発するものであり、現在は実施を控えさせていただかざるを得ない状況と判断しています。

 

コントロール・ソフトウェアの解析のため、必要に応じてストレージ上にて解析に必要な情報の収集に当たっておりますが、この情報収集作業がさらにストレージのアクセス負荷になる状況も発生しています。現在この問題を回避する手順を作成したため、サービスに対する影響は最小限にして解析を進めております。