2021年6月14日月曜日

「3カ月後、容量が不足します」 運用管理者の代わりに未来予測するストレージ

https://members.techtarget.itmedia.co.jp/tt/members/1812/21/news02.html
シェアしました。

ストレージの容量枯渇対策に運用担当者は頭を悩ましている。監視ツールがあってもストレージごとに異なっていたり、それぞれ操作や表示が違って戸惑ったりする状況では適切な運用管理は難しい。解決する方法はあるのか?

豊富なストレージ製品群で利用できる「CloudIQ」

 ストレージベンダーの中でもDell EMCは、さまざまな用途に適した製品を取り扱っている。SAN(Storage Area Network)なら「XtreamIO」「PowerMAX/VMAX」「SCシリーズ」「Dell EMC Unity」がある。SAN以外にもNAS(Network Attached Storage)やDAS(Direct Attached Storage)、オブジェクトストレージなどの幅広い製品ラインアップを持つ。

 製品それぞれの性能や特徴に目が向きがちだが、運用管理性は重要な観点だ。Dell EMCはクラウド型運用管理サービス「CloudIQ」を提供している。これまではミッドレンジ向けのDell EMC Unityに対応していたが、2018年10月からはその他の製品(XtreamIO、PowerMAX/VMAX、SCシリーズ)でも提供を開始した。

 該当するDell EMCストレージ製品の保守契約とリモートサポート(ESRS:EMCセキュアリモートサービス)を利用できるユーザーならば、誰でも無償でCloudIQが利用できる。このツールはダッシュボードから運用状態を直感的に把握できるだけではなく、空き容量の予測分析や機械学習を取り入れた異常検知、といった先進的な機能も併せ持つ。SaaS(Software as a Service)アプリケーションとして提供され、スマートフォン向けのアプリケーションもある。



Dell EMCの古舘良則氏

 この仕組みは、ストレージ製品からDell EMCに送られたデータを基にCloudIQが「ストレージの健康状態」を解析することで、ストレージの運用管理者がブラウザやアプリケーション、あるいはメール通知から、ストレージの状態を簡単に把握できるというものだ。Dell EMCの古舘良則氏(プライマリストレージ事業本部シニアシステムエンジニア)は「人間が手首につけて歩数や心拍を計測するフィットネストラッカーのようなものです」と例える。

 Dell EMCへの通信にはVPN(仮想プライベートネットワーク)を利用し、ストレージ内のデータは送信しないためセキュリティ面も「問題ありません」と古舘氏は言う。

 ESRSはハードウェア障害対応やファームウェアのアップデートを提供するが、CloudIQは視覚的にストレージの健全性や将来予測といった有用な情報も提供する。社内で運用しているDell EMCの複数のストレージ製品を統合的に監視できるのも大きなメリットだ。

プロアクティブなヘルススコア、予測分析、異常検知

 CloudIQのダッシュボードはストレージの「健全性スコア」を一覧で表示する。健全性スコアは完全な状態を100点として、問題内容に応じて減点する。スコアに応じて色が変化するため、監視対象の中で問題があるストレージを直感的に把握できる。



ヘルススコアのダッシュボード画面

 「ヘルススコア」で監視する要素(点数要素例)には、以下の5つがある。

  • システムの正常性(コンポーネントに障害がないか)
  • 構成(ホストが接続されているか)
  • 容量(ストレージ共有領域から割り当てが超過していないか)
  • パフォーマンス(CPU使用率が高くないか)
  • データ保護(目標復旧地点<RPO>が満たされているか)

 ダッシュボードではドリルダウンで詳細な情報を参考できるため、問題の特定に役立つだろう。さらに問題解決に必要なアクション、または推奨されるアクションを表示する。

 ヘルススコアに変化があれば運用管理者にメールで通知するため、運用管理者は常にダッシュボードを監視していなくてもいい。通知メールにあるリンクをクリックするとCloudIQが開くため、そこから対処が可能になっている。

 ストレージ空き容量の将来予測も可能だ。例えば空き容量の減り具合から、いつ枯渇するかを予測し、通知する。運用管理者が早めに検知できれば、事前に問題を回避できるだけではなく、余裕をもって予算計上や作業スケジュールを設定できる。運用管理者の負担を減らすという観点からも重要な機能だ。

 また機械学習を用いることで、通常とは異なる性能の変化なども察知できる。業務システムでは特定の曜日や時間帯で負荷が高まることがあるが、通常とは異なる時間帯に負荷が高まれば何らかの特殊な要因があったと考えられる。そうした普段とは異なるふるまいを識別することで、人間では見過ごしてしまうような異常にもアラートを上げ、注意を促してくれるのだ。

容量が枯渇する時期を予測

 実際にどのような場面でCloudIQが有効かを詳しく見ていこう。

 まずはストレージ管理で最も気になる空き容量だ。CloudIQはストレージ共有領域の容量推移から、いつ枯渇するのかを予測できる。



枯渇予測グラフ。点線が緑の枠を超えるタイミングで枯渇するという予測になる

 「ストレージ容量がいっぱいになったら購入が必要」と考えがちだが、購入しなくてもいいケースもある。社内に未使用で転用可能なストレージがあるかもしれないからだ。CloudIQには「Reclaimable Storage」(再利用可能なストレージ)を検索する機能がある。ホストが接続されていない、I/Oが発生していないといった情報から、現在使っていないストレージを探し出してくれる。

 ストレージが増えると、休眠中のストレージの存在を忘れてしまうこともあるだろう。事業部門が導入して情報システム部門が把握していないストレージも存在するかもしれない。この検索機能で、あまり活用されていないストレージもまとめて探せるのはCloudIQの便利な点だ。

 「ストレージ容量の枯渇を事前に予測する機能と、空きストレージを探す機能は、特にお客さまから好評です」と古舘氏は言う。

負荷の推移から異常を検知

 次に性能監視だ。CloudIQはパフォーマンスをグラフ表示できる。グラフに表示できる項目はブロックのレイテンシ、IOPS(一定時間の読み書き性能)、帯域などがある。グラフは値の時間推移だけではなく、パフォーマンスに影響があった時間帯を強調表示してくれる。強調部分は「通常とは異なる挙動があった時間帯」であり、何か問題があったと推測できるわけだ。強調表示された部分をクリックすると、通常と何が違うか詳細情報を表示する。この機能はシステム構成変更時にも有効だ。システム構成の変更が性能に影響を与えているかどうかを確認できるためだ。



異常を検知、分析できる性能監視機能

 CloudIQはパフォーマンスデータを2年間保持するため、長期的な性能変化も分析できる。曜日や日付、季節に応じた傾向をさかのぼって分析すれば、例えば「年に一度のセールや特別なイベントでどのくらいの負荷が生じたのか」といった、時期に起因する変化に気付くことができるため、負荷予想の参考になるだろう。

 CloudIQのモバイルアプリはAndroidとiOSに対応しており、監視対象のストレージ状況はPC画面と同じように確認できる。この機能は顧客からも好評なようだ。運用管理者にとってストレージの常時監視は大変なものだが、気になるときスマートフォンでいつでも確認できる手段があるのは安心感につながるはずだ。

 他にも珍しい機能としては、SSDの寿命予測機能がある。SSDには書き換え回数に制限があるため、寿命に近づいているかどうかをCloudIQから確認できる。「いつか使えなくなる」という不安が解消され、適切なメンテナンス計画を立てる助けになる。

CloudIQに注目すべき理由

 CloudIQは数カ月に一度の短い期間で既存の機能の改良や新規機能が追加されている。これもSaaSで提供されているために、管理者が全く気にすることなく、その恩恵にあずかることができる。

 CloudIQはDell EMC Unityのみに対応していた時点で合計6000以上のストレージアレイが接続しており、1日当たり6億のデータ静止点(データポイント)を調査し、5500万のヘルスチェックを実行していたという。CloudIQに接続されているアレイの平均スコアは97だそうだ。常時監視しているだけあり、とてもいい「健康状態」だといえる。

 CloudIQがDell EMCのSANストレージ製品のほとんどで利用できるようになったことで、Dell EMCのストレージを運用している環境において標準的なツールになった。多様なストレージを運用している企業であるほど、メリットは大きい。もしDell EMCのストレージ製品を運用しているなら、CloudIQを試してみてはいかがだろうか。

問い合わせ先

会社名 Dell EMC

TEL https://www.dellemc.com/ja-jp/index.htm

提供:Dell EMC(EMCジャパン株式会社)
アイティメディア営業企画/制作:TechTargetジャパン編集部


0 コメント:

コメントを投稿