S3、Azure Blob、GCSのバックアップにおける最大のハードル(そしてその対処法)

Senior Product Marketing Manager

火曜日、午前2時13分。誤ったポリシーが、誤ったライフサイクルルールを押し付けました。何百万ものオブジェクトが消え始めます。レプリケーションは?それでもまだ忠実にミスを反映します。レプリケーションと耐久性機能はバックアップではありません。

今日、オブジェクトストレージはプライマリストレージであり、Webサイト、分析、ERPエクスポート、観測可能データ、ETL出力、AI/MLトレーニングセットなどに燃料を供給しています。Amazon S3、Azure Blob Storage、Google Cloud Storageは、日常的に数百テラバイトからペタバイトのビジネスクリティカルなデータを保持し、アナリティクスやAIの基盤として機能しています。そのため、独立して管理されたポイントインタイムのバックアップは譲れません。

マルチ可用性ゾーンレプリケーションや消去コーディングのようなネイティブのクラウド機能は、耐久性とアップタイムを向上させます:

  • Bucket またはアカウントをまたがるポイントインタイム リカバリ
  • Immutability and Governance independent of production
  • Protection from human error、

インシデントが設定ミス、漏洩した認証情報、またはプラットフォーム側の問題を含んでいる場合、個別に管理された不変のコピーが、きれいに復旧する唯一の方法であることがよくあります。

なぜコストが一番のハードルなのか

ペタバイト規模になると、従来のデータ保護アプローチはすぐに維持できなくなります。総所有コスト (TCO) は通常、次の 3 つの場所で爆発的に増加します:

  • Data in motion:リージョンやクラウドをまたいで大容量を移動させると、イグレスとリクエストの料金が発生します。リージョン内にとどまることでイグレスを回避できますが、それでもリクエストと検索の料金が発生します。
  • バックアップ ストレージのフットプリント:PB規模でのフルコピーバックアップは持続不可能です。クラウドプロバイダーのバックアップ保管庫はさらにコストがかかります。繰り返されるフルコピーは、ストレージと予算を増大させます。
  • Recovery inefficiency:数個のオブジェクトまたはバケットをリカバリするためだけに、ツーリングによってフル アカウントのリストアが強制される場合、データ転送のオーバーヘッド、リカバリ時間、およびオペレーションの停止によって代償を払うことになります。

チームは堅牢なバックアップを望んでいますが、継続的なコストのために躊躇しています。その結果、保護が遅れたり、一貫性がなくなったりします。

オブジェクト

ストレージ バックアップの「理想」とは

コストに見合った設計とは、次のようなものです:

  • 移動中のデータを最小限に抑えること。デデュープ、転送前の圧縮。
  • 重複ストレージを排除。ターゲットでのグローバルな可変長重複排除。
  • 必要なものだけを正確に復元。環境全体の再構築の代わりに、オブジェクト、バケット、およびアカウントレベルのリストアをサポートします。
  • Immutability & Governanceを強化します。独立した保持管理。
  • Scale simply.ソフトウェアで定義された、クラウド展開可能なコンポーネント。

HYCU + Dell:

HYCU+Dellの共同ソリューションでは、HYCUがデータ保護エンジンとして機能し、Dell Data Domain Virtual Edition (DDVE)がバックアップターゲットとして機能します。

HYCUはオブジェクトストレージソースを検出し、ジョブをスケジュールし、保護されたデータのカタログ化とインデックス化を行い、きめ細かなリストア(単一オブジェクト、バケット、またはより広範なスコープ)を編成します。Dell PowerProtect Data Domainアプライアンスのソフトウェア定義バージョンであるDDVEは、グローバルな可変長重複排除、暗号化、および不変性のための保持ロックを提供します。

 

  1. data-list-item-id="ec694fbb3f92f2eade7be133a75eadb4a">ソース側の削減によるスラッシュ・エグレス。デルはHYCUにDD Boost機能を拡張し、インラインのソース側重複排除と圧縮を可能にしました。ユニークなセグメントのみがネットワークを通過し、転送時間とエグレスの露出を削減します。
  2. Global dedupeでバックアップストレージを縮小。バックアップデータがDDVEに到着すると、実際のコンテンツに基づいて自動的に小さなセグメントに分割されます。これにより、バックアップ間で重複するデータを識別して排除することができるため、繰り返されるコピーの代わりに一意の断片のみが保存されます。
  3. 復旧を迅速化し、無駄を省きます。一意のセグメントのみが保存され、インデックス化されるため、リストアウィンドウが短縮され、データ移動が減少します。HYCUでは、環境全体のリカバリを強いられることなく、単一のオブジェクトであれバケット全体であれ、必要なものだけを正確にリストアできます。つまり、リストアが高速化され、混乱がはるかに少なくなります。

TCOを削減する一方で、このソリューションは回復力と復元性を強化します。データは転送中および静止時に暗号化され、機密性が保護されます。保持ロックは不変性を強制するため、保持期間中にバックアップを変更または削除することはできず、ガバナンスと監査要件をサポートします。

HYCU と Dell のバックアップとリカバリの仕組み

  • データ-list-item-id="e484e9031255a1dd0d9d687ab615f464b">「先週の金曜日のオブジェクトが1つ必要です」 
    HYCUのカタログを使用して、そのオブジェクトだけを検索し、数時間ではなく数分でリストアします。1つのファイルを取得するためにすべてをリストアする必要はありません。
  • 「ランサムウェアがヒットしました。
  • 「監査は、RTO内にバケットをリカバリできる証拠を求めています」 
    バケットの範囲でリカバリし、HYCUとDDVEからシステムログを作成して、コントロールを文書化し、監査可能性を向上させます。
  • 「私たちは400 TBから2 PBにスケーリングしています」 
    データ転送の前とストレージの両方で、グローバルなデデュープに成長を吸収させてください。

詳細

HYCUとDell DDVEでは、一意のデータのみを移動する (移動中のデータを最小限に抑える) ことで、総所有コストを削減し、最大40:また、きめ細かなリカバリによりリストアを高速化し、不変性と検索可能なカタログによりコンプライアンスを合理化します。