データのアーカイブ活用とは

  • データ活用・分析
  • DX

企業が利用するデータの容量は、年々増加しています。データを適切に管理し、ストレージ課題を解決するためには、アーカイブの活用が有効です。 今回のコラムでは、アーカイブとバックアップの違い。そして、アーカイブの活用手法について解説します。

what-is-data-archive.jpg

アーカイブとは

アーカイブには、「記録保管所」という意味があります。米国の国立公文書館をナショナルアーカイブと呼ぶように、利用頻度は低くでも重要で失いたくないデータを長期にわたって保管する場所。あるいは、保管する行為をアーカイブと呼びます。

アーカイブの対象は、長期保管が必要な書類やデータをはじめ、アクセス頻度が低くあまり使われないデータです。企業にとっては、例えば、コンプライアンスにかかわる重要データの原本や過去の証憑書類。今は利用されていないが、ビックデータとしての価値がある情報資産などが対象です。

アーカイブされたデータは、現在稼働中のシステムやサーバーなどのストレージから切り離され、光ディスクや磁気テープ、クラウドストレージなどの適切なメディアに保管されます。また、一度アーカイブされたデータを上書きすることはせず、新しいデータが発生した場合は、新たなアーカイブとして蓄積していくのが一般的な考え方です。

バックアップとは

バックアップとは、現在稼働中のシステムで使用しているデータやアクセス頻度の高いホットデータ。また、今後アクセス頻度が上がると考えられるデータを、コピーして保存しておくことを指します。

必要なデータを別の場所にコピーし、保存することで、稼働中のシステムに何らかの障害が発生し、データが破損や消えてしまった場合でも、バックアップから速やかにデータを復旧、復元することが可能です。アクセス頻度の高いデータは、日々更新されていくため、バックアップデータも、定期的に、差分や増分について、上書きしていく必要があります。

バックアップとの違い

アーカイブとバックアップ違いは、その目的が大きく異なります。アーカイブは、利用頻度は低いが、重要なデータを長期的に保管することです。一方、バックアップの目的は、日常的に利用しているデータが破損、消失した場合に備えて、コピーを保存することです。

また、データの保存方法も異なります。具体的には、これ以上修正や編集がされないデータを、蓄積して保存していく過程をアーカイブ。そして、日々更新されていくデータを上書き保存していくことがバックアップで、それぞれ手法が異なります。

アーカイブが必要な背景

必要なデータなら全てバックアップしておけば良いではないかと思う方もいるかもしれませが、企業が取り扱うデータは、近年ますます増えつつあり、保管すべきデータ量が増加する一方だからこそアーカイブが必要です。

例えば、ある製造業企業では、品質検査のために撮影する画像が、一日1.6TBも発生しています。ITインフラの進化により、ストレージの容量単価が低下しているとはいえ、このように肥大化し続けるデータを放置すれば、データ量が増えるたびにストレージを増設する費用が発生します。

また、あらゆるデータを、すぐに使えるような形で保管することは、費用対効果の観点からも得策とはいえません。

数十社を対象としたある調査では、対象企業が保有する全データのうち、7割以上が1年以上更新されていないファイルでした。頻繁に使用し、迅速性が求められるデータには、高性能なストレージが必要です。一方、ほとんど利用されないデータの保管は、すぐに利用できる形で保つ必要がありません。

このようなアクセス頻度が低く、あまり使われないデータを、コールドデータと呼びます。

こういったデータこそがアーカイブ化を進めるべきで、費用と手間を大きく削減を実現できます。

その活用方法

アーカイブの活用方法として、コールドデータの保存を図ることで、稼働中のシステムが利用するデータ量を削減できます。そして、データバックアップにかかる時間を短縮化も図れます。

例えば、請求書など取引に関する証憑書類は、一般的に7年間の保存義務があります。こうした書類を既存システムのデータベースやファイルサーバー上で保管することで、データ容量は圧迫されます。データ量によっては、システムのパフォーマンスにも影響が生まれます。

そこで、アーカイブを活用することで、頻度は低くても必要なデータを安全に保管しつつ、日々のバックアップやストレージへの負荷を下げることが可能です。

SAP社が提供するソリューションには、参照する機会が減った過去のデータを、データベースからファイルに退避させる「データアーカイブ」という機能があります。

また、「SAP S/4HANA🄬」のメモリの有効活用およびパフォーマンス維持のため、コールドデータをメモリから退避させる「データエージング」という機能も利用できます。このようなアーカイブソリューションを上手く活用しながら、データを効率的に管理していくことが企業のデジタル化(デジタルトランスフォーメーション)を推進し、データに基づいた迅速な判断ができるでしょう。

関連サービス

関連資料

  • アーカイブ導入アセスメントサービス

    SAP®ERPユーザーである企業が扱うデータ量は日々増え続けています。SAP S/4HANA®への移行を見据えた際、企業が抱える課題があります。それは、SAP®ERPのデータベースに、どのデータが、どれくらいの量を占めているのかといった把握が出来ていない点です。結果として、SAP S/4HANA®に移行する際にも業務上不要なデータを移行することになり、大きな障壁になります。
    そこで、NTTデータGSLは、SAP S/4HANA®への移行を見据えた効率的なデータ活用に向けたアーカイブの方針作成を支援します。アーカイブ活用により、日々の増え続けるデータの最適化を実現します。 ダウンロード

  • 移行対応アーカイブサービス

    現在お使いのSAP®ERPからSAP S/4HANA®へシステム移行前に、お客様のデータベースを分析し、不要なデータを削除するサービスです。これにより、移行対象となるデータを最小限に留めることができ、移行時のダウンタイム短縮化を図れます。さらにデータベースサイズ、メモリ使用量を抑え、SAP S/4HANA®の強みを活かし、高度な分析の実現と経営の高度化を実現します。 ダウンロード