「ビッグデータ」というキーワードが注目を集めるにつれて、「ビッグデータ」とは何か? 今までの「大量データ」とは、どこが違うのか? という声が聞かれるようになりました。

「ビッグデータ」の用語定義は、まだ定まっていません。しかし、今までの「大量データ」とは、以下の違いがあると言われています。
これらの違いを理解するため、なぜいまビッグデータが注目されているのか、その背景を整理してみましょう。
最近のICT(Information and Communication Technology)の進化には、目覚ましいものがあります。
特に目立つのは、ネットワークに接続できる端末が多様化したことと、急激に社会に浸透したことです。たとえば、ネットブックのような小型パソコンや、スマートフォンといったネット接続端末は、急激に我々の生活に浸透し、ごく身近な存在となりました。
また、家庭内の温度や照明の明るさを自動調節するセンサーや、防犯・防災用の報知機に備えられたセンサーなど、私たちの身の回りには、多様なセンサーがあふれています。家庭の外においてもセンサーは、車両、河川、構造物など、社会や環境の中で、幅広く活用されています。

こうしたネット接続端末からは、人・社会・環境の状況を、リアルタイムに映し取るデータが取得できます。
プライバシーやセキュリティに配慮しつつ、さまざまな端末から大量かつ多種多様なデータの取得と活用ができれば、いま必要なこと、いま求められていることが何かを見出だし、より豊かで安心な社会の実現に役立てることが可能になります。
大量かつ多種多様なデータを収集するとなると、ネットワークの広帯域化も見逃せない要素です。あらゆるモノがスピーディーにネットワークにつながるようになったという技術的側面が、データの収集に貢献しています。
また、これらのデータを複合的に分析し、利活用するための下地として、CPU、メモリ、さまざまなデータを解析するアルゴリズムなど、情報処理における性能の進化も見逃せません。

データは、常時大量にあがってくるため、当然今までとはケタ違いに多くなります。データ量は、テラバイトからゼタバイト級と言われ、今後収集するデータよりも、今までに人類が集めたすべてのデータの方が規模が小さいと言われているほどです。

また、各種のネット接続端末からあがってくるデータは、今までコンピュータが扱ってきた企業内の業務データのように「整理しやすいデータ(構造化されたデータ)」とは違い、SNSのテキスト、画像・音声・動画データ、センサーデータなど、「整理しにくいデータ(非構造化データ)」がかなりの割合を占めます。
技術の進歩は、これらのデータを収集・蓄積・分析し、大量で多種多様なデータを扱うことを可能にしたのです。
このような技術をベースに、大量かつ多種多様なデータ=ビッグデータから人・社会・環境の状況を把握し、いま求められているものをフィードバックできれば、人々がより豊かに安心して暮らせる社会の実現に役立つのではないでしょうか。
「ビッグデータ」が注目される背景には、そのような思いがあるのです。(注)
(注)富士通は、このようにICTによって人々がより豊かに安心して暮らせる社会を実現することを「ヒューマンセントリック・インテリジェントソサエティ(HCIS)」と呼んでいます。