HOME/ AINOW編集部 /ビッグデータとは?定義・事例・活用方法まで全部解説
2020.02.02

ビッグデータとは?定義・事例・活用方法まで全部解説

最終更新日:

データ量が急増しています。総務省「ICTコトづくり検討会議」報告書では、2011年にゼタバイトに到達した国際的なデジタルデータの総量が、2020年には約40ゼタバイトに達すると予想されています。

このような膨大なデータは「ビッグデータ」と呼ばれ、各界から注目を集めています。

例えば、総理大臣の安倍晋三は2019年1月のダボス会議で、「成長のエンジンはもはやガソリンではなくデジタルデータで回っている」と発言しています。
参照:https://ainow.ai/2019/04/22/168216/

また、ソフトバンクグループの代表取締役の孫正義は、「100万倍やってくるデータを人間が使って推論していくのは不可能に近いくらいの規模です。だから我々は一気にAIの力を使って推論していく、こういう世界になっていくと思います。」と、データとAIを組み合わせた可能性について言及しました。
参照:https://ainow.ai/2019/07/18/173607/

しかし、ビッグデータとは何か。改めて問われると、みなさんは説明できるでしょうか?今回は、徹底的に分かりやすく解説します。

ビッグデータとは何か

ビッグデータとは何でしょうか。定義と登場の背景を解説します。

ビッグデータの定義

ビッグデータとは、その名の通り膨大なデータを指す概念です。しかし、何を基準にしてビッグとするかは、さまざまな見方があります。

現在では、数十テラバイトから数ペタバイトのデータ量を指すと言われています。しかし、時代が進むにつれて、さらに膨大な量を「ビッグデータ」と指すようになると考えられます。

また量的な多さ、データ量だけがビッグデータの判断基準とも言えません。

例えば、IT用語辞典では、「様々な種類・形式が含まれる非構造化データ・非定型的データ」であることと、「時系列性・リアルタイム性のあるようなもの」をビックデータと呼ぶことが多いとしています。
出展:http://e-words.jp/w/%E3%83%93%E3%83%83%E3%82%B0%E3%83%87%E3%83%BC%E3%82%BF.html

ビッグデータを最初に定義したと言われる、アナリストのダグ・レイニーは、3つのVを使ってビッグデータを定義しています。

「Volume(量)データの膨大さ」「Velicity(速度)リアルタイムで収集できるデータ」「Variety(多様性)多様なデータの形式」の3つです。
出展:https://blogs.gartner.com/doug-laney/files/2012/01/ad949-3D-Data-Management-Controlling-Data-Volume-Velocity-and-Variety.pdf

ダグ・レイニーのレポ―トは、ビッグデータを定義する3つの観点を提供した一方で、具体的に、「〇〇バイト以上がビッグデータである」という定義には及んでいません。

その時、その時の文脈に応じて、何らか基準よりも「大きい」と判断されたデータが、「ビッグデータ」と呼ばれるのです。

ビッグデータ登場の背景

ビッグデータの登場の背景には、スマートフォンなどのインターネットに繋がった機器の増加や、インターネットを通じたサービスと、それを利用するユーザーの増加があります。

例えばこの記事を読むうえでも、

  • どこから、この記事に辿りついたか
  • この後、どのページに行くか
  • どのくらいこの記事を読んでいるか

などがデータとして、蓄積されています。

下記のグラフのように、日本のトラフィック量(通信回線の延べ保留時間で、データ量を表す指標として使われる)の増加は留まることを知りません。

出展:『我が国のインターネットにいけるトラヒックの集計結果

世界に目を向けても、データ量の増加は膨大です。インターネットの急速な普及が、データの量の増加を助けたことが分かり分かります。

出展:https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h26/html/nc131110.html

ビッグデータの収集技術と解析技術

ビッグデータが注目されている2つの理由を紹介します。データを集める手法の進化と、データを使う手法の進化です。それぞれ解説します。

データを集める手法の進化

データを集める手法が進化しています。その要因は、インターネットです。そこに、あらゆる「もの」がインターネットに繋がることで、さらにデータが集まっています。いわゆるIoTです。

IoTとは、モノがインターネットの接続されていること、あるいはインターネットに接続された端末自体を指します。

▼IoTとAIの関係について解説した記事はコチラ

例えば、冷蔵庫がインターネットに接続された状況を想像してみてください。いつ、誰が、冷蔵庫を使用したか、記録することができます。これを活用して、細かな温度調節をすることができます。他にも、信号機からカメラまで、あらゆる端末のインターネットへの接続が進められています。

このように、あらゆる端末から集められる、膨大で多様な情報はビッグデータとなります。

データの解析技術の進化

ビッグデータを集める手法は深化し続けています。一方で、どれだけデータがあっても、そのデータを解析して、法則性を見出し、活用できるようにしなければなりません。

統計数理研究所の樋口知之氏は「データ・サイエンティストがビッグデータで私たちの未来を創る」(2013)のなかで、MGIレポートを受けて、ビッグデータの解析方法で必要な技術を以下の3点だとしています。

1つ目は、巨大なデータをどのように保存、蓄積していくかという「ビッグデータ工学」。2つ目は、ビッグデータから得られ情報を、ビジネスなどの実学に活かすための表現方法として、「データ可視化」。3つ目は、統計学、データマイニングなど、広い意味でのデータ科学を活用し、単なるデータから、使えるモデルを導く「データ解析法」です。

3つ目の、データ解析法において、技術的な発展がもたらされて、データが生きるようになりました。機械学習です。

機械学習とは、膨大なデータから人の判断を介さずにルールやパターンを発見して、モデルを作る手法です。画像認識コンテストにおいて、驚異的な成果を出したディープラーニングも、機械学習の一つの要素技術です。

大量のデータから法則性を導くためには、機械学習のアプローチが有効です。一方で、良いモデルを作るために必要なのが、大量のデータです。従って、大量のデータを“活かす”方法が開発されたことで、ビッグデータが注目されたと言えます。

▼機械学習について詳しく解説した記事はコチラ

ビッグデータのために必要なDX

ビックデータを活用するために必要な取り組みがあります、DX(デジタルトランスフォーメーション)です。

DXとは

ー企業がデジタル環境の激しい変化に対応し、データとデジタル技術を活用して、顧客や社会のニーズを基に、製品やサービス、ビジネスモデルを変革するとともに、業務そのものや、組織、プロセス、企業文化・風土を変革し、競争上の優位性を確立すること
引用:https://www.meti.go.jp/press/2019/07/20190731003/20190731003-1.pdf

データを業務に活用することを考える時に、AIだけが注目されがちです。

確かに、AIを活用することは、業務効率化の観点でも、生産性向上の観点でも、データを収集する観点でも役立つでしょう。

しかし、技術の面でも、データの面でも、お金の面でも、ハイコストな手法です。

AI以前に、できるDXはたくさんあります。技術が目的化しないように、現場の課題に即してDXを進めていくことが大切です。

地道にDXを進めていくことが、最も着実なデータを収集する手段であり、この積み重ねがビッグデータとなります。

▼国会が推進するDXについてはコチラ

ビッグデータの活用事例

実際にビッグデータはどのように使われているのでしょうか。5つの事例を紹介します。

株式会社 xenodata lab.

株式会社xenodata lab.は、大量のニュースを使ったサービスを展開してます。提供するサービス、ニュースや決算情報から意味を認識し、その繋がりを構造化します。企業向けのサービスで、金融機関から事業会社にまで活用できます。

▼記者発表の記事はコチラ

株式会社 大創産業

ダイソーは、在庫管理・需要予測でビッグデータを活用しています。2015年からPOS恣意ステムを使って、個店ごとの需要予測をして欠品をなくす「自動発注システム」を導入したとのことです。
参照:https://www.businessinsider.jp/post-192845

株式会社ブレインパット

ブレインパットは、ソーシャルメディア分析を行っています。対象となるのは9,000億のTwitterデータ。

位置情報や言語情報、Tweet内容を分析することで、新たな顧客ニーズを見つけ出しています。
参照:https://ferret-plus.com/9035

株式会社あきんどスシロー

スシローもビッグデータを活用しています。すし皿にチップを貼り付けてデータを収集することで、どの寿司がいつどれくらい食べられたかを蓄積します。これから、どれくらい提供するべきか、予測することが可能なり、寿司の最適化を図っています。
参照:https://nissenad-digitalhub.com/articles/ai-bigdata-usage-japanese-company/

おわりに

ビックデータの収集と活用が、今後も進んでいくことが予想されます。

その中で、単なる量に捕らわれず、使えるデータを集めることが欠かせません。そのためには、データを使うことを前提としてデータを収集する認識が必要です。

あくまでも、技術は手段です。現場の課題解決を目的として、ビッグデータと向き合うことが望まれます。

▼YouTubeでもこの記事について解説中!

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

日本初!AIを活用したドッグシッターのサブスクサービス『Furbo ドッグシッター』が開始

先週のAI関連人気ツイートTOP20!【2020/07/06更新】

オープンハウスが物件チラシ全自動作成システムを開発 ー年約3700時間の工数削減

PFNが教育事業を開始、やるきスイッチと提携 -第1弾は小学生向けプログラミング教材

社会人2,000人に調査、51%が「自分の職業はAIに淘汰されない」と回答、「AIを味方」だと捉える人も46%

「今機械学習に必要なのはデータマネジメント」5つの秘訣を実例つきで紹介

688台のAIカメラが導入!関東初のスマートストアが千葉にオープン

「差別を植え付けるデータ」MITが大規模データセットを削除 -問われるデータの公平性

振り込め詐欺をエッジAIで防止 -北洋銀行が実証実験