最終更新日:
AIやビッグデータと聞いて何を思い浮かべますか。安倍晋三首相が2019年1月のダボス会議で「成長のエンジンはもはやガソリンではなくデジタルデータで回っている」と述べたように、ビッグデータの大きな可能性が注目されています。
この記事では、AI・ビッグデータとは何か。2つの関係。そして、どう社会を変えると言われているのかを解説します。
目次
まずはAIとビッグデータの違いと概要をおさらい
AI、ビッグデータとはどういう概念でしょうか。その関わりまで解説していきます。
AIとは
AIとは、日本語で人工知能を指します。人工知能と言ってもさまざまです。「何となく頭の良い機械」から、統計的な手法を用いてデータを分析する技術まで、非常に幅広い概念です。
例えば、人工知能の研究者は以下のような定義をしています。
京都大学 長尾真 氏
ー人間の頭脳活動を極限までシュミレートするシステムである
ドワンゴ人工知能研究所 山川宏 氏
ー計算機知能のうちで、人間が直接・間接に設計する場合を人工知能と呼んでいいのではないかと思う
東京大学 松尾豊氏
ー人工的に作られた人間のような知能、ないしそれを作る技術。人間のように知的であるとは、「気づくことのできる」コンピュータ、つまり、データのなかから特徴量を生成し現象をモデル化することのできるコンピュータという意味である。
出典:(出典)松尾豊「人工知能は人間を超えるか」(KADOKAWA)p.45
「人工知能」という言葉は話す人や、文脈によって意味を捉える必要があります。ビッグデータの関連で言えば、機械学習など、データからコンピュータに学習させる手法。もしくは、学習させたモデルを搭載した機械と考えれば良いでしょう。
ビッグデータとは
ビッグデータは文字通り、巨大で複雑なデータ集合を示す用語です。しかし、一元的な定義は存在していません。現在では、数十テラバイトから数ペタバイトの範囲であると言われています。しかし、処理するコンピュータの向上によってその定義も変わってくるでしょう。
ビッグデータという概念の普及は、業界のアナリストであるダグ・レイニーが3つのVを使って定義したことにはじまり、現在にまで引き継がれています。
- Volume(量)
- データの膨大さ
- Velicity(速度)
- リアルタイムで種集できるデータ
- Variety(多様性)
- 多様なデータの形式
単なる量ではなく、多様性や速度も定義に触れてるのが興味深いです。
また、鈴木良介氏は著書「ビッグデータビジネスの時代」の中で、「事業に役立つ知見を導出するためのデータ」とビッグデータを定義し、より目的を重視しました。
総務省も、ビッグデータの量的側面だけでなく、質的側面。例えば、データの多様性などにも留意すべきと記しています。
ビックデータを構成する各種データの例
- マルチメディアデータ
- ウェブ上の配信サイトの音声・動画
- ウェブサイトデータ
- ECサイトやブログサイトの履歴など
- センサーデータ
- デバイスが検知する位置、温度など
- オペレーションデータ
- 販売管理等の業務システム上に蓄積されるデータ
- ログデータ
- ウェブサーバーで自動で生成される、アクセスログなど
- オフィスデータ
- オフィス文書、Eメールなど
- カスタマーデータ
- CRMシステムで管理される、会員データなど
- ソーシャルメディアデータ
- SNSに書き込まれるプロフィール、コメントなど
出典:http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h24/html/nc121410.html
ビッグデータが注目される背景にはインターネットの上の情報量の増加があります。例えば、この記事を見るうえでもデータは蓄積されています。何歳のどのような人が見ているのか、どのくらいの時間、記事を見ているのか、などがデータとして記録されています。
このようにインターネットのサービスの普及と発展がビッグデータ時代の到来をもたらしています。
AIとビッグデータの関係
AIとビッグデータでは非常に深い関係があります。
実際にAIはどのように開発されるのでしょうか。AIの活用方法として、例えば自動翻訳があります。
Google翻訳では、私たちが入力した言語を他の言語に翻訳して返してくれます。それは、これまでの対訳データ(例えば日本語の「私」が、英語だと何に当たるか)を大量に使って統計的な処理を施すことになっています。
また、画像認識ではどうでしょう。画像認識はAIの典型的な応用分野の一つです。画像から「何が映っているか」を特定することが可能です。
この画像認識も大量のデータが必要です。例えば犬か猫を判別するモデルを作りたい場合は、それらの画像を大量に利用します。
このように、AIを開発するには膨大なデータが必要で、AIブームはビッグデータが蓄積されていたから起こったとも言えます。
AIとビッグデータの3つの課題
プライバシーの問題
膨大なデータの中には個人情報も含まれています。分析によって良い効果をもたらせることができるのと同時に、使い方を間違えると多くの人にとって悪影響を生み出してしまうリスクもあります。
データの整理
ビッグデータはさまざまな形式、分野の情報をはらんでいるため、活用をする前にはまずデータの中から必要なものだけを抽出しなければなりません。
それを可能にする分析の基盤を整えるというプロセスが避けて通れないという点が課題のひとつになっています。
人材不足
ビッグデータやシステム基盤の活用のために、それを実際に行う人材の確保はなくてはなりません。
しかし現時点ではこの人材の確保こそがAI×ビッグデータの課題のひとつとなっています。
AI戦略2019ではAI分野での人材の教育改革が掲げられており、各専門分野で活躍できる人材で年間約25万人、国際的に活躍が見込める人材で年間約2000人輩出という目標が定められています。
ビッグデータで広がるAI活用の可能性
ビッグデータ普及の背景
ビッグデータという概念自体が日本で広がり始めたのは2010年であり、2011年は「ビッグデータ元年」と呼ばれています。
ビッグデータの言葉が生まれる以前より自然現象などに対して情報を集積することは行われており、これを効率化したのがコンピュータです。
コンピュータでは初め「構造化データ」とのちに呼ばれる行、列を持って順序付けられたデータが扱われていましたが、時代を追うごとに進化していったコンピュータは画像やテキストなどの「非構造化データ」も取り扱う様になります。
過去から集積、整理された膨大なデータは先に登場した量、速度、多様性という3つの観点から「ビッグデータ」と定義されるに至りました。
なぜビッグデータは期待されるのか?
なぜ、これほどまでにAI×ビッグデータの可能性に多くの企業や個人、政府までも期待するようになったのでしょう。
AIに関して言えば、機械学習の一技術である「ディープラーニング」によって技術的ブレイクスルーが起きたことにあります。ディープラーニングとは十分なデータ量があれば、人間の指示なく機械が勝手に特徴を読み取ってくれるディープニューラルネットワークを使った仕組みのことです。
これと同時にディープラーニングを含めた機械学習の精度を担保する「データ」がインターネット上を中心に蓄積されてきました。まさにビッグデータです。
ディープラーニングとビッグデータが掛け合わさることで、AIブームが起き、さまざまな分野での事業に活用が進んでいます。
ビッグデータとIoTの繋がりと今後
今後は、IoTの更なる普及にも期待されています。IoTは、モノのインターネットと訳され、モノがインターネットに接続されている概念や、その端末自身のことを意味します。
スマートフォンから、スマートスピーカー、自動車から、街の信号まで、あらゆるモノがインターネットに接続される未来が訪れると、膨大なデータを集めることが可能になります。
こうやって集められたデータをAIが推論し、そのモデルを搭載したデバイスを社会に送りこむことで、より便利で豊かな社会が形成されることが期待されています。
このように、AIそのものの技術的発展によって分析・推論・予測する能力の上昇と、多様で大量なビッグデータが掛け合わさることで、社会が変わると展望されているのです。
AI×ビッグデータがもたらした5つの変化
自動運転
発展が目覚ましい自動運転分野において、ビッグデータは大きな役割を果たしています。
走行時に歩行者や車両、障害物などを逐次識別するためには膨大な量の画像データが必要となり、そこでビッグデータは活用されています。
自動運転分野の発展を加速させるため、AudiやTOYOTAといった企業が自社の自動運転車が収集したデータを無料公開する動きも見せています。
他にも自動運転のための高精度三次元マップの作成、交通インフラの整備などでもビッグデータが活用されており、多方面で重要な役割を担っています。
▶関連記事|自動運転とは? 各レベル説明と15の実例を紹介>>
人材採用
企業の重要な課題である人材の確保において、ビッグデータは重要となっています。
人財(Human Resource)とテクノロジーを掛け合わせた造語であるHRTechの市場規模は拡大しており、それぞれの企業にマッチした人材を選定してレコメンドする場面でビッグデータの活用が行われています。
新卒向けリクルーティングサービスである「Offer Box」もビッグデータの活用をしているサービスのひとつです。
Offer Boxは「企業が学生にオファーする」という形式を根底としており、AIによる解析、ビッグデータによる照合によって企業がマッチングしたい可能性の高い学生をセレクトすることを可能にしました。
▶関連記事|差別につながる?採用で活用されるAIのメリット・デメリットから事例まで解説>>
マーケティング
マーケティング分野においてもビッグデータは活用されています。
膨大な量となっている顧客の行動データの効率化やそこから可視化される未来の行動予想、企業の課題発見などでその力を発揮しています。
日本を代表するコンビニエンスストアチェーンのローソンでは、売上31位である「ほろにがショコラブラン」を販売し続けています。
売れ筋とは言えないこの商品は、共通ポイントプログラムの「Pontaカード」から得られる顧客の購入情報から「1割のヘビーユーザーが売り上げの6割を占めている」というデータがもとになって製造を継続されています。
ビッグデータの活用により、見えづらい情報が浮き彫りになった一例と言えます。
▶関連記事|徹底解説!進化してゆくAI×マーケティングの無限の可能性について>>
SNS分析
SNSの普及により、TwitterやInstagramから得られるビッグデータを駆使してビジネスに転じさせる企業が増加しています。
SNSに投稿されるさまざまなモノや事象から「今のトレンドがどのようなものなのか」、長期的にデータ分析を行うことで「そのトレンドは継続的なものか、短期間的なものか」などの多様な情報を得ることができます。
また、近年のSNSの主流はテキストから画像に変化しつつあります。画像分析においてもビッグデータの重要度は高くなっています。
感染経路の特定
携帯電話の位置情報などから得られる人の動きを収集したビッグデータは、コロナウイルスの感染経路の特定に一役買っています。
都心への外出の数は減少したものの住居の近くの公園、施設などへの人の流入が増加した、などの情報はビッグデータの解析から得られるものであり、どの場所に人が集まるのか、どの世代、どの性別の傾向があるのかという分析も行われています。
ビッグデータを使ったビジネスの事例
実際にビッグデータを使ったビジネスはどのようなものがあるでしょうか。事例をみて考えていきましょう。
経済情報分析|xenoBrain
xenoBrainは、膨大なニュースから市場変化を予測するサービスです。1つ1つの経済情報は、複雑に絡み合っています。その関係を分析することで、ある事象が起きた時、どのように経済や産業情報が変化するかを予測します。
使われているデータ
- 経済ニュース
- 決算情報
▶関連記事|「xenoBrain」が正式リリース / 独占インタビュー>>
アナウンサー|株式会社Spectee
AIアナウンサーは文章を与えると、人間のようになめらかに読み上げてくれるサービスです。有名なものは「荒木ゆいです。」PR担当者が作成したブログに、仕組みが書いています。(https://www.wantedly.com/companies/spectee/post_articles/144117)。それによると、声優さんの声を何十時間分もサンプリングしたうえで、単語や文章をどう読ませるかを学習させたとしています。
使われているデータ
- 声優の声
- アナウンサーが原稿を読んでいる音声データ
- 上記に対する原稿
- 「荒木ゆい」が実際に読んだときのデータ
▶関連記事|AI×アナウンサーって何?その魅力や活用例、今後まで一挙紹介!>>
胡麻信用|Alipay
胡麻信用とは、中国の決算システムにであるAliPayの一つの機能です。人の信用に度合いを「学歴」「勤務先」「資産」「返済」「人脈」「交際」の6つの項目によって、どれだけ信頼できるかを計量化しています。
13億人を超える人口を抱える中国では、ほとんどの支払いがスマホで行われています。彼らが全ての購買がデータとして蓄積されることによって可能になったサービスです。
自動FAQ|OKAWAVE
Q&Aサイト「OKAWAVE」を運営する株式会社オウケイウェイヴは、数億件のQ&Aデータを分析して、自動的にFAQ(質問とその回答)化するシステムを開発しました。
オリジナルブロックチェーン上に展開することで、FAQ作成者の著作権を保護・管理できるとしています。
サイバーセキュリティ|サイバーセキュリティクラウド
株式会社サイバーセキュリティクラウドは、ディープラーニングを用いた攻撃検知AIエンジン「Cyneural」を開発しています。
5000サイト以上に、サイバーセキュリティサービスを提供しており、8000億件以上のデータ数を保有しているとのこと。
この膨大なデータを学習させることで、高度化しているサイバー攻撃に対して、未知のサイバー攻撃の可能性が高いアクセスを発見・検知することが可能なエンジンの開発を実現したとしています。
レジ|株式会社ビジコム
POSシステムを聞いたことはありますか?
POSシステムとは、レジで会計をするだけではなく、「いつ誰に何がどのくらい売れたか」をデータとして管理し、分析できるようにしたシステムを指します。。
大手コンビニなどは、このPOSシステムによって大量のデータを分析することで、効率的なマーケティングをしています。例えば株式会社ビジコムなどが、ハードウェアからソフトウェアまでPOSシステムをソリューションとして提供しています。
AI×ビッグデータの将来の展望
なぜ、これほどまでにAI×ビッグデータの可能性に多くの企業や個人、政府までも期待するようになったのでしょう。
AIに関して言えば、機械学習の一技術である「ディープラーニング」によって技術的ブレイクスルーが起きたことにあります。ディープラーニングとは十分なデータ量があれば、人間の指示なく機械が勝手に特徴を読み取ってくれるディープニューラルネットワークを使った仕組みのことです。
これと同時にディープラーニングを含めた機械学習の精度を担保する「データ」がインターネット上を中心に蓄積されてきました。まさにビッグデータです。
ディープラーニングとビッグデータが掛け合わさることで、AIブームが起き、さまざまな分野での事業に活用が進んでいます。
今後は、IoTの更なる普及にも期待されています。IoTは、モノのインターネットと訳され、モノがインターネットに接続されている概念や、その端末自身のことを意味します
スマートフォンから、スマートスピーカー、自動車から、街の信号まで、あらゆるモノがインターネットに接続される未来が訪れると、膨大なデータを集めることが可能になります。
こうやって集められたデータをAIが推論し、そのモデルを搭載したデバイスを社会に送りこむことで、より便利で豊かな社会が形成されることが期待されています。
このように、AIそのものの技術的発展によって分析・推論・予測する能力の上昇と、多様で大量なビッグデータが掛け合わさることで、社会が変わると展望されているのです。
まとめ
AIとビッグデータの活用は、産官学それぞれの立場で注目されています。
AIは、社会に実装していくことで、さらにデータをビッグデータとして集めて、アップデートすることができます。
日本に照らし合わせると、少子高齢化における労働力の代替や、人間の労働量が減るという意味での働き方改革の文脈でも注目されています。
AI先進国になれるように、活用を進めていきましょう。