AIとビッグデータの関係と、社会をどう変えるか?

AIやビッグデータと聞いて何を思い浮かべますか。安倍晋三首相が2019年1月のダボス会議で「成長のエンジンはもはやガソリンではなくデジタルデータで回っている」と述べたように、ビッグデータの大きな可能性が注目されています。

この記事では、AI・ビッグデータとは何か。2つの関係。そして、どう社会を変えると言われているのかを解説します。

AIとビッグデータの密接な関係

AI、ビッグデータとはどういう概念でしょうか。その関わりまで解説していきます。

AIとは

AIとは、日本語で人工知能を指します。人工知能と言ってもさまざまです。「何となく頭の良い機械」から、統計的な手法を用いてデータを分析する技術まで、非常に幅広い概念です。

例えば、人工知能の研究者は以下のような定義をしています。

京都大学 長尾真 氏

ー人間の頭脳活動を極限までシュミレートするシステムである

ドワンゴ人工知能研究所 山川宏 氏

ー計算機知能のうちで、人間が直接・間接に設計する場合を人工知能と呼んでいいのではないかと思う

東京大学 松尾豊氏

ー人工的に作られた人間のような知能、ないしそれを作る技術。人間のように知的であるとは、「気づくことのできる」コンピュータ、つまり、データのなかから特徴量を生成し現象をモデル化することのできるコンピュータという意味である。

出典:(出典)松尾豊「人工知能は人間を超えるか」(KADOKAWA)p.45

人工知能」という言葉は話す人や、文脈によって意味を捉える必要があります。ビッグデータの関連で言えば、機械学習など、データからコンピュータに学習させる手法。もしくは、学習させたモデルを搭載した機械と考えれば良いでしょう。

ビッグデータとは

ビッグデータは文字通り、巨大で複雑なデータ集合を示す用語です。しかし、一元的な定義は存在していません。現在では、数十テラバイトから数ペタバイトの範囲であると言われています。しかし、処理するコンピュータの向上によってその定義も変わってくるでしょう。

ビッグデータという概念の普及は、業界のアナリストであるダグ・レイニーが3つのVを使って定義したことにはじまり、現在にまで引き継がれています。

  • Volume(量)
    • データの膨大さ
  • Velicity(速度)
    • リアルタイムで種集できるデータ
  • Variety(多様性)
    • 多様なデータの形式

参照:https://blogs.gartner.com/doug-laney/files/2012/01/ad949-3D-Data-Management-Controlling-Data-Volume-Velocity-and-Variety.pdf

単なる量ではなく、多様性や速度も定義に触れてるのが興味深いです。

また、鈴木良介氏は著書「ビッグデータビジネスの時代」の中で、「事業に役立つ知見を導出するためのデータ」とビッグデータを定義し、より目的を重視しました。

総務省も、ビッグデータの量的側面だけでなく、質的側面。例えば、データの多様性などにも留意すべきと記しています。

ビックデータを構成する各種データの例

  • マルチメディアデータ
    • ウェブ上の配信サイトの音声・動画
  • ウェブサイトデータ
    • ECサイトやブログサイトの履歴など
  • センサーデータ
    • デバイスが検知する位置、温度など
  • オペレーションデータ
    • 販売管理等の業務システム上に蓄積されるデータ
  • ログデータ
    • ウェブサーバーで自動で生成される、アクセスログなど
  • オフィスデータ
    • オフィス文書、Eメールなど
  • カスタマーデータ
    • CRMシステムで管理される、会員データなど
  • ソーシャルメディアデータ
    • SNSに書き込まれるプロフィール、コメントなど

出典:http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h24/html/nc121410.html

ビッグデータが注目される背景にはインターネットの上の情報量の増加があります。例えば、この記事を見るうえでもデータは蓄積されています。何歳のどのような人が見ているのか、どのくらいの時間、記事を見ているのか、などがデータとして記録されています。

このようにインターネットのサービスの普及と発展がビッグデータ時代の到来をもたらしています。

AIとビッグデータの関係

AIとビッグデータでは非常に深い関係があります。

実際にAIはどのように開発されるのでしょうか。AIの活用方法として、例えば自動翻訳があります。

Google翻訳では、私たちが入力した言語を他の言語に翻訳して返してくれます。それは、これまでの対訳データ(例えば日本語の「私」が、英語だと何に当たるか)を大量に使って統計的な処理を施すことになっています。

また、画像認識ではどうでしょう。画像認識はAIの典型的な応用分野の一つです。画像から「何が映っているか」を特定することが可能です。

この画像認識も大量のデータが必要です。例えば犬か猫を判別するモデルを作りたい場合は、それらの画像を大量に利用します。

このように、AIを開発するには膨大なデータが必要で、AIブームはビッグデータが蓄積されていたから起こったとも言えます。

AIとビッグデータが変わる社会の展望

孫正義氏はSoftbank World2019の基調講演で以下のように言及しています。

人類はいろんなものを推論しながら、あんなふうになれたらいいな、自分たちの将来の姿を変えると思って推論してきながら進化をしてきました。人間の持っている推論するという力は進化の最も大きな源泉になっていると思います。

(中略)

私はさらに加速していくと思います。そもそもデータは、コンピュータにデータを食べさせているのですが、インターネットの上に流れているデータの量はこの30年間で約100万倍になりました。ここから先の30年間で、どのくらいになるのか、私は推論します。もう一度100万倍になるということです。

(中略)

AIが一番得意なこと、これを一言で言い表すなら、AIは「プリディクション(予測)」に最も適した役割を果たします。「AIになにかものを考えてください」と言っても「考えるってなんなの?」となってしまいます。今から5分後、1日後、3日後に起きることを予見する、これをやらせるとAIのほうが人類よりもはるかに得意だと言われる時代が目の前にあります。

出典:https://ainow.ai/2019/07/18/173607/

これはビッグデータとAIが掛け合わさった時の、さらなる可能性に期待していると解釈できます。

AI×ビッグデータの可能性に期待される理由

なぜ、これほどまでにAI×ビッグデータの可能性に多くの企業や個人、政府までも期待するようになったのでしょう。

AIに関して言えば、機械学習の一技術である「ディープラーニング」によって技術的ブレイクスルーが起きたことにあります。ディープラーニングとは十分なデータ量があれば、人間の指示なく機械が勝手に特徴を読み取ってくれるディープニューラルネットワークを使った仕組みのことです。

これと同時にディープラーニングを含めた機械学習の精度を担保する「データ」がインターネット上を中心に蓄積されてきました。まさにビッグデータです。

ディープラーニングとビッグデータが掛け合わさることで、AIブームが起き、さまざまな分野での事業に活用が進んでいます。

今後は、IoTの更なる普及にも期待されています。IoTは、モノのインターネットと訳され、モノがインターネットに接続されている概念や、その端末自身のことを意味します

スマートフォンから、スマートスピーカー、自動車から、街の信号まで、あらゆるモノがインターネットに接続される未来が訪れると、膨大なデータを集めることが可能になります。

こうやって集められたデータをAIが推論し、そのモデルを搭載したデバイスを社会に送りこむことで、より便利で豊かな社会が形成されることが期待されています。

このように、AIそのものの技術的発展によって分析・推論・予測する能力の上昇と、多様で大量なビッグデータが掛け合わさることで、社会が変わると展望されているのです。

ビッグデータを使ったビジネスの事例

実際にビッグデータを使ったビジネスはどのようなものがあるでしょうか。事例をみて考えていきましょう。

経済情報分析|xenoBrain

xenoBrainは、膨大なニュースから市場変化を予測するサービスです。1つ1つの経済情報は、複雑に絡み合っています。その関係を分析することで、ある事象が起きた時、どのように経済や産業情報が変化するかを予測します。

使われているデータ

  • 経済ニュース
  • 決算情報

アナウンサー|株式会社Spectee

AIアナウンサーは文章を与えると、人間のようになめらかに読み上げてくれるサービスです。有名なものは「荒木ゆいです。」PR担当者が作成したブログに、仕組みが書いています。(https://www.wantedly.com/companies/spectee/post_articles/144117)。それによると、声優さんの声を何十時間分もサンプリングしたうえで、単語や文章をどう読ませるかを学習させたとしています。

使われているデータ

  • 声優の声
  • アナウンサーが原稿を読んでいる音声データ
  • 上記に対する原稿
  • 「荒木ゆい」が実際に読んだときのデータ

胡麻信用|Alipay

胡麻信用とは、中国の決算システムにであるAliPayの一つの機能です。人の信用に度合いを「学歴」「勤務先」「資産」「返済」「人脈」「交際」の6つの項目によって、どれだけ信頼できるかを計量化しています。

13億人を超える人口を抱える中国では、ほとんどの支払いがスマホで行われています。彼らが全ての購買がデータとして蓄積されることによって可能になったサービスです。

自動FAQ|OKAWAVE

Q&Aサイト「OKAWAVE」を運営する株式会社オウケイウェイヴは、数億件のQ&Aデータを分析して、自動的にFAQ(質問とその回答)化するシステムを開発しました。

オリジナルブロックチェーン上に展開することで、FAQ作成者の著作権を保護・管理できるとしています。

サイバーセキュリティ|サイバーセキュリティクラウド

株式会社サイバーセキュリティクラウドは、ディープラーニングを用いた攻撃検知AIエンジン「Cyneural」を開発しています。

5000サイト以上に、サイバーセキュリティサービスを提供しており、8000億件以上のデータ数を保有しているとのこと。

この膨大なデータを学習させることで、高度化しているサイバー攻撃に対して、未知のサイバー攻撃の可能性が高いアクセスを発見・検知することが可能なエンジンの開発を実現したとしています。

レジ|株式会社ビジコム

POSシステムを聞いたことはありますか?

POSシステムとは、レジで会計をするだけではなく、「いつ誰に何がどのくらい売れたか」をデータとして管理し、分析できるようにしたシステムを指します。。

大手コンビニなどは、このPOSシステムによって大量のデータを分析することで、効率的なマーケティングをしています。例えば株式会社ビジコムなどが、ハードウェアからソフトウェアまでPOSシステムをソリューションとして提供しています。

おわりに

AIとビッグデータの活用は、産官学それぞれの立場で注目されています。

AIは、社会に実装していくことで、さらにデータをビッグデータとして集めて、アップデートすることができます。

日本に照らし合わせると、少子高齢化における労働力の代替や、人間の労働量が減るという意味での働き方改革の文脈でも注目されています。

AI先進国になれるように、活用を進めていきましょう。

2019年10月4日 2019年10月4日更新

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する