テキスト特化、数十件のデータで解析を |独自のアルゴリズム「Landscaping」を取り入れたAIエンジン「KIBIT」

最終更新日:

「第3次AI(人工知能)ブーム」という言葉が、メディアに取り上げられるようになってから、かれこれ5年ほどになります。AIを使っているというサービスは世の中にたくさんあり、連日ニュースになっていますが、まだAIがどのように使われているか、自分達がどう使ったらいいかよくわからない、という人もいるでしょう。また、会社で「AIを使って何かやれ」と言われたが、行き詰まってしまった、という話も多く聞かれます。

FRONTEOは、国際訴訟支援や不正調査からスタートし、自然言語処理*1を行う独自のAIエンジン「KIBIT(キビット)*2」を2012年に開発し、7年近い自社での活用と4年以上の外部へのAIソリューションの提供を行っています。ここでは、AI活用の出発点から、身近な「テキストデータ」を解析するプロセスを知って頂き、知識から実践に進むきっかけを掴んでいただければと思います。

AIの活用には、まず「データ」

AIの強みをあげるとすると、「処理の早さ」があげられます。第3次AIブームが起こったのは、「ビッグデータ」と「コンピューティングパワー」の発達のおかげと言われていますが、現代はまさに「データの世紀」。昔の大型コンピュータ並みの処理能力を持ったスマートフォンを1人1人が持ち、そのデータがクラウド上の大規模なシステムに集められることで、一昔前には考えられなかった解析ができるようになっています。(ただし、データが多ければ良い訳ではありません。後ほど説明します。)

このようなデータが無ければ、AIを動かす意味も、強みである「処理の早さ」を発揮することもありません。また人間が目で見て、パッと判断ができるぐらいの内容や少ない量であれば、AIを使う必要はありません。「簡単に人が見られない大量のデータ」をどう扱うかがAIの活用の始まりです。

AIが扱うデータには色々なものがあります〈図1〉。
ここではテキストデータに着目してみましょう。あなたが「スマホからクラウド上に集められたビッグデータ」を持っていなくても、普段仕事をする中で使っている身近なものもAIに与えるデータになります。

図1: AIが扱うデータ

FRONTEOは、2016年度から2017年度のAIによる国内言語解析市場でシェア1位を達成※1していますが、この「言語解析」で扱っているデータとは主に「テキストデータ」で、その多くが身近なものです。会社で日々やりとりしているメールや毎日書いている文書、電話での会話をテキストに変換したもの、面接の記録、ネットサービスへの書き込みなど、さまざまなテキストデータ〈図2〉が存在し、FRONTEOが独自に開発したAI「KIBIT」が解析を行っています。

※1:株式会社アイ・ティ・アールの市場調査レポートによる

図2: さまざまなテキストデータ

近年、「デジタルトランスフォーメーション(DX)」が広く唱えられるようになっていますが、これはまさに日々接している身近な行動や取組みをデジタル化し、ICT、IoT、AIの力を使って、生活や産業、社会の構造や仕組みを変えていこうとする動きです。

AIを使う目的、目指す「成果」は?

次に重要なのは、AIを活用する目的、どんな成果(アウトカム)が欲しいか、です。
データを集めても、何のために、どう使うのか決まっていなければ、AIは活用できません。“AIを使うことが目的”となっている場合や、“PoC(概念検証)で傾向を出すことはできたけれど、その次にどうしたらいいかわからない”ケースの多くは、目指す「成果」の設定が曖昧なことが多く見られます。FRONTEOのAI「KIBIT」が日々行っている言語解析では、〈図3〉のような成果を得ることを目的に、2019年5月16日時点で累計176社の企業に活用されています。

図3: 多岐にわたる「成果」

最適な機械学習の選択

「データ」と目指す「成果」が固まったら、次は、最適な機械学習の手法を選択します〈図4〉。

第3次AIブームは「ディープラーニング」がもたらしたと言われています。「ビッグデータ」と「コンピューティングパワー」の発達がディープラーニングの特性とマッチし、従来無かったブレークスルーをもたらしました。

一方で、ディープラーニングは万能ではなく、データの種類や目指す成果によって得意・不得意がある、とも言われています。機械学習手法の選択には、その他にも導入・稼働までに必要な時間、ランニングコスト、学習プロセス、精度を出すためのチューニング、さまざまな要素をトータルに考えて、運用・実装までを見据えた設計を行う必要があります。

図4: 最適な機械学習の選択が活用のポイント

FRONTEOのAI「KIBIT」は、「Landscaping(ランドスケイピング)」という独自のアルゴリズムを用いています。テキストデータに特化し、少量の教師データで解析を行うことができます。さらに、導入までの時間が短く、大規模な計算リソースが不要で、処理が軽いことが特徴です。

このような準備や選択を行って、AIを導入したら、具体的にはどんな成果が得られるのだろう?と考えられると思います。

図4: 最適な機械学習の選択が活用のポイント。成婚退会とは、選んだ相手との結婚を前提に会員紹介サービスを終了することです。

FRONTEOは、2014年より企業にAI「KIBIT」によるAIソリューションを提供しており、目的や目指す成果に応じて〈図5〉のような結果が出ています。

図6: KIBIT活用領域

ここまで説明を行った要素とKIBITの活用領域は、〈図6〉のとおりです。
次回は、KIBITの仕組みやプロセス、ビジネス領域での活用例について説明していきます。

自然言語処理技術について詳しくはこちらから

FRONTEOのKIBIT(キビット)について

FRONTEOは、自由に記述された自然言語を、文章の構造に基づいて分析する技術の開発を進めています。社会に存在する、価値のある多様な文章に対応可能な自然言語処理関連技術を有しています。

FRONTEOが独自開発した日本発のAIエンジン。人間の心の「機微」(KIBI)と情報量の最小単位である「ビット」(BIT)を組み合わせ、「人間の機微を学習できるAI」を意味しています。学習・評価を担うAI関連技術Landscapingとデータ分析の現場を通じて、集積・体系化された行動情報科学を組みあわせ、人に代わって判断や情報の選び方を再現することができます。

 

 

2019年5月24日 2019年5月27日更新

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する