【特集】Chainerを開発したPreferred Networksのこれから

最終更新日： 2019年7月10日

機械学習の開発の勢いは止まりません。数々のサービスがローンチされてる現在。

2017年もサービスは次々と生み出されています。

全232サービス！「AIサービスマップ 2017 Summer」9カテゴリ132サービス増加～新たな領域での活用に期待～

今後もデータやタスクに、より適した特徴表現の学習ができるプラットフォームの構築が肝心です。層の数が多い複雑なニューラルネットワークモデルでも高速な学習や推論が可能なツールが大切になってきます。

今回、取り上げるPreferred Networksは、その中でも機械学習フレームワークChainerを開発した会社。

2017年5月23日には、マイクロソフトコーポレーションとアライアンスを組むことを発表し話題となりました。

今回は、そんなAI領域で大注目のPreferred Networks（以後PFN）がメディア向け説明会を開催。
この記事ではPFNのこれからについて特集します。

メディア向け説明会に登壇する代表取締役社長最高経営責任者の西川徹氏

目次 [非表示]

6名での創業から業界をリードする企業へ発展。今後のPFNの行方は！？
IoTによって2020年には200EBのデータ量に。Chainerで実現する並列処理
- オープンソースの深層学習フレームワーク「Chainer」
今後のPFNの技術開発の方向
おわりに

6名での創業から業界をリードする企業へ発展。今後のPFNの行方は！？

最初はtoB検索エンジンを作っていた！？

PFNの前身となるPFI（Preferred Infrastructure）は6名で創業されました。
当時の主な事業は、エンタープライズ向けの検索エンジンで、大手媒体社に導入されるなど、順調に成長していたそうです。

しかし、2010年以降、IoTやディープラーニングのブームがそれぞれ巻きおこりました。それをきっかけにIoTと機械学習、そしてエッジヘビーコンピューティング、この３つの技術に着目して、新たなイノベーションを起こそうと思い、今のPFNをスピンオフしたんだとか。

3つの軸で研究　・開発を進める

そんなPFNは3つの事業に力を入れています。

PFNが進める３つの事業
・ガン診断（バイオヘルスケア分野）への応用（国立がん研究センターなどとの協業）
・製造業（FANUCと協業）
・自動運転をはじめとする交通システム（TOYOTAと協業）

診断精度99%の乳がん検診

PFNが力を入れる一つの大きな領域。それはバイオヘルスケア分野です。2016年より、国立がん研究センター、産総研と協業し研究を進めています。

従来の乳がん検診は、マンモグラフィーを使うと、その診断精度は約80%、リキッドバイオプシー（血液による診断）では約90%でした。

しかし、PFNが開発する機械学習を応用した血液診断では、その診断精度は99%を上回るそうです。

今実用化に向けて、研究を進めています。

PFNが進める製造業戦略

PFNはFANUCと協業し製造業への機械学習の導入を進めています。
ディープラーニングの世界では、データをいかにして握るかが大事ですが、人が生み出すデータの多くは、GoogleやAmazon, Facebookがほぼ独占しています。

一方で、産業用ロボットは、休むことなくデータを生み出し続けるているものの、生み出された膨大なデータを活用することができていなかったので、製造業へのフォーカスを決断したんだとか。

IoTとディープラーニングを駆使して、製造業でイノベーションを起こすことに注力しています。

具体的な応用事例としては以下があげられます。

・傷検査（精度が高まっている）
・故障予知
・熱変異補正（工作機械の熱量によって加工の精度が変わるため、熱変異補正を行うことで、パラメーターを自動調整できる）
・消耗品の寿命予測
・ばら積み取り出し（箱の中から不特定の物体を取り出す）

Amazon Picking Challengeで世界2位に入賞

製造業の事例では、棚の中からものを取り出す「Amazon Picking Challenge（APC）」において世界2位を獲得しました。ロボットは決まった形状の、決まったところに置かれたものを取ることは得意ですが、倉庫などで扱われる一般物は、いつも決まった位置に置かれているとは限りません。そのため、正確に物体を認識して取り出す技術が必要です。PFNはディープラーニングを物体認識と物体の掴み方に応用し、APCで優秀な成績をおさめました。

YouTubeに動画も公開されていますので、ぜひご覧ください。

IoTによって2020年には200EBのデータ量に。Chainerで実現する並列処理

PFNといえばChainerを連想する人が多いでしょう。
2015年にリリースされたChainerは多くの企業や開発者が利用しています。

今後のディープラーニングの研究開発において重要なものは、フレームワークです。
大量のデータを高速に学習させることが課題になってきます。

特に2020年には、全世界のデータ量が200EB（1EBは10億ギガバイト）にのぼると言われており、そんなビッグデータ時代には、計算機のスペックも相応なものにならなくてはなりません。
そのために必要なのが「並列計算機」だといいます。

また、現在はプレーヤーの多くがCloudを使って中央集約型になっていますが、IoTの時代においては、あらゆるモノに知能をもたせ、分散知能を実現するエッジヘビーコンピューティングも重要になってきます。

オープンソースの深層学習フレームワーク「Chainer」

ニューラルネットワークの設計・学習・評価などの深層学習を用いた研究開発に必要となる一連の機能を提供しています。

Chainerは動的に計算グラフを構築する“Define-by-Run”を採用した初めての深層学習フレームワーク。

Define-by-Runの利点

今後のPFNの技術開発の方向

PFNの研究開発における領域

基礎から応用まで幅広い分野で研究に取り組みます。

計算リソースにおける今後の技術開発の方向性

今後はPFNは、まず技術開発において“計算リソース”の確保に力を入れます。

また、画像認識、音声認識、自動運転など、今後学習に必要な計算リソースが桁違いに大きくなります。

現状のPFNの計算環境は3ペタ　flops(300GPU）程度（Googleは数万GPUを使っていると推定。スーパーコンピュータ京は10ペタ　flops）です。
それを、2019年〜2020年には1エクサ DL ops近くを確保できるようにするといいます。
今後、大規模な計算環境を自由に、簡単に、高コストパフォーマンスで使えるかが差別化要素の一つとなります。