【特集】Chainerを開発したPreferred Networksのこれから

機械学習の開発の勢いは止まりません。数々のサービスがローンチされてる現在。

2017年もサービスは次々と生み出されています。

全211サービス!「AIサービスマップ 2017 Summer」9カテゴリ132サービス増加 ~新たな領域での活用に期待~

今後もデータやタスクに、より適した特徴表現の学習ができるプラットフォームの構築が肝心です。層の数が多い複雑なニューラルネットワークモデルでも高速な学習や推論が可能なツールが大切になってきます。

今回、取り上げるPreferred Networksは、その中でも機械学習フレームワークChainerを開発した会社。

2017年5月23日には、マイクロソフト コーポレーションとアライアンスを組むことを発表し話題となりました。

Microsoft×Preferred Networks【DEEP LEARNING LAB】キックオフに行ってきた。

今回は、そんなAI領域で大注目のPreferred Networks(以後PFN)がメディア向け説明会を開催。
この記事ではPFNのこれからについて特集します。

メディア向け説明会に登壇する代表取締役社長 最高経営責任者の西川徹氏

6名での創業から業界をリードする企業へ発展。今後のPFNの行方は!?

最初はtoB検索エンジンを作っていた!?

PFNの前身となるPFI(Preferred Infrastructure)は6名で創業されました。
当時の主な事業は、エンタープライズ向けの検索エンジンで、大手媒体社に導入されるなど、順調に成長していたそうです。

しかし、2010年以降、IoTやディープラーニングのブームがそれぞれ巻きおこりました。それをきっかけにIoTと機械学習、そしてエッジヘビーコンピューティング、この3つの技術に着目して、新たなイノベーションを起こそうと思い、今のPFNをスピンオフしたんだとか。

3つの軸で研究 ・開発を進める

そんなPFNは3つの事業に力を入れています。

PFNが進める3つの事業
・ガン診断(バイオヘルスケア分野)への応用(国立がん研究センターなどとの協業)
・製造業(FANUCと協業)
・自動運転をはじめとする交通システム(TOYOTAと協業)

診断精度99%の乳がん検診

PFNが力を入れる一つの大きな領域。それはバイオヘルスケア分野です。2016年より、国立がん研究センター、産総研と協業し研究を進めています。

従来の乳がん検診は、マンモグラフィーを使うと、その診断精度は約80%、リキッドバイオプシー(血液による診断)では約90%でした。

しかし、PFNが開発する機械学習を応用した血液診断では、その診断精度は99%を上回るそうです。

今実用化に向けて、研究を進めています。

PFNが進める製造業戦略

PFNはFANUCと協業し製造業への機械学習の導入を進めています。
ディープラーニングの世界では、データをいかにして握るかが大事ですが、人が生み出すデータの多くは、GoogleやAmazon, Facebookがほぼ独占しています。

一方で、産業用ロボットは、休むことなくデータを生み出し続けるているものの、生み出された膨大なデータを活用することができていなかったので、製造業へのフォーカスを決断したんだとか。

IoTとディープラーニングを駆使して、製造業でイノベーションを起こすことに注力しています。

具体的な応用事例としては以下があげられます。

・傷検査(精度が高まっている)
・故障予知
・熱変異補正(工作機械の熱量によって加工の精度が変わるため、熱変異補正を行うことで、パラメーターを自動調整できる)
・消耗品の寿命予測
・ばら積み取り出し(箱の中から不特定の物体を取り出す)

Amazon Picking Challengeで世界2位に入賞

製造業の事例では、棚の中からものを取り出す「Amazon Picking Challenge(APC)」において世界2位を獲得しました。ロボットは決まった形状の、決まったところに置かれたものを取ることは得意ですが、倉庫などで扱われる一般物は、いつも決まった位置に置かれているとは限りません。そのため、正確に物体を認識して取り出す技術が必要です。PFNはディープラーニングを物体認識と物体の掴み方に応用し、APCで優秀な成績をおさめました。

YouTubeに動画も公開されていますので、ぜひご覧ください。

IoTによって2020年には200EBのデータ量に。Chainerで実現する並列処理

PFNといえばChainerを連想する人が多いでしょう。
2015年にリリースされたChainerは多くの企業や開発者が利用しています。

今後のディープラーニングの研究開発において重要なものは、フレームワークです。
大量のデータを高速に学習させることが課題になってきます。

特に2020年には、全世界のデータ量が200EB(1EBは10億ギガバイト)にのぼると言われており、そんなビッグデータ時代には、計算機のスペックも相応なものにならなくてはなりません。
そのために必要なのが「並列計算機」だといいます。

また、現在はプレーヤーの多くがCloudを使って中央集約型になっていますが、IoTの時代においては、あらゆるモノに知能をもたせ、分散知能を実現するエッジヘビーコンピューティングも重要になってきます。

オープンソースの深層学習フレームワーク「Chainer」

ニューラルネットワークの設計・学習・評価などの深層学習を用いた研究開発に必要となる一連の機能を提供しています。

Chainerは動的に計算グラフを構築する“Define-by-Run”を採用した初めての深層学習フレームワーク。

Define-by-Runの利点

今後のPFNの技術開発の方向

PFNの研究開発における領域

基礎から応用まで幅広い分野で研究に取り組みます。

計算リソースにおける今後の技術開発の方向性

今後はPFNは、まず技術開発において“計算リソース”の確保に力を入れます。

また、画像認識音声認識、自動運転など、今後学習に必要な計算リソースが桁違いに大きくなります。

現状のPFNの計算環境は3ペタ flops(300GPU)程度(Googleは数万GPUを使っていると推定。スーパーコンピュータ京は10ペタ flops)です。
それを、2019年〜2020年には1エクサ DL ops近くを確保できるようにするといいます。
今後、大規模な計算環境を自由に、簡単に、高コストパフォーマンスで使えるかが差別化要素の一つとなります。

学習済みモデルにおける今後の技術開発の方向性

今後重要となってくる研究課題としては以下が挙げられます。

  • 学習済みモデルのトレーサビリティ(あとで組み合わせたときに追跡できるか)
  • 最適な学習済みモデルの探索
  • 複数の異なる学習済みモデルの融合
  • 学習済みモデルの圧縮・最適化(組み込み機器に乗るようにサイズ。計算コストともに減らす)
  • 学習済みモデル+差分プライバシー(元のデータの情報がもれないことが理論的に保証される)

エッジヘビーコンピューティング

今後、データ量が増大すれば、データを一か所に集めて処理するクラウドコンピューティングだけでは破綻する時代が来ます。

加えて、リアルタイム性や可用性がますます重要になってくるため、PFNは「エッジヘビーコンピューティング」を提唱しています。

ネットワークデバイス・エッジデバイスにも高度な機械学習のアルゴリズムを搭載し、分散協調的に機械学習を行うことで、大量のデータの処理をリアルタイムで行い、たくさんのデバイスを「賢く繋げる」ことができます。

Chainerの今後の予定

深層学習の研究は世界中でものすごいスピードで進んでおり、フレームワークとして、最新の論文で提案された新しい機能をスピーディに取り入れていくことが必須です。
→3ヶ月ごとのメジャーバージョンアップを行います。

2017年9月26日にはChainer v3のリリースを予定しており、Windowsの公式サポートも行う予定です。

おわりに

機械学習開発の障壁はChainerをはじめとしたプラットフォームの構築により、敷居がグッと下がりました。
今後も、より手軽でハイパワーなプラットフォームが構築されることで、国内外での機械学習の開発スピードは一段と上がることでしょう。

今後のPFNのバイオヘルスケア、自動運転、製造業における活躍にも期待です。

おざけん
ディレクター。可能性を秘めたAIが正しく社会に実装されるようにメディアとしてサポートします。技術だけでなく、どのようなユーザ体験を生み出せばAIが生活に溶け込んでいけるのか。シンギュラリティにむけ、産業や国を超えた活発な議論を促進していきます。趣味はカメラ撮影。

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する