最終更新日:
ディープラーニング技術の本当の面白さとはなんでしょうか。
精度を競い合うだけの戦いに終始していませんか。
今、DataRobot社が提供するDataRobotやSonyが提供するNeural Network Consoleをはじめ、プログラミングを伴わずにAI(機械学習)のモデルを構築するノーコードのサービスが多く登場しています。
AINOWでは50以上のプログラミング不要なAI構築ツールを記事としてまとめています。
プログラミングが不要でAIを構築する機会が誰にでも提供される今、ディープラーニングの面白さをより手軽に感じることができるようになっています。
今回の記事では、ギリア株式会社 代表取締役社長兼CEOの清水亮氏の取材を通し、ディープラーニングの本来の面白さについて迫ります。
目次
ノーコードのGUIツールが普及 ーわざわざ毎回プログラムを書くのは効率が悪い
かつてAIを作るためにはプログラミング技術が必須でした。
AIベンチャーの多くは設立者がプログラミングの知見を持ちCEOとCTOを兼任しているケースが多いことが特徴です。まさにこのプログラミングの知見の有無がAIを構築する上での明暗を分けていたのです。
しかしAIの技術が発展するにつれてその開発工程の共通項を取り出しツールとして利用できるようにする流れが生まれてきました。データ分析から画像認識のモデル構築まであらゆる領域をサポートするGUIツールが生まれ、大きな潮流となっています。
ーーこの潮流についてどのように感じていらっしゃいますか?
AIの研究者だけでなく他の分野の研究者や専門家といった方々がAIを活用するフェーズに入ってきている中で、当然の潮流だと思います。
ディープラーニングのアルゴリズムは、ほとんど差がなくなっています。みなさんが驚かれるようなアルゴリズムは、年に数回しか生まれてきません。
しかし、アルゴリズムが新しくなくても、組み合わせや使い方が新しいだけで、さまざまな発見があり、仮説につながっていきます。
そのときに、わざわざプログラムを毎回書くのは効率が悪いです。だからこそGUIツールが必要になっていると思います。
例えば、私がとある仕事をやっていたときに、プログラマは毎回手でコードを入力していました。何ヶ月も学習させてもうまくいかず、私が現場に行って調べたら設定ファイルを書き間違えていたことが原因ということがありました。
GUIの環境であれば、そのようなミスは起きず、「おかしいな」と思ったらすぐに別の仮説を試すことができます。
法律家や医師など、コンピュータを扱うのがそれほど得意ではない専門家の方々も日々の業務に積極的にAIを活用していきたいという気持ちがあるのではないかと思います。
プログラミング不要のGUIツールはエンジニア以外にもAIモデルを構築する機会を開放し、AIの活用をさらに進めるきっかけとなるでしょう。
しかし、現実には多くの企業が目的が曖昧なままAIを活用するために受託開発の企業探しに奮闘し、AIのプロジェクトを立ち上げるケースが多いという現状があります。
もし、多くの企業でGUIツールが活用されれば、その領域の知識に富んだプロフェッショナルが独自のAIを構築することで、ビジネス的な成果につなげることが可能です。企業内のさまざまな面で事業が大きくスケールする可能性にもつながります。
また、企業内のAI開発担当者が、GUIツールを通して、AIを構築する仕組みを学ぶことで、大きな受託開発案件の成功につながるきっかけにもなります。
GUIツールを活用して「まずは試す」精神を大切にしていくことが重要です。
楽器感覚のディープラーニング構築ツール「Deep Analyzer」
2018年12月からギリア株式会社はマウス操作不要でディープラーニングのモデルを構築することができるサービス「Deep Analyzer」の提供を開始しています。
ーーDeep Analyzerの開発に至ったのはなぜですか?
2014年頃にディープラーニングと出会い、「これは面白い」と思って会社の隅っこにあったPCに秋葉原で買ってきたGPUを入れて夢中になって回し始めたんです。
しかし、ディープラーニングは、一台のマシンが学習している間はなにもできないので、会社のマシンに片っ端からGPUを入れたものの、徐々にカオス状態になってきました。
あちらこちらのマシンにログインしてコマンドラインを書いていると、どのマシンをどのような設定でどんな学習をさせたのかがわからなくなってしまい、困りました。
そうした経緯から、コマンドラインの記述作業をGUIツールに落とし込めば、自分も楽ができるのではと考えました。
僕にとってAIはパートナーなんですよね。まだ未熟ではあるけれども、仕事を一緒にやっていく仲間。AIとバンドを組んでるような感覚です。
その意味では、ギターみたいに深いことを考えなくても適当にジャーンって弾けばとりあえず音が出るみたいな、そういう楽器感覚のGUIツールを作ってみようと思ったことがきっかけです。
ーー時代の流れとしては、データ分析が簡単にできるExcelの延長線上のようなツールも生まれている中、Deep Analyzerはディープラーニングに特化されています。その理由を教えてください。
データ分析は、基本的に一回実行したら「なるほどね」という感じで終わるものが多いと思います。「弊社のお客様はどのような人たちなんだろう」とデータを学習させて、分析したり相関関係を出したりクラスタリングしたりするのですが、その結果をみて「ふーん」と思って終わりです。
これが日々データドリブンで売上だの利益だのに直結する業種は、それほど多くないと思っています。
また、何よりデータ分析ツールは、統計の専門家が使わなければあまりインサイト(洞察)が得られません。
だから、Deep Analyzerはデータを分析するというよりも、まず「こんなの学習できるのかな?」「あれ、もうちょっと精度上がらないかな?」と、さまざまなパラメータを試して試行錯誤するような使い方を想定しています。
AIの本当の面白さ ープログラムを書くよりまず”試せ”
ーー清水さんが感じる本当のAIの面白さとはなんでしょうか。
最近のAI関連のニュースは、性能が上がったという話題が多く、本来のディープラーニングの面白さに欠けていると思います。
ディープラーニングの面白さは「え、こんなこともできるの?」という発見があることだったはずです。
予想を超えてくること。自分で手を動かすとわかるのですが、「これは学習できるだろう」と思って学習させたデータが、「なんじゃこりゃ」っていう感じになることもある。そこが単純にもう面白いですね。上手くいったらいったで、物凄く楽しいし気持ちいい。こういう「AI勘」っていうのは自分で直接AIを育ててみて、育てることから掴み取っていくしかないので、そこがもう最高に楽しいですね。
AIは本来、もっと色々な職業の人が様々なことに使えるはずです。そのためにアイデアを試して、インスパイアする感覚は、まさにAIと人間が一緒に呼吸をしている感覚です。
寝る前に「これをやってみよう」と学習させ始めて、翌朝「こうなるのか」という発見が毎日あります。
ーー実際のプロダクトのきっかけになったことはありますか?
たくさんありますよ。
例えば、僕にはネットに上がっているアイドルの画像を集めるというかなり無意味な趣味があったのですが、10年くらい溜めていると、かなり巨大なデータになるわけです。一応、ジャンル分けとかしていましたが、見返すわけでもなく、ただ漠然と集めていました。
あるとき、ディープラーニングが出てきて、これを分類させてみようと思いました。バカバカしいですが、そうすると僕とアイドルの好みが同じAIができるわけです。そのうち、落書きの絵からアイドルの顔を生成してみようと試していたら「フリーフォーマットの伝票に書かれた文字を読み取りたい」という仕事がきました。
落書きの目の部分に実際のアイドルの目を生成させるというタスクと、フリーフォーマットの伝票に書かれた「名前っぽい」文字を抜き出すというタスクって全く同じなわけです。それがもとになって、株式会社シグマクシス様と共同で開発に取り組み、フリーフォーマットの文字認識ソリューション 「ディープシグマDPA」が生まれました。同じ原理の応用で、高精度写真からコンクリートのひび割れを見つけ出す「ディープシグマCRACK」という製品もあります。いずれも、現在も銀行業・保険業・建設業など、社会の第一線で毎日使われています。
私の自宅には3台のDeep Station(ディープラーニングに特化した高性能PC)があり、リモート環境用にさらに2台あります。その環境の中でずっと様々な仮説を試しています。逆説的ですが、あるものを学ぶためにはまずは楽しめないといけません。マインクラフトは誰も遊び方を教えなくても勝手に勉強します。
ーーそこから発想を転換していくことが大切なんですね。
はい。本来であればブロック崩しをAIが勝手に攻略しても「それがどうした」となってしまいますが、その一見つまらないような事実を「じゃあマインクラフトにも使えるのかな」と試してみることがAI的な発想だと思います。
何気ない好奇心が思わぬ問題解決に繋がるのは推理小説の主人公になったみたいで非常にスリリングです。
Deep Analyzerでは、音声分類を追加しましたが、普通に考えると「小鳥の鳴き声を分類できるかな」などの発想で始まります。それが「スポーツカーの排気音を聞かせて調子がいいかどうかがわかるかな?」「誰が喋っているのか分類できるかな?」「男女の分類ができるかな?」みたいに興味が増えていくと面白いです。
ーープログラムを書く以上に、AIの使い方の視点の重要性が高まっているんですね。
ギリアでは、ある仕事の依頼が来たときに、「面白い」という要素がなければ引き受けません。スリリングではいし、成長できないと思っています。
仕事のご依頼を引き受ける際に「面白い」といえる要素があるかが重要なポイントになります。そこにスリリングな面がなければ、成長につながらないと思っているからです。
AIを活用するための「勘」を鍛えるには、毎回プログラムを書くことに時間を使っていてはダメなのです。とにかくデータを集めて作って、サイクルを回すことに労力を割かなくてはなりません。
ミュージシャンを目指すのに音響工学の勉強をする人はあまりいないと思います。音や音波という概念を知らなかった人でも歌や音楽を楽しんでいるように、AIを本当に使うにはミュージシャンの側にいかないとダメだと思います。
これからのAI ー直感に基づく判断が機械化されていく
ーーこれからのAIについてどう変動していくと考えていますか?
画像認識系のAIは完全にコモディティ化していて、今はもうどこのものでも大差ないというところまできていると思います。
小型化・省電力化の流れは今後も続いていくのでしょうが、AIそのもの活躍の場ということで期待が大きいのは深層強化学習や最適化問題です。
実際、ギリアでは、昨年からご依頼案件の中心が深層強化学習と最適化問題に移行してきています。業界でも珍しいと思いますが、深層強化学習が実現するものというのは、要は「直感の機械化」ですから、ビジネスにはあらゆるレイヤーで「直感に基づく判断」ということがなされてきています。
これにより、それまでは属人的だったことがどんどん機械化されて、誰でも「冴えた営業マン」や「冴えた人事部長」になれるような世界が実際にやってきています。
Deep Analyzerも、画像だけでなく音声も扱えるように進化してきていますが、これはまだAIの真価の入り口の段階に過ぎません。ただ、画像を直感的に分類できるというのは「直感の機械化」としてわかりやすいし、「どのようにして機械が直感を獲得するのか」を体験的に学ぶ方法としては、Deep Analyzerはかなり有効な手段です。
ーー今後の展望を教えてください。
昨年発表された政府の方針で、2025年までにすべての大学のすべての学科で人工知能に関する科目が必修化されることになりました。Deep Analyzerは、こうした一般の学生が教養としてAIを体験的に学ぶのに最適なツールとして好評をいただいています。
今後学生がAIを体験的に学んでいくことで、日本中の大学で「AI勘」を持った人材が生まれてくると、日本のAIの社会実装は一気に進むのではないかと期待しています。
ギリアでは創業以来、AIを社会実装すること、最近では特に深層強化学習に力を入れてきました。
その成果がようやく見えてきたのは昨年頃からです。これからのDX時代では深層強化学習が企業の競争力の源泉になると考えており、引き続き力を入れていきますが、最近では自然言語の深層学習の成果も目覚ましく、個人的には深層強化学習の次は自然言語学習が飛躍的に発展する時代が到来すると思っています。
企業の中は自然言語だらけですから、ここからいかにして知見を得るか、最先端の事例を踏まえながら日々研究しているところです。自然言語の深層学習に対応したツールも現在準備中です。これからAIはもっと面白くなります。
■AI専門メディア AINOW編集長 ■カメラマン ■Twitterでも発信しています。@ozaken_AI ■AINOWのTwitterもぜひ! @ainow_AI ┃
AIが人間と共存していく社会を作りたい。活用の視点でAIの情報を発信します。