ディープラーニングはすでに限界に達しているのではないか？【前編】

著者のThomas Nield氏は、アメリカ大手航空会社サウスウエスト航空のビジネスコンサルタントを務めているとともに、SQLやRxJavaに関する入門書をオライリーから出版しています。同氏が長文英文記事メディアMediumに投稿した記事では、第3次AIブームともいわれるディープラーニングの流行に関して警鐘を鳴らしています。

AIの歴史を振り返ると、推論や検索に基づいた第1次AIブーム、エキスパートシステムの開発が流行した第2次AIブームがありましたが、これらのブームが終息した原因は共通していると同氏は考えます。その原因とは、AIに対する過度な期待とその期待に便乗したAIの誇張です。つまり、AIで実現可能なことを実際より大きく見せることで期待を煽りますが、その期待に応えられない度にブームが終息してきた、というわけです。そして、同氏は今日のディープラーニングの流行によって火がついた第3次AIブームにも、かつて行われた煽動と誇張を見ます。

現在のAIブームに煽動と誇張を見る同氏は、この流行は2019年から2020年にかけて終息すると主張します。この主張の根拠として、ディープラーニングの進化を加速するはずの学習データが不足していること、さらにはディープラーニングをもってしても計算複雑性理論から見て解決困難な問題は依然として解決が難しい、といったことを挙げます。そのうえで、AIを正しく活用するためにはディープラーニングの効用を妄信せず、個々の問題にあったAI技法を適用することを説いています。

今日のAIブームに関しては、調査会社ガートナーが発表した「日本におけるテクノロジのハイプ・サイクル：2018年」において「人工知能」が「ブロックチェーン」ともに幻滅期に入ったことが話題になりました。その一方で、「シンギュラリティ（技術的特異点）」を唱えたレイ・カーツワイル氏が人工知能は順調に進化していると発言したことが報じられており、現在進行形のAIブームの行く末に関しては予断を許さない、というのがもっとも穏健な見方かも知れません。

以下の前半記事では、ディープラーニングの流行に至るまでのAIの（失敗に満ちた）歴史を振り返ります。

もうひとつの「AIの冬」が訪れるのではないだろうか？

画期的だった1965年の「MAC Hack VI」チェスプログラム（訳注：MAC Hack VIとは史上初めてチェスの世界トーナメントに出場したチェス・プログラム。4回トーナメントに出場し、通算3勝12敗3引き分けだった。）

多くのヒトがアルゴリズムが意識的認知を備えている人類を超越したと信じている。機械はヒトの介入なしに仕事を識別して学習し、一挙に労働者にとって代わるだろう。機械はまさに文字通り「考える」ことができるようになったのだ。多くのヒトが配偶者のためにロボットを所有できるだろうか、と思い悩みさえするのだ。

以上のことは、現代における発言ではない。もし以上のアイデアが1960年代のAI市場において流布しており、AIの先駆者であるJerome Wiesner、Oliver Selfridge、そしてClaude Shannon（※註1）がこうしたアイデアが近い将来実現すると主張していた、と伝えたらどう思うだろうか。こうしたことに驚きを禁じ得ないのなら、以下の動画を見ると「AIがヒトを超越する」というような文句と似たような発言があることに驚愕するだろう。

（※註1）Jerome Wiesner（ジェローム・ウィスナー：1915-1994）はマイクロ波レーダーの研究で知られ、後にニコラス・ネグロポンテと共同でMITメディアラボを創設した。Oliver Selfridge（オリバー・セルフリッジ：1926-2008）は機械学習に関する先駆的研究で知られており、「機械知覚（Machine Perception）の父」とも呼ばれる。Claude Shannon（クロード・シャノン：1916-2001）は、今日のデジタル文化の基礎となる情報理論の考案者である。

（訳注：上の動画では、汎用目的機械（general purpose machine）という言葉が使われ（再生時間1:00前後）、そのような機械の実現につながる研究としてボードゲームのチェッカーやチェスに言及されている。）

時は流れ1973年、AIは再びブームとなったが誇張も流布し、ついには非難されることとなった。イギリス議会は、James Lighthill卿にイギリスにおけるAI研究の現状を報告するように依頼した。報告されたレポートは、人工知能研究はその研究が標榜するセンセーションな主張に応えることに失敗していると非難した。興味深いことに、翻ってLighthill卿は特定の分野に特化したプログラム（あるいはヒト）は「AI」より良いパフォーマンスを示しており、もはやAIは現実世界の環境において何ら利益をもたらさないと指摘した。こうした経緯から、イギリス議会はAI研究への投資をキャンセルしたのだった。

イギリスとは大洋をへだてたアメリカでは、アメリカ国防総省がAI研究に関して多額の投資を受けていたが、イギリスで見られたのと似たようなAIに対する不満からほぼすべての投資がキャンセルされた。その不満とはAIの能力は誇張されており、高いコストの割には見返りがなく、現実世界において価値あるものかどうかは疑わしい、というものだった。

1980年代には、日本で第5世代プロジェクトというAIに関する大胆な挑戦が熱狂とともに試みられた（編集後記：Toby Walsh氏は修正をうながすコメントをしてくれた：イギリスの研究者は日本の第5世代プロジェクトに反応して、1980年代にAlvey Project を再び行った）。しかし、日本のプロジェクトは8億5,000万ドルの損失を出して失敗に終わったのだった（※註2）。

（※註2）第5世代コンピュータのプロジェクトに言及している。同プロジェクトは1982年から1992年まで続き、ヒトの知能を超える人工知能の開発を目標としていた。同プロジェクトの成果物として並列推論マシンが開発されたが、そのマシンを活用したソフトウェアが開発されなかったため、新たなコンピュータ市場を創出することなくプロジェクトは終了した。しかし、AI研究に巨費が投じられたことで、人材育成には寄与したと言われている。

目次 [非表示]

最初のAIの冬
AIとはいったい何か？
AIルネサンス？

最初のAIの冬

1980年代の末にはAIの冬が訪れた。AIの冬とは、「人工知能」の研究において納品の失敗やサンクコスト（※註3）がかさんだために、組織や政府を炎上させたコンピュータサイエンスの暗黒時代のことである。こうした失敗によって、AI研究が何十年にもわたり葬られていた。

（※註3）サンクコスト（sunk cost）とは「埋没費用」とも訳される経済学の用語。事業等に投資した資金や労力のうち、事業を途中で撤退あるいは縮小しても回収できないものを意味する。行動経済学においては、サンクコストを回収しようとして成功する見込みのない事業に投資し続けることを「サンクコストの誤謬」や「コンコルド効果」と呼ばれる。

Fortune 500に選ばれるような企業は、しばしば実用的なAI使用事例よりもFOMOの気持ちに動かされて巨額の予算を組んだ。つまり、AIによって自動化された競合他社に遅れを取らないかと心配していたのだ（本記事より引用）。

1990年代の終わりまで「AI」は残念な言葉となっており、そうした印象は2000年代にも続いた。「AIなんて動かない」という認識が広く受け入れられていたのだ。うわべは知的に見えるプログラムを作っていたソフトウェア企業は、「探索アルゴリズム」や「ビジネスルール・エンジン」、そして「オペレーション・リサーチ」のような用語を使うようになっていた。こうしたプログラムを活用した素晴らしいツールは実のところAI研究に由来していたのだが、こうしたツールはAIという言葉を使わないようにリブランディングされたのだった。というのも、AIという言葉を使えばビジネスで成功するというより大きな目的を果たせなくなるからだ。

しかし、2010年あたりから何かが変わり始めた。AIに対する関心が急速に大きくなり、画像をカテゴリー別に分類するコンペティションがメディアの目にとまったのだ。シリコンバレーは大量のデータのうえに築かれていたので、役に立つニューラルネットワークを作るのに十分なデータが初めて揃ったというわけなのである。

2015年までには、「AI」研究はFortune 500（※註4）に選ばれるような企業の多くに巨額の予算を要求するようになった。こうした企業は、しばしば実用的なAI使用事例よりもFOMO（※註5）の気持ちに動かされて巨額の予算を組んだ。つまり、AIによって自動化された競合他社に遅れを取らないかと心配していたのだ。結局のところ、ニューラルネットワークに画像のなかのオブジェクトを識別させることは、AI研究を代表する印象的なことに過ぎないのだ。そして、一般人にとっては、SkyNet（※註6）のようなAI能力は次の時代のモノでしかないと思われた。

しかし、以上のようなAIの新たな流行は、はたして真のAIにいたる歩みなのだろうか。それとも今回のAIの流行は何百もの成功している使用事例によって盛り上がっているが、いずれ冬を迎え歴史は繰り返すのだろうか。

（※註4）Fortune 500とはアメリカのビジネス誌『Fortune』が年に1回発表するアメリカ企業のランキング。ランキングは公開された総収入に基づいている。ちなみに、直近の2018年のランキングでは1位が小売業最大手のウォルマートであった。

（※註5）FOMOとは「fear of missing out」の略語で、直訳すると「取り残されることへの恐れ」を意味する。SNSの普及以降、友だちやライバルが発信する情報を見て、遅れをとっていないかと気にする傾向が拍車がかかったことからこの略語が生まれた。対義語には「Joy of missing out」の略語であるJOMOがあり、直訳すると「見逃すことの喜び」となる。JOMOはSNS依存症にもつながるFOMOの対抗概念として唱えられた。

（※註6）Skynet（スカイネット）とは、映画『ターミネーター』シリーズに登場するAIのこと。同AIは自我や意識を持ち、自己に敵対すると判断した人類の殲滅を企てる。同AIや同映画に登場する殺人ロボットは、しばしば人類に敵対するAIのメタファーとして言及される。

AIとはいったい何か？

長いあいだ、わたしは「人工知能」という用語を決して好きにはなれなかった。この用語は曖昧でありながら大仰でもあり、科学者よりはマーケティング畑の連中によって定義されたものである。もちろん、マーケティングとバズワードはポジティブな変化をかき立てるうえで不可欠なものである。しかし、バズワードによるキャンペーンは不可避的に混乱へと導かれるものだ。わたしの新しいASUS製スマホには「AI着信音」機能がある。この機能は、周囲の雑音が響くなかでも聞こえるように着信音の音量を動的に調節するものだ。私には一連のif条件文によってプログラムされたもの、あるいは単なる線形的な関数として機能するに過ぎないものが「AI」と呼ばれているのではないか、とさえ思われるのだ。結局、世間のAIの理解とはこんなものなのだ。

AIの定義が幅広く議論の的になっていることはなんら驚くことではない、というのは明らかだ。わたしは、AIとは非決定論な答えをもち、なおかつ／あるいは不可避的なエラーの余地がある問題を解決するもの、というGeoffrey De Smetの定義が好きだ。この定義は、機械学習から確率や検索に関するアルゴリズムを実行するツール一式を幅広く含んでいる。

また、AIの定義は進化するので革新的な開発による成果しか含まれず、（光学的特徴の認識あるいは言語の翻訳のような）昨日の成功はもはや「AI」によるものとは考えられない、と言われることもある（※註7）。それゆえ、「人工知能」とは相対的な用語であり、決して絶対的な定義などないのだ。

（※註7）「AI効果」と呼ばれる現象について言及している。AI効果があるために、AIの社会的貢献が過小評価されているという指摘もある。検索アルゴリズムにもAI研究の成果が生かされているが、検索エンジンをAIと見なすユーザは少ないだろう。

ここ数年は、「AI」はしばしばこの記事が焦点を当てようとしている「ニューラルネットワーク」と関連づけられている。ニューラルネットワークのほかにも、（単純ベイズ分類器、サポートベクターマシン、XGBoostといった）機械学習から検索アルゴリズムにわたるAIによるソリューションは存在している。だがしかし、ニューラルネットワークこそが、おそらく現在もっとも熱く語られ技術的トレンドとなっているのだ。もし読者諸氏がニューラルネットワークについてより学びたいなら、わたしがYouTubeに投稿した以下の動画をご覧頂きたい。

もしニューラルネットワークに関して、以上の動画より完全な解説を求めているのならば、以下に引用するGrant Sandersonが投稿したニューラルネットワークに関する一連の動画をチェックして頂きたい。

AIルネサンス？

2010年以降にAIブームが復活したのは、ひとえにAIがあるひとつの新しい種類のタスクを習得したおかげである。そのタスクとは分類だ。より精確に言えば、ニューラルネットワークのおかげで科学者たちは画像や自然言語を含むほとんどのタイプのデータを分類する効率的な方法を開発したのだ。自律自動車でさえ、クルマの周囲を撮影した画像が（給油、ブレーキ、左折、右折、etcといった）相互に独立したアクションに翻訳されていると見ることができるので、分類のタスクを実行していると言えるのだ。自律自動車がどのように分類のタスクを実行するかに関する単純化されたアイデアを知りたい場合は、ビデオゲームAIを作る方法を紹介しているこのチュートリアル動画をご覧頂きたい。

私見では、自然言語処理は純粋な分類より印象的である。自然言語処理を実行するアルゴリズムは意識を持っているのではないかと容易く信じられてしまうのだが、自然言語処理について注意深く勉強すれば、この処理は意識が組み込まれた思考というよりは言語のパターンに依存していることがわかる。こうした自然言語処理は娯楽的な結果をもたらすこともでき、例えば詐欺メールに対してヒトのふりをしてユーザに代わって対応するボットのようなものもある（以下の動画を参照（※註8））。

（※註8）ニュージーランドのセキュリティ企業Netsafeは、11月7日、詐欺メールに返信し続けるチャットボット「Re:Scam」を発表した。このボットは、詐欺メールに対して返信し続けることで詐欺による被害を予防すると同時に、詐欺師に時間を浪費させることで間接的に反撃できる。

もっとも印象的な自然言語処理による芸当はGoogle Duplexである。この機能は日時の約束のような特定のタスクをAndroidスマホがユーザに代わって電話で行うものだ。しかしながら、この機能が実行するタスクのためにGoogleが「AI」を訓練して構造化し、そしてコーディングさえしていると考えるべきなのだ。たしかにこの機能で実行されるフェイクの通話のなかには「ああ」や「えーと」といった自然な中止音声が含まれている。しかしこの中止音声も言語のパターンにもとづいて実行されているに過ぎず、実際の知性や思考によるものではないのだ。