カーツワイルの「GNR」に「I」(情報科学・情報工学)が含まれていない理由を考える

nodo画像:fontlab

目次

レイ・カーツワイルの「GNR」論

「G」・「N」・「R」の頭文字をもつ3つのテクノロジーによって、私たちが暮らす社会の構造と、人々の宇宙観・世界観・人生観・社会観は、今後、決定的な飛躍の年である「2045年(頃)」に向けて、根底から地殻変動を起こして、大きく様変わりしていく—。

そのような近未来社会へのロードマップ(展望)を提示している「未来論」があります。

その「未来論」は、カーツワイル氏の「GNR」論・「シンギュラリティ」論として、知られているものです。

その3つのテクノロジーとは、「遺伝子編集技術」(Genetics)と「ナノ・テクノロジー」(Nano-technology)、そして「ロボティックス」(Robotics。AI搭載型の自律行動ロボット制作技術)です。

上記の「GNR」論は、米国の未来学者であり、発明家・起業家であるレイ・カーツワイル氏(Ray Kurzweil, 1948年2月12日~)によって、2005年に提案されました。

この「GNR」論(「シンギュラリティ」論)は、これまで「ムーアの法則」として知られてきた半導体技術(計算基盤技術)の進歩が、これまでの「指数関数的」な「加速度」を維持したまま今後も続いた場合、2045年頃に、人間の脳と同じだけの演算処理能力(単位時間あたりの演算数で見た能力)を持つか、それを上回る計算能力を持った計算機が、ハードウェアとして実現すると論じるものです。

なお、カーツワイル氏は、人間1人の脳が行っている知的情報処理を、ニューロンやシナプスひとつひとつを計算機上で「完全に」模倣するためには、ハードウェアとして、毎秒およそ$$10^{19}$$回の演算を行うことができる演算能力をもったコンピュータが必要になると見込んでいます。カーツワイル氏は、複数の状況証拠に基づいた異なる研究が一致してたどり着いた推定値として、この$$10^{19}$$cpsという数字をあげています。

人間ひとりの脳が、毎秒何回分の演算処理を行っているのかを推定した(複数の)方法については、『ポスト・ヒューマン誕生』(NHK出版)のpp.130-134で、説明されています。

また、”ニューロンやシナプスひとつひとつを計算機上で「完全に」模倣する”のではなく、単に、外から見て、人間一人の脳が行う知的な思考作業と、「機能」面で同等な情報処理を(思考する仕組みは人間と異なっていても)模倣することだけを追求するのであれば、必要な演算量は、毎秒およそ$$10^{16}$$回($$10^{16}$$cps)にまで、3桁減らすことができるであろうと分析しています。

カーツワイル氏は、計算基盤のコンピュータ技術(ハードウェア面でのコンピュータ技術)がこのまま「指数関数的」に進歩していくと、2025年には、毎秒$$10^{16}$$回($$10^{16}$$cps)の演算速度をもつコンピュータが登場するだろうと見ています(同書、p.134)。そして、いくつかの技術的なシナリオによって、2020年あたりまで、このスケジュールは前倒しされる可能性も十分にあることをあわせて言い添えています。

そして、同書 p.149では、物体(がもつ膨大な数の原子それぞれがもつ特徴の数である「量子数」–物質の「量子状態」を区別するために必要となる条件の数–を、演算を行うための物理的な手段として最大限に利用した結果、1kgの質量をもつ物体を用いて、「過去1万年間の全ての人間の思考(1万年の間の100億人の脳の働きに想定される)に相当する計算を、10マイクロ秒で実行することができる」「究極のポータブルコンピュータ」が、2080年には「1000ドルで買えるようになっていると推測されている」という予想をし提示しています。

以上は、「ハードウェア」面でのコンピュータ技術の将来推定です。

他方で、「ソフトウェア」である「アルゴリズム」(知的情報処理を行う「手順」。考える「手順」)についても、2045年頃までに、人間が物事を考え、判断し、創造的な思考を行う仕組み(原理・アルゴリズム)が、fMRIなどの観測機器による「脳」の「スキャンニング」技術の進歩によって解明されるものと予想しています。

そして、解明された人間の思考の仕組みを「機能的」に模倣する人工知能モデルも、「カオス・ニューラルネットワークモデル」の進歩によって登場するだろうと論じています。

このように、ハードウェア(計算基盤)の面でみても、ソフトウェア(計算アルゴリズム)の面でみても、21世紀の半ばごろには、人間と同等か、それを上回る能力を持つ知的情報処理が計算機上で行われるようになるという見立てを提出しているのです。

そして、この「予測」がもたらす帰結として、人工知能(AI)の知性が人類の知性を凌駕するようになり、人類は、生物学的な知力の限界を、テクノロジーによって克服することができるようになるという結論(未来像)を、提出しています。

その上で、そこから先の社会のありよう(あり方)や人々の死生観・人生観・宗教観が、どのような光景になるのかは、いまから想像するのは難しくなる。

そのような、そこから先の状態を見通すことが難しい決定的な変化点・変曲点・時代の断絶点(面)を表す言葉として、「シンギュラリティ」(「特異点」)と言う言葉を用いているのが、カーツワイル氏の「シンギュラリティ」論です。

(この「シンギュラリティ」論では、「自己意識」に目覚めたAIの誕生も予測されています)

このような「近未来像」を提示する「シンギュラリティ」論は、レイ・カーツワイル氏が2005年に出版した『シンギュラリティは近い』(”Singularity is Near”。邦訳書の標題は、『ポスト・ヒューマン誕生』(NHK出版))のなかで、提出されたものです。

同書の中では、すでに述べたコンピューティング技術と、GNR技術の飛躍的な進歩によって、例えば、脳から四肢のつま先まで、人間の体を貫いて流れる毛細血管の中に、(「ナノ・テクノロジー」によって生み出される)超小型の「ナノ・ボット」(「人工知能」を搭載している)を注入しておくことで、人間の脳神経系に対して、脳の中から、直接、働きかける方法で、その人物に「仮想現実」を体験させたり、その人の知的能力を拡張したり、血管中の「ナノ・ボット」が、血中物質の変化を検出することで病の兆候を捉えたり(「病の早期発見」)、(ナノ・ボットの中に格納されたナノ・スケールの)薬を放出することで病の芽を早い段階で摘み取ったりする(「病の早期治療」)することで、健康寿命を伸ばすことが可能になると述べられています。

さらに、健康寿命を伸ばすだけでなく、人間のDNAの塩基配列を組み替えることで、老化現象が発生しない、理論上、不老不死の肉体を設計することもできるのではないか、というところまで、踏み込んだ「将来予測」を展開しています。

このような例を挙げながら、同書は、「N」・「G」・「R」の頭文字をもつ「遺伝子編集技術」(Genetics)と「ナノ・テクノロジー」(Nano-technology)、そして「ロボティクス技術」(Robotics)の3つの技術によって — これら3つの技術が「三本の矢」として、相乗作用を起こしていくことで—、今後、世界中の人々の宇宙観・世界観・人生観・社会観から、世界各国の社会と経済のあり方までもが、根本的に変貌を遂げていくという「GNR」論を展開しているのです。

「GNR」論・「シンギュラリティ」論を貫く歴史観:すべては、「生き延びる」力の向上のために

なお、カーツワイル氏の「GNR」論・「シンギュラリティ」論は、ある明確な歴史観を伴っています。

その歴史観とは、宇宙開闢以来、現在に至り、さらに2045年頃を”決定的な飛躍の年”として挟みながら、ずっと先の未来まで、この宇宙は、「情報パターン」(=生命誕生までは無機物。生命誕生後は生命体)が、「カオス」としての生育環境の中で自らの構造を保ち、「生き延びる」ための力を終始一貫して高めようとして、進化を繰り返す過程である、というものです。

「GNR」論・「シンギュラリティ」論の根本テーマ:歴史とは、「生き延びる力の向上」を追い求める「秩序」増大の軌跡である

この世界観は、”Singularity is Near”(邦訳書『ポスト・ヒューマン誕生』)の中では、次のような形で表明されています。

宇宙が誕生してから、今日まで(そして、さらに未来に向けて)、「陽子・中性子・電子の発生」の後に「原子の誕生」が続き、さらに「高分子の誕生」がそれに続き、「有機物の誕生」が起き、それから「単細胞生物が誕生」し・・・といったように、「進化」は、「複雑さ」を増しながら、発展してきました(そして、未来に向けて、さらに「複雑さ」を増していく)。

しかし、「複雑さ」の増大は、この進化の軌跡という物語にとって主題(本質)ではないと論じられます。

そうではなく、上でみてきた宇宙開闢以来の「進化」の軌跡は、「情報パターン」が、より高次の「秩序」を備えた「パターン」へと、常に一貫してみずからを発展させてきた軌跡である、とされます。

この「秩序」については、邦訳書『ポスト・ヒューマン誕生』(NHK出版)の59ページにおいて、「秩序とは、目的にかなった情報のことである秩序を測る基準は、情報がどの程度目的にかなっているかということだ。」と定義されます。

そして、その「目的」がなんであるのかという点については、先の文に続けて、それは、「生命体の進化における目的は、生存だ」、と宣言されるのです。同書の63ページ目では、「生き延びること」と、表現されています。

このあと、本記事で説明するように、カーツワイル氏は、ミクロ・スケールで見た物質の組成構造も、DNAを織り成す塩基対の配列も、人工知能搭載型ロボットの頭の中で処理される「特徴情報ベクトル」(後述)も、その本質はすべて、(記号の配列)「パターン」、「情報パターン」である、と捉えています。

カーツワイル氏の「GNR」論・「シンギュラリティ」論は、この「情報パターン」が、(情報量も秩序も持たない)「カオス」たる宇宙の中で、カオスに侵食されずに、(意味を担う)みずからの「情報パターン」を維持し、カオスな宇宙の中で「生き延びる」力を、たえず向上させていく歴史である。そう、捉えているのです。

2045年頃:「人間」的な要素を宿した「人間を超える知性体」の力を借りて、「人間」が「生き延びる」力は、さらに「強化」される

今後、2045年頃に誕生するであろう、人間よりも優れた知性を具備するに至った”機械の生命体”は、2018年現在の人間より、「生き延びる」力に長けた「生命体」であるという結論が導かれます。

ここで、カーツワイル氏は、人間 vs. 機械という構図が出現するのではなく、人間は、この「機械知性」を活用することで、「強化」され、人間自身の「生き延びる」力が増大していくのだと、論じています。

これは、例えば、

  •  [N] 原子レベルのサイズのナノ・ボットが、人間の身体の中に入り込んで、
  •  [G] 人間の遺伝子を修正したり、
  •  [R] 病気の兆候をとらえて(ナノ・ボットに搭載された人工知能アルゴリズムによって察知する)、ボット内に格納されていた薬のうち、最適(とAIが判断した)な薬を選んで、選択的に(患部に向けて)放射すること

で、実現されます。

まさに、N・G・Rの3つの技術(テクノロジー)が相乗効果を起こすことで、こうした未来が実現されるという展望が描かれるのです。

こうして、2045年(頃)以降、人間は、生物学的な進化の力によってではなく、(新たに)「テクノロジーの進化の力」を借りることによって、「進化」=「生き延びる力の増大」=”「人間」という「情報パターン」の「秩序」の度合いの上昇”、を追求していく(新しい歴史の段階に突入する)というのが、カーツワイル氏の所論です。

「生き延びる力」の増大に向けた動きとして、最重要なのは「R革命」による「知能」(「賢さ」)の増大である

カーツワイル氏は、宇宙という「カオス」環境のなかで、(みずからの)「生き延びる力」を増大させようとして、「秩序」の度合いを高めていく当事者のうち、「全宇宙でもっとも強い『力』である」(『ポスト・ヒューマン誕生』p.253)ものは、「知能」(「賢さ」)であると述べています。

その上で、この「知能」をもたらす『R(ロボット工学)』は、上記の意味で、「21世紀前半」に「同時に起き」るであろうG・N・Rの「3つの革命」のうち、「もっとも力強い革命」であり、「いちばん重要な変革」であると指摘しているのです。

以下、253ページ目の該当箇所を引用します。

 そして、今まさに起きようとしているもっとも力強い革命は「R(ロボット工学)」革命である。人間並みのロボットが生まれようとしており、その知能は、人間の知能をモデルとしながら、それよりはるかに優れている。知能とは全宇宙でもっとも強い「力」であるため、R革命はいちばん重要な変革となる。知能は発達し続けると、いずれは前途に立ちはだかるどんな障害も予知し乗り越えられるほどに、言うなれば、賢くなる。

 

「GNR」論には、なぜ情報工学の「I」が含まれていないのか?

ところで、ここで一歩立ち止まって考えてみると、この「GNR」には、なぜか、「情報技術」(情報科学、情報工学, Information Technoogy)の「I」の字が、含まれていません。

ここで、「シンギュラリティ」論の立論構成が、「ハードウエア技術」と「ソフトウェア技術」という2つの「コンピューティング」技術(=「情報テクノロジー」)によって、”人間と同等か、それ以上に優れた知性を持つ(知的)情報処理”を行うことができる「コンピュータ」が(技術的に)生み出されるというストーリー(シナリオ)を骨組みとするものであったことを思い出すと、「GNR」に、「情報技術」(Information Technoogy)の「I」の字が含まれていないことは、不思議に思われるのではないでしょうか。

「シンギュラリティ」論の近未来シナリオを実現させる上で骨組みとなる技術(テクノロジー)は、Information Technology [I] であると、考えることができるからです。

【 2つのコンピューティング技術 】

・ 演算実行基盤(ハードウェア)としてのコンピューティング技術

・人間の知的思考の動作メカニズム(動作原理)を「機能的」に模倣するソフトウェア(アルゴリズム)としてのコンピューティング技術 

特に、「ソフトウェア」(アルゴリズム)としての「コンピューティング技術」である「人工知能(A.I.)技術は、今日、産業界の競争地図から、政治・外交の世界における国家どうしの力関係まで、社会の隅から隅まで、これまでの既成の構造を塗り替えつつある、21世紀の基幹技術であると、ひろく受け止められています。

それにもかかわらず、2005年に提案した「GNR」論には、Information Technologyの「I」が含まれていません。

このことは、当のカーツワイル氏本人が、「情報技術」(I)の業界で、高校生の時から目覚ましいキャリアを築いてきた人物であることを踏まえると、さらに不思議に思えます。

カーツワイル氏は、小学生低学年のころからプログラミングを始めた人物です。そして、高校生の時に、自作したシンセサイザーをテレビ番組で発表すると(当時は、まだ1960年代)、当時の(米国)大統領であったリンドン・ジョンソン米大統領から、ホワイト・ハウスで技術メダルを授与されたことで、社会デビューを果たした「コンピュータ・エンジニア」です。

そして、コンピュータ着技術によって開発した数々の製品とサービスを商用展開するために、複数の企業を立ち上げた起業家でもあります。

このような経歴を持つ同氏は、まさに、今日、「情報産業」(IT業界)と呼ばれている「エレクトロニクス業界」(1980年代あたりに使われた言い回し)で、発明家・起業家として、地歩を築き上げてきたのです。

「R」は、人工知能搭載ロボットを作る技術として、「I」を含んで入るが・・・

『シンギュラリティは近い』を読むと、情報技術(Information Technology)とA.I.(Artificial Intelligence)は、たしかに、「R」の1文字を通じて、「GNR」の3文字の中に、その位置を占めていることは、分かります。

同書の説明では、「R」を頭文字にもつ「ロボティクス」(Robotics)技術は、人工知能を搭載して自律的に稼働するロボットを開発する技術として定義されており、「人工知能」を含むためです。

しかし、「GNR」論が提案された2005年は、まだiPhoneこそ発売されてはいなかったものの(iPhoneの発売は、2007年)、2001年に発売されたiPodは、IT業界のヒット商品となってから、すでに4年が経過しており、A.I.(人工知能)はまだ一般には普及していなかったものの、「IT革命」という言葉は、SONYのAIBOが1999年に発売されて話題となったこともあり、すでに世の中を席捲していました。「IT革命」による「ニュー・(デジタル)エコノミー論」などが、テレビや雑誌で特集番組や特集号が編成されて、話題になっていた時期でもあります。

そう考えると、「R」という1文字を通じてではなく、「GNR」の3文字と同格の位置づけで、もう1文字、「I」の字を加えられなかったことが、不思議に感じられてきます。

なぜ、カーツワイル氏は、「GNR」に「I」の字を加えなかったのでしょうか?

カーツワイル氏とは?

技術が社会をどう変えるのかという考察に、長年取り組んできた人物である

ここで、カーツワイル氏については、すでに簡単に言及しましたが、もう少し、説明してみます。

カーツワイル氏は、未来学者・著述家としては、The Age of Intelligent Machines(1992年)やAge of Spiritual Machines(1999年)などの著書で知られています。

これらの著書を通じて、同氏は、20世紀後半のエレクトロニクス技術の進歩の速度は、年を追うごとに「指数関数的」(exponential)に早まっているという「収穫加速の法則」を提唱しました。

そして、2005年に米国で刊行した『シンギュラリティは近い』(”Singularity is Near”。邦訳書の標題は、『ポスト・ヒューマン誕生』)の中では、エレクトロニクス技術がこれまでの「加速度」を維持したまま進歩していくと、21世紀の中頃(2045年頃)には、コンピュータ・プログラムである人工知能が、「人間を超える知力(知性)」を獲得し、それ以後、人類は、生物学的な知力の限界を技術によって超えるといういまだかつて、人類が経験したことのない未知の時代に突入するという「技術的特異点」(Singularity, シンギュラリティ)を唱えました。

この「シンギュラリティ」論は、人工知能の「威力」に社会的な関心が寄せられているこの15年、人工知能がによって社会が大きく様変わりしていくという将来展望を提示している筆頭人物として、社会から注目を集め続けています。

そのカーツワイル氏は、すでに述べたように、高校生の頃に開発した「楽曲を生成するコンピュータ・プログラム」を、テレビ番組に出演して発表しています。そして、この作品が評価されて、当時のリンドン・ジョンソン大統領からホワイト・ハウスに招かれて技術メダルを授与されています。

その後、さらに複数の技術賞に輝いた後、1999年には、ビル・クリントン大統領(当時)から「アメリカ国家技術賞」(National medal of technology, 1999年)を授与されています。

このように、カーツワイル氏自身が、発明家・起業家として、「アイデア」によって「世界を変える」(井上 健 監訳 『ポスト・ヒューマン誕生』プロローグ)ことを長年、人生のテーマとして追求し、その「テーマ」の中で、数多くの実績を生み出し続けてきたのです。まさに、同氏自身が、当事者として、テクノロジーの進歩を推進することに貢献してきたのです。

「GNR」には、すでに「I」の意味が暗黙的に内在している

カーツワイル氏が「GNR」論を提唱した前述の著書(邦訳本は、『ポスト・ヒューマン誕生』NHK出版)を読むと、G・N・Rの頭文字で(それぞれ)始まる「3つの技術」は、それぞれ、以下を「対象」として取り扱う技術(テクノロジー)として捉えられています。

【 小野寺が考えるGNR技術の「対象」についての解釈 】

  • 「G」の対象・・・世界を変える「行動主体」としての「人体」と「動物」の体
  • 「N」の対象・・・地球環境と宇宙環境をいまある状態にしている「物質」
  • 「R」の対象・・・人間以外の「新たな行為主体」として登場するAI搭載型自律稼働ロボットの頭脳を含む「体」

その上で、カーツワイル氏は、上記の3つの技術が対象として取り扱う客体は、どれも、「情報のパターン」をその本質とする実体であるという立場を、同書の「プロローグ」で、すでに明らかにしています。

以下、「プロローグ」の結びの部分を引用します。

詩人のミュリエル・ルーカイザーは、「宇宙は、原子ではなく物語でできている」と語った。第7章で、わたしは自分のことを「パターン主義者」と論じるつもりだ。情報のパターンこそが現実の根本だと考える人のことをこう言う。
たとえば、わたしの脳や身体を構成している粒子は数週間で置き換えられていく。それでも、これらの粒子が形作っているパターンには継続性がある。物語は、情報でできた意味のあるパターンと見なすことができる。
だから、ミュリエル・ルーカイザーの警句も、そういう観点から解釈することが可能だ。

このように、カーツワイル氏は、「宇宙」も、人間の「脳」も「身体」も、「情報のパターン」を「現実の根本」にして「形作」られている、という見方を提示しています。

小野寺の解釈では、先ほど掲載した「GNR技術の『対象』」である「人体」と「動物」の体と、宇宙を構成する「物質」と、AI搭載型自律稼働ロボットの頭脳を含む「体」を、「情報のパターン」として捉える見方は、具体的には、以下の捉え方をしているのだろうと受けとめています。

GNRという3文字の中に、すでに、「情報パターン」を解読し、書き換える技術という意味での「I」(情報技術)の「本質」が込められている

【 「情報パターン」としての「G・N・R」の客体 】 

・ [G] DNAにおける塩基「A」・「G」・「T」・「C」の配列構造(=A・G・T・Cの「並びパターン」)

・ [N] 物質を構成している原子・分子の立体配列パターン(原子・分子の「並びパターン」)

・ [R] AIロボットの頭脳で処理される「特徴表現ベクトル」における数値の「並びパターン」

これら3つのの「並びパターン」=「情報パターン」を、解読し、さらに、その「パターン」の並びを、意思をもって書き換えていく技術が、「情報解析技術」であり、「情報編集(・改変)技術」としての、遺伝解析技術・遺伝子編集技術(遺伝子組み換え技術)と「ナノ・テクノロジー」と「人工知能技術」であるというのが、小野寺の解釈です。

そして、同書を通じて、GNRの3つの技術は、すべて、「情報パターン=記号の並び順」をその本質に持つ客体(「生命体の脳と身体・体」、「物質」、「DNA」)を解析・解読して、さらに、解読した(既存の)並びパターンを、意思を持って組み替えて、書き換えていく技術という意味合いでは、本質的に共通する技術であると、理解しているように思われます。

これらの技術は、自然界がうみだした既存の「情報の配列構造・配列パターン」を操作し、改変することで、これまで自然界が生み出した生命体の体や物質としては存在しなかった、新しい「肉体」なり「物質」を組成し、作り出していく技術として、捉えているのです。

「G」・・・A・G・T・Cの塩基「配列」のパターンを解析して、意味(=どのようなたんぱく質を組成するのか)を読み取ったり、意味の解読が完了した塩基配列「パターン」を組み変え(書き換え)て、これまで自然界に存在しなかった動植物を生み出すのが、遺伝子解析・編集技術です。

「N」・・・自然界に存在する物質の分子構造を、分子レベル・原子レベルで構造解析したり、(原子レベルの物質の世界で働く物理法則を理解することで)自然界にある物質の原子の並び順を改変することで、これまで自然界になかった新しい物質を生み出すのが、ナノ・テクノロジーです。

なお、「R」については、AIを搭載した自律稼動ロボットは、これまで自然界に存在しなかった客体であるため、自然界には、「書き換える」べき「既存の『並びパターン』」は存在しないのではないか、という指摘を受けるかもしれません。

「R」に関しては、人工知能搭載ロボットが、ある時点で生み出した「特徴表現ベクトル」が、同じ人工知能ロボットによって、リアルタイムに逐次、上書き更新されて、書き換えられていく、という意味です。

人工知能を搭載した自律稼働型ロボットは、「周囲の状況」についての認識内容や、「過去に行った行動内容の効果・価値」と「今後、行うべき行動」についての認識内容を、随時、「特徴表現ベクトル」(=「数値ベクトル」というデータ形式をとる)として自分の計算メモリの中に生み出します。

そして、そのロボットが、「周囲の状況」の「変化」を認識したり、新たな行動を積み上げていくたびに、これらの「特徴表現ベクトル」は、当のロボットによって、書き換えられていくのです。

ロボットは、稼働中に、随時、これらの「特徴表現ベクトル」(=数値の「並びパターン」)を生み出しては、書き換えていきますので、行っていることは、まさに、「情報パターン」(=「数値の並びパターン」=「特徴表現ベクトル」)の生成と書き換えなのです。

以上、見てきたように、「GNR」という標語を構成する3文字のG・N・Rの中には、「『記号』の並びパターン」としての「情報パターン」が持つ意味内容を、それぞれの「情報解読技術」(=遺伝子解析技術、ナノ・テクノロジー、機械学習や深層学習その他の人工知能モデル)を用いて、解析し、解読し、理解(了解・把握)し、さらに、意味を理解し終えた「『記号』の配列順序」を「書き換える」という主題が、含まれているとみることができます。

ところで、このような、「情報パターン」が持つ意味内容を、なんらかの「情報解読技術」を用いて、解析・解読することで、その記号列が担う「意味」(=「情報内容」)を了解・把握したり、意味を理解し終えた「『記号』の配列順序」を「書き換える」という事柄は、「I」(情報処理技術)の主題の本質です。

(なお、ここで、その「並び方」が意味ある「情報」を担う「記号」とは、DNAを構成するA・T・G・Cなどの「塩基」や、物質を構成する「原子」や「素粒子」や、特徴表現ベクトルを構成する「数値」のことです)が含まれています。

このように、G・N・Rという概念の中にはすでに、「I」(情報処理技術)の主題の本質が含まれているのではないかというのが、この記事の受けとめ方です。

この解釈がカーツワイル氏の意図したことと合致するならば、「GNR」に、「I」の字を、ことさらあえてInformationの「I」を頭文字として刻み込む必要性を、カーツワイル氏は感じなかったのではないでしょうか。

これが、私の(現時点での)受け止め方です。

SingularityHubの記事における定義

この「G・N・R」の定義については、カーツワイル氏が発起人の一人として立ち上げたSingularityHubの公式ウェブページに、2016年4月19日付けで掲載された(執筆者はカーツワイル氏とは異なる人物である)ある記事Ray Kurzweil Predicts Three Technologies Will Define Our Future の中では、次の文言で示されています。

  • The genetics revolution will allow us to reprogram our own biology.
  • The nanotechnology revolution will allow us to manipulate matter at the molecular and atomic scale.
  • The robotics revolution will allow us to create a greater than human non-biological intelligence.

この記事を独自に日本語に翻訳したExponential Japanというウェブページの記事「カーツワイルの近未来予測(GNR)」では、上記の「GNR」を定義した文は、次のような言い回しで、日本語に訳出されています。

カーツワイルは、ジェネティクス(G)、ナノテクノロジー(N)、ロボティクス(R)、つまりG・N・R3つを我々の生活を劇的に変えていく革命を率いるものとして定義します。

  • ジェネティクスにより、人間自体をプログラミングできるようになります。
  • ナノテクノロジーにより、分子及び原子的スケールで物質を扱うことができるようになります。
  • ロボティクスにより、人類より優れた知能をつくることができるようになります。

上記のように定義された「GNR」のなかに、「設計情報の解読と書き換え」という主題を見出すのが、この連載記事の立場です。

[ 小野寺による「GNR」技術の解釈 ]

  • [Genetics] 私たち人間を含む生命体(動植物)の「体」の「設計情報」を「解読」し、「書き換え」る技術
  • [Nano-technology] 地球環境を含む宇宙の環境を構成している「物質」の「組成情報を解読」し、ナノ・スケールにおける原子・分子間の時空で働く力学を理解することで、原子・分子レベルで、物質の組成を「組み換え」る技術
  • [Robotics] 人間と同様に、目標をもって物事を判断し、周囲の環境を「情報ベクトル」という情報表現形式で理解し、意味付けを行い、「目標」を達成するために環境に対して能動的に働きかけて、世界を変えていく「自律行動型ロボット」の頭脳と体の設計と構築する技術

上記の定義を述べた文中、「設計情報」という単語は、先述した「情報パターン」(=「記号」の出現(並び)のパターン)と同義の言葉として、用いています。

なお、小野寺の上記の解釈と同内容の捉え方が、すでに「Hatena Blog シンギュラリティ教徒への論駁の書」の2007年11月12日付けの記事である「GNR革命: 生命、物質、情報 第6章」でも提出されています

ここでは遺伝子工学は生命を、ナノテクノロジーは物質そのものを情報テクノロジーの配下に置き、指数関数的な成長を発生させようとする試みであると位置付けることができるでしょう。

上の一文では、「G」と「N」が、「情報テクノロジー」(I)の『配下に置』かれている、という『位置づけ』がなされています。

この「位置づけ」方は、カーツワイルが提示した「GNR」というテクノロジーの概念のなかに、「I」(情報処理技術)の本質である「(設計情報の)解読と編集」という「主題」が、すでに織り込まれているという小野寺の見方と通じるものがあると、受け止めています。

では、情報解析技術の進歩は、GNR技術の発展をどのような形で牽引しているのか?

ところで、上記のHatena Blogの記事は、カーツワイル氏の著書について、次のような問題提起も投げかけています。

カーツワイル氏が主張するあらゆるテクノロジーの指数関数的成長は現在のところ実証的には観察できず、指数関数的に成長しているものは情報テクノロジーに限られています。

小野寺もこの見方に賛同します。

カーツワイルの著書は、単位時間あたりの演算回数や、演算に要するエネルギーの量や放熱量や、計算機が物理空間を占有する空間の大きさ(端的に言うと、計算機のサイズ)といった尺度で評価しうる「演算技術」としての「情報技術」(ハードウェアとしての計算機に関する技術)に、多くの紙幅(ページ数)を割いています。

それと比べると、「記号」の配列(記号系列)が担っている「意味」を「読み解」いたり、意味を理解した記号の配列順序(配列構造)を並び替えることで、これまでになかった新しい「意味」を担う(新しい)記号列を生み出す「情報解析技術」が、「近未来論」として、今後、どのように技術進歩していくのか、という主題には、あまり多くのページ数を割いていないように思われます。

以下、こうした点を丁寧に論じていきます。

カーツワイルにおける「情報技術」は計算技術(Computing)が中心

カーツワイル氏の著書 Singularity is Nearの中で、「情報技術」・「情報テクノロジー」として述べられている文章の大部分は、
記憶メモリと(時間と金銭的コスト当たりの)演算量とデータ転送能力などを評価指標とする「コンピューティング」(計算ハードの技術)であり、データの解析・操作(改変)技術を、人工知能アルゴリズムによって行う「情報処理技術」ではありません。

この「コンピューティング」としては、以下が取り上げられています。

  • ナノ・コンピューティング(炭素原子をらせん状に並べたナノ・チューブ上によるビット演算とデータ記憶等)
  • 「岩」などのありふれた物質(巨大な分子構造体)を構成する個々の原子・素粒子の性質を利用して、計算機として用いる技術
  • DNAコンピュータ
  • 3次元立体構造の半導体構築技術
  • 可逆的な論理回路の組成により、エネルギー消費量がゼロで、熱放射もゼロを達成すうる計算機技術

このように、「情報技術」・「情報テクノロジー」として述べられている文章の大部分は、ハードウェアとしての計算機における「演算技術」としてのInformation Technologyが中心です。

公平を期すと、AI(人工知能)について、カーツワイル氏の著書 Singularity is Nearの邦訳書『ポスト・ヒューマン誕生』(NHK出版)も、たしかに言及してはいます。

それも、327ページ目~378ページ目という、ある程度まとまったページ数を割り当てています。

しかし、そこで述べられているのは、以下を一例とする人工知能アルゴリズムの概説的な紹介であり、「記号」列の解読・組み替え記述としての「遺伝子編集技術」や「ナノ・テクノロジー」や「特徴表現ベクトルを用いる機械学習・深層学習モデルの技術」が持つ、「記号」列の解読能力と組み替え能力が、今後、技術として、どのような軌跡をたどりながら向上・発展していくのかという技術論ではないのです。

【 取り上げられているA.I.手法(アルゴリズム)の例 】

  • マルコフ・モデル
  • ベイジアン・ネットワーク
  • ニューラル・ネットワーク
  • 遺伝的アルゴリズム

同書で述べられているのは、上記のAI手法が、同書出版当時(2005年)に「特化型AI」として、医療業界や人工衛星画像の解析業務、軍事用ロボットの開発現場などの個別の専門領域で、どのように用いられ、力を発揮しているのか、という事例です。

また、自己意識をもつ「強いAI」が、近い将来、どのような形で出現しうるのかについて、展望が述べられています。

上記で取り上げられている人工知能技術との関係で見た時、同書では、G・N・R、それぞれにおける「情報パターン」の解析・解読と操作・改変に、上記の各種の人工知能アルゴリズム(マルコフ・モデル等)が、具体的に、どのように活用されているのかという事柄については、主題的に取り組んでいないように見受けられます。

  • [G] 遺伝情報の解読能力と操作・改変能力の向上に与える、AI技術の影響
  • [N] 分子・原子スケールでの物質の組成の解析能力と操作能力の向上に与える、AI技術の影響
  • [R] 人工知能搭載型(自律稼働型)ロボットの開発能力の向上に与える、AI技術の影響

なぜ、AIによる「情報パターン」の解読・改変は主題的に論じられていないのか?

GNR論を提唱したカーツワイル氏の著書 “Singularity is Near” (邦題 『ポスト・ヒューマン誕生』)は、どうして、計算技術(「コンピューティング技術」)に大半のページ数を費やす反面、「情報解析技術」(AIアルゴリズム)による「パターン情報」の「解読・解析」と「改変」技術については、主題的に論じていないのでしょうか。

「GNR」論を論じた著書の出版年は、2005年である

AIアルゴリズム技術の進展が、遺伝子情報や、物質組成構造、特徴表現ベクトルがもつ「パターン情報」を解読して、操作・改変(編集)する技術(テクノロジー)の進歩に対して、どのような影響を与えているのか、という主題が、明示的に取り上げられていない理由は、この文献が出版された時期に求めることができると考えることができます

カーツワイルが「GNR」論を論じた『ポスト・ヒューマン誕生』の英語原書と日本語翻訳書が出版されたのは、2005年のことでした。

ということは、原稿の執筆が行われたのは、2005年か、2004年になされたことになります。

「ディープ・ラーニング」技術の飛躍は、2012年に起きた

ところで、「ディープ・ラーニング」に世の脚光が集まるきっかとなった出来事が起きたのは、2012年と2013年でした。

まず2012年に、画像認識(一般物体認識タスク)の世界で、「畳み込みニューラル・ネットワーク(CNNモデル)」が驚異的な能力を秘めていることが明らかとなり、世界を驚かせました。

次に、翌2013年には、今度は自然言語(英文)を処理する自然言語処理(NLP: Natural Language Processing)の世界で、個々の英単語が文書(document)の中でどのような意味合いで用いられているのかを、数学のベクトル形式でデータ表現で符号化することができることが認識されました。同時に、個々のベクトル(=個々の英単語)どうしの意味の足し算や引き算をすることができることも知られるようになりました。

この2つの出来事は、A.I.人工知能技術を飛躍的に高めたことで、AIの世界で「歴史的な出来事」として位置づけられています。これらの出来事は、AI技術の産業界における利活用を一気に推し進めることになりました。

2012年:ILSVRCコンテスト & 「Googleの猫」がもたらした衝撃

両年のうち、前者の2012年に起きたのは、「ディープ・ラーニング」アルゴリズムを用いた「CNNモデル」が(画像認識のタスク領域において秘めていた)驚異的な能力の発見と、社会からの注目です。

この年、2012年に開催された「ILSVRC 2012」(物体認識チャレンジ競技会)で、「畳み込みニューラル・ネットワーク(CNNモデル)」を用いたチームが、2位以下のチームが出したスコアを圧倒的に引き離す驚異的なスコアで優勝(Krizhevsky Alexほか(2012) “Imagenet classification with deep convolutional neural networks.” Advances in neural information processing systems”)したのです。

この「2012年」は、『ポスト・ヒューマン誕生』が出版された年(2005年)の7年後です。

また、「2012年」には、「Googleの猫」として知られることになったGoogle社の技術ブログ(と論文)が掲載されるや否や、情報解析の研究者や、情報解析業界のエンジニアたちから、瞬時に注目されるという歴史的な出来事が起きた年でもあります。

「Googleの猫」として知られるようになった出来事とは、以下のようなものです。

Google社はこの年、公式技術ブログ発表論文を通じて、CNN(畳み込みニューラル・ネットワーク)モデルが、「猫の顔」の特長部位を、人間から明示的に教え込まれなくても、アルゴリズムの動きだけによって、自力で(自律的に)見つけ出すことができるた、という解釈に結実する研究成果を公表しました。

具体的には、(「猫」の顔画像を学習させた)CNNモデルの「ある中間層」の「数値の並びパターン」を可視化(数値の値を色に変換した)した結果を、画像として公表したのです。

その画像には、「鼻」や「目」や「耳」などの「猫」の顔の各部位(各パーツ)の「特徴」(輪郭、色合いの変化、など)をとらえた(と、人の目からみて解釈できる)画像が、写っていました。

この「画像」は、CNNモデルが、人間から明示的に教え込まれることがなくとも、アルゴリズムの動きだけによって、自力で、(「猫」を、他の動物や、非生物の事物と見分ける上で手がかりとなる)「猫の顔」の各部位が持つ(複数の)特徴を見つけ出すことができるという「解釈」につながりました。

こうした「自力」で特徴を導き出す能力は、画像認識の領域で提案されてきたそれまでの手法技術は持たない「能力」でした。

(これまでの手法では、人間が識別モデルに対して、「猫を犬と見分けるときは、顔のこの部位に注目しなさい」、でも、「同じ猫どうしを見分けるときには、例えばアメリカン・ショートヘアとペルシャ猫を見分ける場合は、別のあそこの部位をみなさい」というように、識別すべき対象ごとに、注目すべき部位と、属性(色合いなのか、輪郭の形なのか、など)を、ひとつひとつ、人間が定義して、識別モデルに教え込ませなくてはなりませんでした)

CNNモデルが持つこのような驚くべき能力が高く評価されて、CNNモデルは、画像認識タスクの世界で、これまで提案されてきた他の数々の統計的機械学習・パターン認識手法(アルゴリズム)の中でも、抜きん出た能力を持つモデル(手法)として、圧倒的な注目を集めることとなったのです。

2013年:Word2Vecモデルの登場(単語の「分散表現」の時代の幕開け)

さらに、翌年の2013年には、今度は、英語を扱う自然言語処理のタスク領域で、単語の「足し算」と「引き算」を(「特徴ベクトル空間」の中で、ベクトルの加算・減算演算として)行うことができる「Word2Vec」モデルが、Mikolov氏らによって、論文として提案されました。

この「Word2vecモデル」は、2013年に発表された3本の論文の中で、提案されました。

  1. Tomas Mikolovほか(2013), Linguistic Regularities in Continuous Space Word Representations
  2. Tomas Mikolovほか(2013), Efficient estimation of word representations in vector space
  3. Tomas Mikolovほか(2013), Distributed representations of words and phrases and their compositionality

「Word2Vecモデル」の登場によって、画像データだけではなく、英語の文章(における各単語の持つ意味合い)データまでもが、(画像と文章は見た目が大きく異なるにもかかわらず)「特徴表現ベクトル」という、同じ「数値の並び」を持ったデータ形式(ベクトル)で表現できることが明らかになりました。

さらに、この「Word2Vecモデル」は、ベクトルどうしを足し引きしあうことで、「特徴表現ベクトル」によって表現(符号化、・記号化、encode)された2つの事柄(情報エンティティ)の中間にある意味をもつ事柄や、差分に相当する意味の事柄などを、人工的に、(高次元の)特徴空間ベクトル内で、(計算機上でデジタル計算される)数学演算によって、「生成」することが、高い精度で可能であるをも、明らかにしたのです。

ここから、画像や文章だけでなく、他のあらゆる属性を持つデータを、「分散表現」(distributed representation)による「特徴表現ベクトル」という同一のデータ形式によって、表現(encode)することができることが、明らかになりました。

さらに、このようにして得られた「特徴表現ベクトル」どうしを、(符号化する前の)元データの属性が同じ(画像どうし、文章どうし、等)であっても、異なる場合(画像と文章、など)であっても、特徴表現ベクトル空間という「共通の土俵」で、相互に比較したり、演算しあうことができることが、人工知能研究者の間での共通了解になりました。

ここから、「画像」と「音声」、「温度」、「加速度」、「Twitterにおける流行キーワードの頻度分布」といった、属性がまるで異なる(複数の)データどうしを、俯瞰的に(統合的に)解析することで、(属性の異なる複数の手がかりデータから)なんらかの「傾向」を検出・抽出するといった、いわゆる「マルチ・モーダル」タスクに、(「ディープ・ラーニング」以前の機械学習モデルによる手法よりもはるかに)高い精度で、取り組むことにも、道が開けたのです。

この「マルチ・モーダル」タスクですが、一例として、「画像」データと「音声」データを、単一の「ディープ・ラーニングモデル」(深層学習モデル)に入力させて、単一のモデルの中で、統合的に取り扱うことができます。

例えば、”この画像が得られたときには、この音声が流れている”という「画像と音声の対応パターン」を学習させることができます。そのような「対応パターン」を学習させた「ディープ・ラーニングモデル」(学習済みのモデル)に対して、新しい「画像」を入力することで、(学習済みモデルを用いた「推論」が自動的に行われて、)その画像に写っている場所では、画像が撮影された時点で、どのような音が流れていたのかの推定音が、(モデルから出力されて)得ることができます。

上記のモデルについて、詳しくは、Ainowの記事「Googleなど各社は、画像から音響や材質質感・3次元立体映像を推定する技術をどう商用展開するか」を参照してください。

このように、CNNモデルや、Word2Vecモデルなどの「ディープ・ラーニング」手法が、華々しく登場したことで、A.I.(人工知能)技術が一気に飛躍しはじめたのは、『ポスト・ヒューマン』が出版されてから、7年後の2012年(とその翌年の2013年)であったのです。

なお、Google社発のこの「出来事」は、「Googleの猫」として日本では知られており、米国では、その成果をまとめて発表された論文は、「キャット・ペーパー」と呼ばれています。

このあたりのいきさつは、COURRIER誌の記事「グーグル翻訳の礎となった伝説の論文「キャットペーパー」の衝撃 「グーグルと人工知能」最前線│集中連載第4回」が参考になります。

その後、画像認識以外の分野でも、「ディープ・ラーニング」の数々の「威力」を示す論文が次々に学会誌やArxiv.サイトに投稿・査読通過されることとなり、今日の「深層学習」の隆盛につながっています。

このように、2012年と2013年以後、「アテンション」機構を持ったディープ・ラーニングモデルや、Neural Turing Machineモデルや、Differential Neural Computingモデルなどの「外部記憶メモリ」接続型のディープ・ラーニングモデルなど、AIの研究・技術コミュニティで話題となった数々の歴史を画す(epoch makingな)深層学習モデルが、矢継ぎ早に論文として発表されて、AI業界がいまに至ることは、皆さま、ご周知の通りです。

「GNR論」は、ディープ・ラーニング旋風が世に登場する7年前に提唱された

以上、みてきたように、『ポスト・ヒューマン』誕生のなかで、カーツワイル氏が「GNR」論を唱えた2005年から起算して、7年も経ってから起きたのが、「ディープ・ラーニング」アルゴリズムの進展と、その技術的な成果への学会・産業界・一般世論の大々的な注目という社会現象でした。

遺伝子解読・編集技術(「G」)や、ミクロ・レベルの物質の組成構造の解析・操作技術(「N」、ナノ・テクノロジー)や、周囲の状況を「特徴表現ベクトル」によって認識して、行動系列も「特徴表現ベクトル」で(内部的に)表現する自律稼動ロボット(「R」)という「3つのテクノロジー」に対して、情報「解析・改変」技術としてのA.I.「人工知能」技術が、(これまで以上に)飛躍的に大きく影響を与えはじめたのも、カーツワイルが「GNR」論を世に唱えた2005年から数えて「7年後」からであった、ととらえることができそうです。

本連載:ディープ・ラーニングが、GNRの「パターン解読・書き換え」技術の発展に与えつづけている影響を俯瞰する

そこで、この連載記事では、2012年以降に発生した、「ディープ・ラーニングモデル」による「情報解析技術」の急速な進展によって、「G」・「N」・「R」の3つの分野における「情報パターン」の「解読」・「編集・改変」技術が、どのように進展しているのかを、いくつか論文を取り上げながら、具体的に示していくことにしたいと思います。

2012年以降:ディープ・ラーニング技術が、遺伝子配列の解読・編集技術(「G」)の進展に与えている影響

「Genetics」については、このあと「ナノ・テクノロジー」についてのWikipedia(日本語版)の定義を引用する部分で述べるように、「機械学習」や「深層学習」などのAIテクノロジーを用いた「自然言語処理技術」が、DNAの情報解読と編集に用いられています。

このため、小野寺は、「機械学習」や「深層学習」における「自然言語処理技術」の解読技術の進歩(一例として、Richart Socherほかによる構文木型深層ニューラル・ネットワークモデルによる構文解析器の提案を挙げることができます)が、「Genetics」による人間や動植物の「体」の「設計情報」(「脳」の「設計情報」も含む)の「解読」と「編集・改変」技術に、大いに影響を与えているとみています。

遺伝子配列パターンの構文解析と、木構造解析型の深層学習モデル

「名詞句」(NP)や「動詞句」(VP)などが、さらに小さい粒度のレイヤーにある個々の「単語」から構成されると同時に、NPやVPがさらに上位の文(sentence)を構成し、さらに複数のsentenceが、段落(paragraph)を構成する・・・といった、木構造(treee-structure)をもつ記号の配列(パターン)を解析する分野として、「構文解析」という分野(参考1, 参考2)があります。

このような木構造をもつ記号配列を解析するための再起(recursive)構造をもつ(時系列)ディープラーニング・モデルとして、Richard Socher氏が提案したのが、以下の論文です。

ほか、以下の論文も参考になります。

2012年以降の深層学習・機械学習モデルは、遺伝子配列の解読・編集にどう応用されてきたか

この連載記事では、上記の木構造(句構造)をした構文(=記号の配列パターン)の解析に特価した「深層学習」モデルなど、「自然言語処理」分野で開発されてきた「深層学習」モデルや「機械学習」モデルが、「遺伝子工学」(Genetics)の技術を、どのような領域で、どの方向に、どこまで発展させているのかを、個々の論文を引き合いにあげながら、(その一断面・いくつかの諸相を、)垣間見てみることにします。

初回記事の今回は、3つだけ、論文を先取りして紹介します。

「深層学習モデル」を用いて、遺伝子配列の解読・編集に取り組んでいる研究論文を紹介・解説しているウェブページとしては、例えば以下があります。

RSTC (2017年2月25日付け記事)「BioinformaticsとDeepLearningの融合分野の論文調査1」

このウェブページで解説されている論文として、以下があります。

この論文では、CNN(畳み込みニューラル・ネットワークモデル)を用いて、「DNA配列の機能予測」に取り組んでいます。

RSTCのウェブページで取り上げられている論文以外のものとしては、以下があります。

上の論文は、さきほどと同じCNNモデルを、今度は「メタゲノム解析」に活用する技術を開発しています。

また、塩基配列の配列パターンに宿る意味の解読に直接取り組んだ研究以外の分野としては、生物個体の「見た目」をCNNモデルで解析・分類することで、生物の「系統発生図」(Tree of Life, 生命進化の樹形図)の構築に取り組んだ次のような研究も存在します。

上の図(Figure 1およびFigure 2)は、上記のYan Wangほかの論文から転載したものです。

下図(Figure 2)では、3つの円グラフが掲載されています。これは、ResNet(解説はこちら)、VGG(解説はこちら)、AlexNet(解説はこちら)という3つの深層学習モデルを用いて、”bird”や”plant”など、5つの生物familyの系統発生上の距離関係を解析した場合に、それぞれ結果がどうなったのかを円形グラフに表現したものです。

こうした研究の他に、「遺伝子ネットワーク解析」(参考1参考2参考3)に取り組むための特殊な(グラフ構造の記号配列を解析可能な)深層学習モデルの設計に取り組んでいる研究もあります。

遺伝子のどの部分が生物の体を作るために発現するのかが決まる過程では、無数の遺伝子が互いに(ネットワーク上に)相互作用しあう様子を、丁寧に紐解いて考察を行う必要があり、この分野には、「遺伝子ネットワーク解析」という名称が名付けられています。

この「遺伝子ネットワーク」の解析に応用しうる深層学習モデルとして、「グラフ構造」(=ネットワーク構造)のデータの解析に特化した深層学習モデルが提案されているのです。

ナノ・テクノロジー(「N」)と、深層学習モデル及び位相幾何学のTDAモデル

また、「Genetics」と同様に、「Nano-technology」についても、「位相幾何学」を用いた「トポロジカル・データ・アナリシス」(TDA: Topological Data Analysis)その他の情報科学の進歩や、機械学習や深層学習の技術の進歩が、分子スケールでの物質の組成情報の「解読」と「書き換え」(組成構造の操作・変換)技術の進展に与えた影響を見ていきます。

ロボティクス(「R」)と、深層学習やファジイ決定木モデル

最後に、「Robotics」については、Google DeepMind社Vicarious社その他のAIテクノロジー企業によって公開された一群の論文をとりあげることで、深層強化学習その他の情報科学・情報工学技術の進歩が、自律行動型ロボットの設計技術と開発技術に与えている影響の一端をのぞいてみます。

取り上げる「Robocits」にまつわる(要素)技術としては、例えば以下があります。

  •  視覚センサーで捉えた各物体の動きのパターンから、作用している物理運動法則や、各物体の重さや摩擦係数などの物理属性を帰納的(または演繹的)に推定・発見する技術こちらも)
  •  センサーで捉えた物体の位置関係や色の関係(AはBより濃い、など)を認識する技術こちらも)
  •  「物の概念」(机、椅子など)を、視覚的な描像および「それを言い表す人間の言葉」と対応付けて学習する技術
  •  学習済みの複数の概念を論理的に考えて組み合わせることで、センサーを用いて観測したことのなない「未経験」の事物の概念を、抽象的な思考空間の中で想像・創造する技術
  • 人間の身の動作を1度みただけで、動作の目的を理解し、同じように振る舞う技術こちらこちらも)
  • 自然な身のこなしで、障害物を乗り越えたり、跳躍したりする技術
  • 人間の言葉で与えられた指示の内容を理解して、最良な行動で指示された内容を達成する技術
  • エージェントどうしが、コミュニケーションによって知識を伝播したり、協調行動をとる技術
  • 過去に覚えたことを忘れずに、次々に複数の新しい知識や行動を学習する技術こちらこちらこちらも)

次回以降の記事で取り上げますが、上記の他にも、例えば、「長期計画を立てて、行動する技術」としては、Google DeepMind社が公表した「Predictronモデル」があります。

AIロボットは集合的な「歴史意識」を獲得するか?

ちなみに、ロボットが、(人から与えられた or 自ら設定した)「目標」なり「課題」なりを解決するという「問題意識」をもちながら、周囲の状況を認識する際に、まず最初に認識するのは、(身体に埋め込まれたセンサーによって捉えられた)周囲の状況に関する「生情報」としての「センサーの数値情報」です。

これらの「生情報」は、ロボットの身体と、ロボットの周囲にある諸物体との距離が計測された数値データや、温度のデータや、足元の地面の勾配(数学の「ベクトル解析」でいうgradや、リーマン幾何学でいう「曲率」)を数値で表現した数字データです。

この「生情報」としての「数字データ」は、未だロボットの「主観」によって「意味づけ」られていない、「生」の、「無味乾燥な」、「価値中立的」な、「事実認定」レベルの「情報」です。

こうした情報は、インテリジェンス分析の業界では、「生情報」(”information”)と呼ばれています。 ドイツ語では、このような「生情報」の時間的な変化を記録した「データの蓄積」を、「歴史」(”Historie”)という単語で、表現します。

他方で、ロボットは、なんらかの達成させたい「目標」を、達成すべき「課題」として、もっています。この「目標」や「課題」(ミッション)は、行動空間において、「実現」す『べき』『望ましい、理想の』状態として、「主観的」にポジティブ(プラス、肯定的)な「価値」を帯びています。

「目的」が、主観的にポジティブな「価値」で意義付けられているために、ロボットが、なんらかの「行動」や「行為」を起こそうとして、いま自分が達成したいと志している「目標」と、「現状」(センサーで計測された数値情報の集合体)との「差分」を認識するとき、その「差分」は、「理想」と「現実」の「ギャップ」という「主観的な価値観」で色づけられた「情報」になります。

この「差分」は、「目標」と「現状」との「距離」を意味し、この「距離」を解消させることで、ロボットが実現したいと追い求める「理想状態」としての「目的」が達成されるのです。

このように、「目標」と「現状」との「距離」を計測して、その距離を生めるために有効と(ロボットが認識した)短期から中長期の各時間軸にわたる複数の行動系列を(ロボットが)生み出して、自律的に行動する意思決定を行う段階で、行動の出発点となる「現状」認識は、もはや「価値中立的」な「生情報」としての”Information”ではなく、そこから有益な行動を引き出す上で足がかりとなる「インテリジェンス」(”Intelligence”)に変貌しています。

ドイツ語では、このような「目的」や「目標」の達成に至る道筋(途中経過、途上)における、これまでの「行動」の「来歴」を振り返る意味での「時系列情報」は、「歴史」(”Geschichte”)と呼ばれます。

そして、こうした「歴史」を集団的に共有する集団が、おなじ歴史的体験(=意味づけられた(間主観的・共同主観的)なこれまでのいきさつ=時系列情報=来歴)を共有する集団として、社会学や歴史学では、認定されます。

ドイツの哲学者・ディルタイ(Wilhelm Christian Ludwig Dilthey, 1833年– 1911年)は、「歴史」とは、集団内で(その意味づけや価値付けが)共有された出来事の「体験」の数珠の連鎖として、体得(了解)されるということを、人間がもつ「歴史」意識として説明しています。

今後、人間だけでなく、AIロボット集団もまた、実現されるべき「ゴール」なり「目標」を共有し、その「ゴール」・「目標」に「いま」、(「これまで」の体験の積み重ねによって)どこまで近づいているのか、という認識を「共有」することで、(もともと、意味づけや価値付けがなされていない、価値中立的な)物理的な行動空間に対して、ある(共同)主観的な価値や意味合いによって「意味づけられた」価値空間を見出すようになるということが、起きてくるのかもしれません。

この意味で、ロボットは、集団として、なんらかの「歴史」感覚を持つに至るのかもしれません。
しかし、その場合も、必ずしも、「自我」(=「自分がこの世界に存在しているということの自覚」)に目覚めた「自己意識」をもって、「歴史感覚」を「意識空間」のなかで「実感」しているロボット集団が登場するというシナリオだけが実現するのではないと思われます。

そうではなく、「(自己)意識」を伴わずに、ただ、計算機上の「データ」として、「各座標数値の重みの濃淡の勾配」をもった「特徴ベクトル」という(データ)形式で、「主観的な意味づけられ、価値付けられた」、これまで体験した出来事を、LSTMやGRUなどの「時系列特徴ベクトル」として、メモリ空間やハードウェア上に電磁気的に記録された「記憶」をもつ、ロボットというあり方のほうが、より実現性が高いのです。

ちなみに、カーツワイル氏は、「自己意識」をもった「強いAI」(strong AI)が実現する可能性に賭けているようです。

なお、ロボットを動かす「R」のテクノロジーとしては、2018年現在、「深層強化学習」モデルがもっとも精力的に研究されています。

しかし、「深層強化学習」モデルだけでなく、「遺伝的ファジーツリー」モデル(Genetic fuzzy treeモデル。Gigazine記事「人工知能パイロットが無人戦闘機の戦闘シミュレーションで元空軍大佐に勝利」)などの、「ディープ・ラーニング」以外のアルゴリズムについても、その可能性について意識を向けて、(「ディープ・ラーニング」一辺倒に、意識を収束させずに)バランスよく、アルゴリズムの候補を研究すべきです、

これらのアルゴリズムによって、ロボットは、周囲の状況(=センサー情報)から自律的に学習(世界認識=情報表現の形成)し、みずから目標に設定した状態に近づくために、状態に対して能動的に働きかけて、行為する意思決定を行うのです。

GとRの複合領域(1): 人類知性の動作原理を、AIロボを「作って理解」する「構成論的研究」

なお、GとRの複合領域として、文部科学省 科学研究費補助金 新学術領域研究 「共創的コミュニケーションのための言語新科学」があります。

この研究プロジェクトは、研究発掘考古学や解剖学・人類学・言語学・脳科学を総動員して得られた、猿人から「ヒト」が生まれる過程で、言語能力がどのように形成され、獲得されたのかを考察した説明モデルを、計算機上でシミュレーション可能な数理モデル(言語能力の発育モデル)として構築して、計算機上でシミュレーションを行うことで、「ヒト」の言語能力の発生過程を、シミュレーションによって「作って動かす」ことで「理解する」と同時に、「ヒトの進化」にヒントを得る形で、言語能力をもった人工知能ロボットを開発することにもつながるものです。

こうした研究が、カーツワイルの”Singularity is Near”(『ポスト・ヒューマン誕生』)が出版された後に、学際的な研究プロジェクトとして、日本で立ち上がっています。

以下の「ロードマップ」は、、文部科学省 科学研究費補助金 新学術領域研究 「共創的コミュニケーションのための言語新科学」からの転載です。

GとRの複合領域(2): [G]人間の脳と、[R](人工)深層学習モデルの類似点と相違点

なお、人間の脳内で、無数のニューロンが刺激を授受(送受信)しあいながら、知的情報処理を行っている仕組み(動作原理)と、「人工」知能モデルとしての深層ニューラル・ネットワークモデルとの類似点と相違点についても、多くの論文が出ています。

この領域の研究を外観したものとしては、次のスライドとウェブページがあります。

その他、以下のウェブページも参考になります。

上記のブログ記事では、深層ニューラル・ネットワークモデルで、いわゆる「ディープ・ラーニング」の学習法として採用されている「誤差逆伝播法」(BP法: Back Propagation)は脳内で行われているとは考えにくいという問題意識から、人工知能モデルにおいて、BP法に代わる学習法の候補として、Difference Target Propagationに着目しています。

なお、BP法は、以下です。

  1. 深層ニューラル・ネットワークモデルが出力層から出力した「推定出力値」と、実際に計測された「実測値」である「正解値」との「誤差」を、学習を繰り返すたびにどんどん減らしていくために、
  2. 各層が「誤差」の発生源としてどれだけの「責任」を追っていのか(各層が少しずつ「誤差」を生み出していたと仮定する)をつきとめる必要がある。それをつきとめるために、
  3. 順方向の情報処理(入力層から出力層へと「順方向」に進んでいく演算)が終わるたびに、今度は、「誤差」が姿を表した「出力層」から、各層がそれぞれ、どれだけ誤差を生み出していたのかを、出力層から入力層へと、層をひとつずつ「逆方向」にたどりながら、隣り合う2層の間で偏微分演算を行うことで、つきとめていく。
  4. 次の学習では、各層における「誤差の原因」を「減らしていく」していくために、誤差を生み出した「勾配」(偏微分値)を「誤差」と反対側にたどりながら、入力層から出力層へ「順方向」の情報処理を行うことで、最終的に出力層で得られる「誤差」を前回の学習時点より減らす

という「学習方法」です。

上記のブログ記事で解説されているように、この「逆方向」の情報処理(演算)と、「偏微分演算」に相当する情報処理(演算)が、人間の脳内におけるニューロンどうしのつながり方を見る限り、脳内では行われていないのではないか、というのが、問題意識です。

ここから、人間の脳内で実際に生じている情報処理を「模倣」した人工知能モデルを考案するためには(なお、人工知能モデルは、必ずしも人間の脳内の情報処理課程を模倣する必然性はない)、BP法に変わる「学習アルゴリズム」(学習法)を考える必要があると提起されているのです。

この問題意識のもとで行われている論文としては、以下もあります。

また、カーツワイル氏も”Singularity is Near”(2005)は、人間の脳内ではニューラル・ネットワークどうしが、「カオス」環境のなかで、「自己組織化」と「創発」によって、「カオス」から「秩序」を生み出す過程が生じている、と繰り返し強調しています。

このように、「カオス理論」や「複雑系理論」・「自己組織化の理論」で定義される意味での「自己組織化」の原理を組み込んだ(人工)ニューラル・ネットワークモデルとしては、Chaotic neural networkモデルというものが、1980年代から研究されています。

人工知能モデルは、必ずしも人間の脳内の情報処理課程を模倣する必然性はなく、人間の脳内で行われている情報処理過程とは大きくかけはなれた動作原理であっても、人工知能モデルとして、タスクに対して高いパフォーマンスさえ出せればそれでよい、という考え方もあります。

しかし、”Singularity is Near”(『ポスト・ヒューマン誕生』)で論じられているように、人間の脳内に移植後、人間の生来のニューロンと、埋め込んだ機械の人工ニューロン・チップとが、脳のなかで有機的につながりあう(同書では、2005年時点でその実験に成功した事例をとりあげています)ような人工知能チップをつくるためには、人間の生来のニューロンと有機的につながりあうことができるのに十分なほど、人間の脳がもつ動作原理に近い「人工知能アルゴリズム」を開発することが求められそうです。

その一方で、人間の(脳内などの)毛細血管の中に投入するナノ・ボットに搭載するAIチップは、脳のニューロンと直接、有機的につながりあう必要性はないため、人間の脳の動作原理とはまるで違う(人間の脳内の情報処理課程とは互換性のない)任意の「人工の」計算アルゴリズムを搭載していても、差し支えがないのかもしれません。

人間の体外(宇宙空間など)で稼働するロボットに搭載するAIアルゴリズムは、人間の脳の動作原理とはまるで違うアルゴリズムで動いていても、担っている仕事(タスク)を良好なパフォーマンスで達成する能力さえ発揮すれば、何ら問題はない、ということになるのだと予想されます。

「知能」発生の母体としての「身体性」という視点

なお、Rolf Pfeifer(著)・細田 耕ほか(訳) 『知能の原理 ―身体性に基づく構成論的アプローチ―』(共立出版。2010年刊行)や、東京大学・知能システム情報学研究室(國吉・新山研究室)や、立命館大学・創発システム研究室(谷口研究室)は、「身体」(と「環境」とのふれあい・相互作用の時系列過程)を離れたところに、「知能」の発生(発現)は生じ得ない、という考え方を提示しています。

この考え方について、東京大学情報理工学系研究科の國吉康夫教授は、東京大学のウェブページに掲載されたインタビューのなかで、「こうした自分の身体に関する認知を基盤として、徐々に外界の認識や社会性といった人間的な認知や振る舞いが創発されていくと考えています。」と述べられています。

この点については、カーツワイル氏も『ポスト・ヒューマン誕生』(NHK出版)の第4章の本文と章末の対話形式の挿話のなかで、

人間の感情と、思考の大部分は、体に向けられていて、体の感覚的な必要性や性的な必要性を満たそうとするものなのだ(対話中の登場人物・「フロイト」の発言)

や、

AIには体がいらないとは言っていません。第6章で説明するつもりですが、非生物的ではあれ人間に似た体を作る手段はあるし、ヴァーチャル・リアリティの中でのヴァーチャル身体を作ることだってできます。(「レイ」の発言)

と、それぞれ、対談のなかの登場人物の発言という形を借りて、述べています。

そして、上記の挿話のなかで、「だが、ヴァーチャル身体は、現実の体とは違う」と述べた「フロイト」の指摘に答える形で、「レイ」の発言を借りて、カーツワイル氏は、以下のように述べています。

「ヴァーチャル」という言葉がちょっとよくないのです。

「現実ではない」という意味なのに、実際には、ヴァーチャル身体は、大事な点どれをとっても、物理的な体と同じくらい現実的(リアル)なのです。

電話は、聴覚的なヴァーチャル・リアリティです。でも、このヴァーチャル・リアリティ環境の中の自分の声が「現実」の声でないと感じる人はいません。

今ここにある物理的な体にしても、誰かがわたしの体に触ったとしてそれを直接体験するわけじゃない。腕にある神経の末端から発せられた信号が処理されて、脳がそれを受け取っているだけです。信号は、脊髄を流れ、脳幹を経由して脳の中の島の領域にたどりつきます。

ヴァーチャルな腕に誰かがヴァーチャルに触れたときに出る同じような信号を、わたしの脳が--あるいはAIの脳が--受け取っても、現実の世界でそうしているときと比べて、はっきりとわかる違いはなにもない」

カーツワイルが、挿話のなかの「レイ」の発言の形を借りて表明した上記の考え方は、今日、DeepMindやOpenAIが、OenAI Gymなどの「仮想物理環境」のなかで深層強化学習モデルを頭脳として搭載したAIロボットに、(仮想環境のなかでの)振舞い方を「学習」させているとき、それら、「仮想環境」内で「ヴァーチャル」な「体」をもって「身」の振る舞わせ方を学習させているロボットは、現実空間の中で現実の「体」をつかって身のこなし方を学んでいることと、本質的にはなんら変わりがないことを意味しています

なお、2018年現在、仮想環境「Mincraft」のなかのロボットに組み込むことができる(深層学習モデルを含む)機械学習の知能モジュールが、Microsoftから、世界中のエンジニアに対して提供されています。これは、「Project Malmo」という同社のプロジェクトのなかで提供されているものです。そして、同社は、「MARMO 2018」という技術競技会を開催しています。

「GNR」のおさらい

このように、まず、「G」技術には、人間を含む動植と植物の「体」を織り成す「有機高分子物質」の「3次元構造の地図」の「設計図情報」としての「DNA」を解読し、編集・改変する「遺伝子情報工学」という意味が含まれています。

次に、「N」技術には、「物質」の組成構造を、ミクロ・スケールで成り立たせている力学的な法則を理解することで、(人間や人工知能搭載ロボットが)意思をもって、世界と宇宙を織り成す「物質の配列構成情報」の意味内容を解読したり、書き換えたりする技術としての「ナノ・テクノロジー」という意味が、含まれています。

そして、「R」技術には、自己の「目標」(あるべき状態、価値観)と「現状」(=周囲の状況と自分との相対的な関係)との差分(intelligence)を認識し、その「差分」を埋めることで、「現状」(status quo)を「目標」に近づけるために有効と考えられる「行動」を考え、「行為」するという、「認識」(=特徴表現ベクトル)に立って「行為する」ロボット、という意味で、「情報」(intelligence, 特徴表現ベクトル)を取り扱う技術、という意味が含まれています。

A・T・G・Cの塩基配列「構造」「情報」を「言語解析」する言語処理技術(NLP)としてのバイオ・インフォマティックス

以上、みてきた「GNR」を構成する「G」・「N」・「R」のうち、「G」については、「バイオ・インフォマティックス」についてWikipedia日本語版に登録されている以下の定義に、雄弁に語られています。
以下、Wikipedia日本語版「バイオインフォマティックス」の定義の一部分を引用します。

バイオインフォマティクス(英語:bioinformatics)または生命情報科学(せいめいじょうほうかがく)は、生命科学と情報科学の融合分野のひとつで、DNAやRNA、タンパク質の構造などの生命が持っている「情報」といえるものを情報科学や統計学などのアルゴリズムを用いて分析することで生命について解き明かしていく学問である。機械学習による遺伝子領域予測や、タンパク質構造予測、次世代シーケンサーを利用したゲノム解析など、大きな計算能力を要求される課題が多く存在するため、スーパーコンピュータの重要な応用領域の一つとして認識されている。

主な研究対象分野に、遺伝子予測、遺伝子機能予測、遺伝子分類、配列アラインメント、ゲノムアセンブリ、タンパク質構造アラインメント、タンパク質構造予測、遺伝子発現解析、タンパク質間相互作用の予測、進化のモデリングなどがある。

近年多くの生物を対象に実施されているゲノムプロジェクトによって大量の情報が得られる一方、それらの情報から生物学的な意味を抽出することが困難であることが広く認識されるようになり、バイオインフォマティクスの重要性が注目されている。

この一方遺伝子情報は核酸の配列というデジタル情報に近い性格を持っているために、コンピュータとの親和性が高いことが本分野の発展の理由になっている。

Wikipedia(日本語版)による定義のほかに、言語解読技術・言語処理技術の適用対称としての遺伝子情報解析という捉え方は、以下の論考によっても窺い知ることができます。

また、理化学研究所と双璧を成すかたちで、これまで、日本の科学技術開発を牽引してきた産業技術総合研究所(AIST)に所属する研究者の例として、Masashi Tsubaki博士の研究業績リストを取り上げてみると、自然言語処理技術(NLP: Natural Language Processing)としての多様体学習モデルや深層学習モデルや機械学習モデルを、タンパク質の高分子構造の解析や、DNAのどの部分がタンパク質の構造を決定する因子として力を発揮しているのかを推定する課題に対して、適用していることを垣間見ることができます。

「情報」の解読技術と編集・加工技術という共通項から「GNR」が世界を変える方向性を考える

本シリーズでは、「情報パターン」(=「記号」の配列パターン)を解析することで、そこからなんらかの「意味構造」を読み取ったり、さらに、意味が了解された「記号配列」の並び順序を、編集・加工して、置き換える技術、という意味での「情報解析」技術・「情報加工・編集」技術という意味を持つ「GNR」技術の能力が、(タスクごとに設計された損失関数を最小化するパラメータの組み見合わせを、誤差逆伝播法などの最適化アルゴリズムで探索的に発見する)「ディープ・ラーニングモデル」(深層ニューラル・ネットワークモデル)の登場によって、いま現在、どのように技術進歩しており、さらに今後、どのようなシナリオで、さらに発展いきそうなのかという主題に、取り組んでいきます。

この主題に取り組むために、深層学習モデル(深層ニューラル・ネットワークモデル)を含む統計的機械学習の手法(の技術発展)が、遺伝子解読・編集技術やナノ・テクノロジー技術、自律稼働型ロボットに搭載される認知モデルと行動知能モデルの技術(の技術発展)に対して、どのような影響を及ぼしているのかを、いくつか論文をとりあげながら、考察していこうと思います。

小野寺信

敗戦の前年、長野県に3男として生を受ける。
旧制一高の学生であった兄二人が、ロス五輪のバロン西に憧れ、馬術に熱を上げていたのを見て乗馬教練場に通い始めるも、落馬して腰を痛め、爾来、書斎と学校・職場を行き来する生活習慣に転じる。

同級生がデカンショ(デカルト・カント・ショーペンハウエル)に没頭する中、ひとり、同時代のベルクソン、フッセル、ハイデッゲルなどの「生の哲学」と「現象学」・「超越論的存在論」に傾倒する。

1930年代の「物」論考、「哲学への寄与」論考など、いわゆるハイデッゲルの中期思想と、西田幾多郎ら京都帝大の「場所の論理学」の思想の架橋を志すも、九鬼周造の「偶然性の哲学」の文章に触れて、己の非才を悟り、断念。大学は文科に進学するも、計算機科学と知能の計算論的再現に強く惹かれ、日米関係の職務に奉職する傍ら、理科に進学した兄達の人脈を頼り、今日でいう人工知能の研究に、在野の人間として、思索に励む日々を送る。

定年退職後のいま、米国IBMやGoogleを見上げて戦意喪失の虚脱状態にある若いAI産業人や学部生・大学院生に対して、「人間とは異なる独自の言語」を紡ぎ出すAI Agentにをシミュレーションによって生み出す「言語創発」研究の領域において、カオス理論と身体性に立脚した、「米国の後追い」では「ない」我が国自身の「AI研究アプローチ」実在することを、事実として知らせるための連載を「言論ドットコム」誌に連載中。

「言語創発」研究以外のAI領域についても、研究の方向性が、いま、本質論としてどちらの方角にむいたベクトルとして発展しているのか、本質を掘り下げた議論を喚起するきっかけとなる所論を書いてみたい思いに駆られ、Ainow誌上での連載の筆をとった次第です。

尊敬する日本人は、同名の小野寺 信(元ストックホルム駐在武官)、高木 惣吉 (海軍省調査課長)、堀 栄三(陸軍情報参謀・陸自幹部自衛官)。

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する