最終更新日:
2010年代から急速に研究開発が進む機械学習技術は、日々その精度を向上させています。近年では、画像認識にとどまらず、自然言語処理技術も向上し、AIの活躍の場がさらに広がっています。
一方で、これからAIが社会に浸透する上で直面する課題があります。それがシンボルグラウンディング問題です。
現在活用が進むAIは物事の本質的な意味を理解していません。例えば、過去に学習した膨大なりんごの画像の特徴から、「これはりんごである」と回答するのみで、りんごが何であるかを本質的に導き出しているわけではないのです。
今回は、「シンボルグラウンディング問題」について紹介します。
▼AIについて詳しく知りたい方はこちら
シンボルグラウンディング問題とは
「シンボルグラウンディング問題」とは、
記号システム内のシンボルがどのようにして実世界と結びついているか
参照:Wikipedia
という問題のことであり、AIの発展における重要な課題の一つです。
この定義内で取り扱われる記号とは、物や言語、模様までとても包括的な意味となります。あるシンボル(記号)を、「実世界の意味」と「計算機の意味」とで正確に結びつける(グラウンディング・接地)ことができるか否という問題です。
1990年に認知科学者のスティーブン・ハルナッドが提唱した人工知能の問題点で、又の名を「記号接地問題」といいます。
説明を読むだけではわかりづらいと思うでの、具体例を挙げながら深く掘り下げます。
中国語の部屋
シンボルグラウンディング問題の具体例として、哲学者のジョン・サールが提唱した「中国語の部屋(The Chinese Room)」を紹介します。
この実験の背景を論文中から抜粋すると、
入力として受け取ったすべての中国語の記号列に対して、実際の中国語話者が”一生かけてテストし続けても”区別できないような中国語の記号列で応答することができれば、私が英語の記号の意味を理解するのと同じ意味で、コンピュータは中国語の記号の意味を理解することになる。
(DeepL翻訳より)
つまり、
|
のような現象が実際に起こり得るのかどうかを論じたのが「中国語の部屋」です。
実験内容を簡単に説明すると
- 中国語がわからない人を一人だけ部屋に入れる
- 部屋の中には、それを読めば完璧に受け答えができる「中国語マニュアル」がある
- 部屋の外の人が、部屋の中の人に中国語で質問をする
- 部屋の中の人が、「中国語マニュアル」を用いて質問に答える
- 部屋の外の人が、質問に対して適切な答えが返ってくることを確認する
となります。
この場合、「中国語マニュアル」を用いて質問に答えた中の人は、外から見れば中国語を理解しているように見えますが、実際には理解できている訳ではありません。
このように、記号(この場合は中国語)を実世界とうまく結びつけられていない状況をどう解決するかが、シンボルグラウンディング問題となります。
「しまうま」の認識
人間は初めて「しまうま」という言葉を聞いて、それを初めて見たときに「これはしまうまかも??」と思えるのは何故でしょうか。
それは「しまうま」という言葉を聞いた時点で「しまうまとは、縞模様のある馬かもしれん」と推測できるからだと考えられます。このように、暗黙知的に「しまうま」を推測できるのが人間の特性です。
ではコンピュータ/人工知能はどうでしょうか?おそらく「しまうま」という記号をそのまま認識するため、しまうまの画像などで学習させない限りは「しまうま」だと認識するのは難しいと考えられます。
何故なら、「しまうま」という記号そのままを認識するため、「縞模様のある馬かも」と想起することができないからです。この具体例も、実世界の意味とうまく接地できていないシンボルグラウンディング問題をわかりやすく表現しています。
シンボルグラウンディング問題から読み取れることは?
シンボルグラウンディング問題から読み取れることは、主に2つあります。
これらについて解説していきます。
身体性
シンボルグラウンディング問題でよく引き合いに出されるのは、身体性についてです。人間は何かを知覚するとき、見たり、聞いたり、直接触れながら物事を知覚し高度な情報を得ることができます。
しかし、身体性のないコンピュータにはそれができません。この違いが、シンボルグラウンディング問題が生じる原因と考えられます。もっとわかりやすく解説してみます。
例えば、「一般的なテレビ」と「リンゴ型のテレビ」を思い浮かべてみましょう。「一般的なテレビ」は、形や機能もある程度揃っているため、テレビに関する複数の画像を人工知能に学習させれば判別はできると思います。
ただ、形が変化するとどうでしょうか?人間は「リンゴ型のテレビ」に直接触れたり、機能を確認しながらテレビと判別できますが、コンピュータは身体性を持たないため、そのテレビが「テレビ」なのか、それとも「リンゴ」なのかを判断するのが困難になります。
以上のように、身体性を持たないと、記号処理に柔軟性が欠けてしまうため、シンボルグラウンディング問題を突破するには「身体性」が重要となる訳です。
「失敗」の計算
言葉に関しても同様です。「言語」はシンボルの代表とも呼べるものですが、言葉の意味を正確に理解できるか否かも、シンボルグラウンディング問題では重要となります。ここでは「失敗」を例に考えてみましょう。
「失敗」の意味は、十人十色です。例えば、100人中10人しか合格できないテストがあるとき、90人は不合格になります。
この時、90人の失敗は90通りあると言えるでしょう。もっと言えば、少し見方を変えると失敗とは必ずしも断定できない可能性もあります。故に、「失敗」と一言で言えても、辞書に載ってる言葉では語り尽くせないような意味があると思います。
「中国語の部屋」の例と同様に、コンピュータは予め学習された言葉のみを返すようにプログラムされた状態です。
人間であれば、「失敗」の意味を、人と対話することで情景を思い浮かべたり、地震と同じような失敗を結びつけることで意味を理解していくと思います。そのような経験は、誰にでもあるでしょう。故に、十人十色な言葉の意味を正確に理解することは、現在のコンピュータ/人工知能では困難と言えるのです。
終わりに
今回は「シンボルグラウンディング問題」について取り上げました。あまり聞き慣れない単語なので、わかりづらい部分もあったかもしれません。
この記事を通じて、身の回りにある「シンボル(記号)」を自分がどのように認識しているのか、またコンピュータ/人工知能がどのように認識するのか、頭の片隅におけば理解が深まると思います。
「人間」と「計算機」の対比は、自分を知る上で非常に参考になるのでおすすめです。
▶関連記事|フレーム問題とは?AIにおける重要な課題について解説した記事はこちら>>
◇AINOWインターン生
◇Twitterでも発信しています。
◇AINOWでインターンをしながら、自分のブログも書いてライティングの勉強をしています。