最終更新日:
著者のKatie Burke氏は、2018年よりNVIDIA社における自律自動車部門のコンテンツ・マーケティング・マネージャーを務めており、以前には自動車専門メディア『Automotive News』で記事を執筆していました。同氏がUS版NVIDIAブログに投稿した記事では、自律自動車が世界を知覚する仕組みを分かり易く解説しています。
ヒトは、視覚や聴覚といった五感を通して世界を知覚し、その知覚にもとづいて行動を決定しています。自律自動車もヒトと同様に世界を知覚し、その知覚にもとづいて走行を制御する機能が実装されています。自律自動車においてヒトの五感に相当するものはカメラやセンサーなのですが、カメラやセンサーが集めたデータのなかからヒトやクルマ、道路標識といった走行に必要な情報を抽出する際には、ディープラーニングを活用した画像認識AIが動作しています。そして、画像認識によって抽出された道路情報にもとづいて走行を制御するのも、AIが実行しています。それゆえ自律自動車とは、多数のAIが実装されたAI製品なのです。
NVIDIAは、以上のような自律自動車用に開発されたAIと、こうしたAIが動作するのに必要なGPUを統合した自律自動車プラットフォームの開発を推進しています。ちなみに、GPUは同社の主力商品です。こうした取り組みを進めているNVIDIAは、自律自動車プラットフォームの覇権を握るかも知れない企業の候補のひとつとしてその名を挙げることができるでしょう。
自律運転とは単なるAI以上のもの
2018/8/10 Katie Burke
ヒトは、5つの基本的な感覚を使って周囲の世界から恒常的に情報を集めています。つまり、電話の鳴動を聞いたり、コンピュータのスクリーンに表示された通知を見たり、あるいは何か熱いモノを触ったりしています。
しかし、知覚がなくなると、知覚が集めるはずの入力を解読して、その入力が何に関係したものなのか決める術がなくなります。知覚があるおかげで電話に出たり、返信すべきeメールがあるのを知ったり、火傷する前に熱いモノから手を引っ込めたりできるのです。
知覚の働きがわかったところで、高速道路で運転することを想像してみましょう。そこではドライバーの周囲に関する情報が恒常的なストリーム(=流れ)となっています。車線や道路標識から自動車のあいだを走行する二輪車のドライバー、ある車線に合流するトラック、そして交通渋滞にまでいたる物事に対して、即座に周囲に配慮した決定をくだす能力は特殊技能などではなく、運転において不可欠な能力です。
ヒトが知覚を即座に統合し、その統合された知覚にもとづいて行動することができるように、周囲から即座に運転に関係する知識を抽出する能力は、自律自動車を安全に制御するための基本的な柱となるものです。
自律自動車もカメラやその他のセンサーを使うことで、ヒトの知覚のような力を持つことができ、そうした力によってクルマ前方を検知して、検知したモノが潜在的に危険かどうかを特定し、さらにそうしたモノの動きも追跡してその位置を恒常的に知ることができます。こうした前方を検知する能力は自律自動車の周囲360°に拡大され、クルマが走行している時に遭遇する静止したモノと動いているモノすべての追跡を可能とするのです。
知覚は、自律自動車の安全性のために実装される演算パイプラインにおいて、第1のステージとなっています。自律自動車が周囲の環境から走行に関係するデータを抽出できれば、一切のヒトの介入なしに走行コースを計画して実際に走行することができるのです。
ノイズを通して信号を見つける
自律自動車のセンサーは、毎秒ごとに大量のデータを生成しています。そうしたデータのなかには他のクルマや歩行者、道路標識、そして交通信号があり、自律自動車が走行する1マイルごとにどこを走り、どこを走るべきではないかに関する指示が含まれているのです。
以上のような指示を特定し、安全に走行するためにこうした指示が求めることを決定するのは信じられいないほど複雑であり、この複雑なタスクには多種多様なディープ・ニューラルネットワークが並行して動作することが要求されます。NVIDIA DRIVEプラットフォームの主要なコンポーネントのひとつである一連のNVIDIA DRIVEソフトウェアには、自律走行に必要な包括的知覚のために不可欠なディープ・ニューラルネットワークが協働できるようにするライブラリーとフレームワーク、そしてソースコードのパッケージが含まれています。
こうしたニューラルネットワークには障害物を検知するDriveNet、走行可能な空間を検知する OpenRoadNetが含まれています。道路の走行を計画するためにはLaneNetが道路の端を検知し、さらにPilotNetが走行可能な道路を検知しています。
走行に必要なデータの検出とその統合は、NVIDIA DRIVEソフトウェアに実装された高度に最適化され柔軟に動作するライブラリ層のうえで処理され実行可能となります。そして、NVIDIA DRIVEソフトウェアにおいて処理される多種多様なニューラルネットワークは同時に動作し、安全性のカギとなる要素である冗長性を提供するような重複動作も可能としています。
本質的な安全
知覚レイヤーにおける冗長性に加えて、NVIDIA DRIVEソフトウェア内のニューラルネットワークは自律自動車に実装されたすべての機能を支援することで、あらゆるレベルでの安全性を強化しています。
例えば、自律自動車に活用されている高解像度の地図は十字路を指示することができます。こうした地図にセンサーがリアルタイムに集めたデータが加わることで、クルマがいる位置をピンポイントでより正確に特定することが可能となります。そして、知覚レイヤーは止まるべき位置を精密にクルマに示すのです。
自律自動車の知覚は、自律自動車がもつ多様な能力が発揮することにも貢献しています。こうした能力のおかげで、自律自動車はヒトと同じような洗練された仕方で世界を見ることができるのです。障害物を特定することは言うまでもなく、自律自動車は静止したモノと同様に動くモノも認識し、走行コースを決定することができます。
以上のNVIDIA DRIVEソフトウェアの能力に、NVIDIAのパートナー企業であるPerceptive Automataから提供されているソフトウェアが追加されることで、自律自動車はヒトのボディ・ランゲージやその他の合図を読み取ってヒトの動きを予測することもできます。ヒトの行為を知覚する追加的な自律自動車の能力は、NVIDIA DRIVEプラットフォームがもつ計算能力のおかげで自律走行を制御する他のアルゴリズムと同時に動作できます。
これまで解説してきたようなハードウェアとソフトウェアを結合させたソリューションを用いて、NVIDIAの開発者は自律自動車の頭脳に新たな知覚能力を継続的に追加し続けているのです。
記事カテゴリー:Driving
タグ:人工知能、自動車、NVIDIA DRIVE
原文
『Perception Matters: How Deep Learning Enables Autonomous Vehicles to Understand Their Environment』
著者
Katie Burke
翻訳
吉本幸記
編集
おざけん