ディープラーニングとは【初心者必読】｜基礎知識からAIとの違い、導入プロセスまで細かく解説

AINOW編集部作成

ディープラーニングって聞いたことがあるけど、しっかり理解している人は少ないのではないでしょうか？

AIとか、機械学習とかいろんな単語が乱立していますし、分かりづらいですよね。実際にどんなことに活用できて、効果あるのかとか知らないですよね。

本記事では、ディープラーニング自体の説明から、仕組み、活用事例まで網羅的に解説しています。

ディープラーニングの事を初心者の方でもわかりやすく、解説しているので、最後まで読んでもらうと基本的な知識はつくはずです。

ぜひ最後までご覧ください。

ディープラーニングとは? 簡単にいうと…
なぜ今ディープラーニングが注目されているのか
ディープラーニングとAI・機械学習の違い
ディープラーニングの仕組み
ディープラーニングができる4つのこと
ディープラーニングの5手法
ディープラーニングの実用例
ディープラーニングの導入プロセス
AIを学べる講座まとめ(無料講座も含む)
ディープラーニングについて学べる書籍
ディープラーニング関連の資格＆検定
- G検定とは
ディープラーニングの利活用を進める日本ディープラーニング協会（JDLA）
ディープラーニングの動向を知る
最後に

ディープラーニングとは? 簡単にいうと…

ディープラーニングとは人間が手を加えなくてもコンピュータが自動的に大量のデータからそのデータの特徴を発見する技術のことです。

以下の画像からディープラーニングの位置付けを理解できると思います。
人工知能＞機械学習＞ディープラーニングであり、ディープラーニングは機械学習の一技術です。細かい説明は後ほど説明します。

AINOW編集部作成

なぜ今ディープラーニングが注目されているのか

ディープラーニングが注目されている理由は、それが多くのイノベーションを生み出す可能性で溢れているからです。

AINOW編集部作成

これまでの技術では現実世界（環境）から得られるパターン（特徴）認識を機械に学習させることが非常に難しかったため、AIを生かした技術はなかなか発展しませんでした。

しかし、ディープラーニングは「パターン（特徴量）の学習」を自動でできるようになり、これまでの問題の原因を解消しました。それが衝撃的であり、多くの可能性を秘めていることからディープラーニングが注目されているのです。

▶関連記事｜【7分でわかる】AI研究、60年の歴史を完全解説！>>

ディープラーニングとAI・機械学習の違い

ディープラーニングとその他の技術の違いについてみていきます。

AIとは

AIとはArtificial Intelligenceの略で人工知能という意味です。AIの定義については確定したものがないですが、ここでは「人の知的な振る舞いを模倣したコンピュータ」とします。

そしてAIには「汎用人工知能」と「特化型人工知能」の2種類があると言われています。

汎用人工知能

汎用人工知能は、簡単に言うと、「なんでもできる人工知能」です。
多くの人が思い浮かべるのはこの「なんでもできる人工知能」ではないでしょうか。
汎用人工知能は与えられた情報をもとに自ら考え、応用することができる人工知能のことを指します。

特化型人工知能

特化型人工知能とは、1つのことに特化した人工知能を指します。例えば、音声の認識に特化しているAI、囲碁・将棋に特化しているAIなどが挙げられます。ほとんどのAIがこの「特化型人工知能」です。

AIについてより詳しく知りたい方は以下の記事がとても分かりやすいのでおすすめします。

AI専門ニュースメディア AINOW

人工知能（AI）とは？定義や歴史など徹底解説！最新のAIがヤバすぎる。

https://ainow.ai/artificial-intelligence-3/

AI（人工知能）の話題が連日のようにニュースに登場するようになりました。富士キメラ総研の「2020 人工知能ビジネス調査」によると、2020年度の国内AIビジネス市場規模は、前年度比15.4％増の1兆1084億円に拡大すると見込まれています。また、2021年度以降はDX（デ...

▶関連記事｜今さら聞けない「AI・人工知能」とは？>>

機械学習とは

機械学習とは、AIという技術の中でも人が全てを指示して初めて動くルールベースとは異なり、人の代わりに物事の特徴を発見する手法です。機械学習に関しては

データからルールやパターンを発見する方法である
識別と予測が主な使用目的である
分析の精度は100%ではないが、従来の手法より精度をあげられる可能性は高い

という特徴があります。また機械学習は「教師あり学習」・「教師なし学習」・「強化学習」の３つに分類されます。

それぞれ得意分野があり、使用用途が異なります。代表的なものにエクセルなどでも使用可能な線形回帰などがあります。

機械学習についてより詳しく知りたい方は以下の記事がとても分かりやすいのでおすすめします。

▶関連記事｜機械学習をどこよりもわかりやすく解説！>>

ニューラルネットワークとは

ニューラルネットワーク（Neural Network）とは機械学習（基本的に教師あり学習）の一種です。

ニューラルネットワークは人間の脳神経の構造を模倣した作りになっていることから、「ニューラル（神経系）ネットワーク」と呼ばれています。

作成：AINOW編集部

人間の脳は基本的に神経細胞（ニューロン）と神経回路網（シナプス）で構成されています。

ニューラルネットワーク内ではそれらを「ニューロン → ノード」・「シナプス → エッジ」として再現しています。そして、各層は複数の「ノード（もしくはユニット）」が「エッジ」で結ばれる構造をしています。

人間の脳内のニューロンは電気信号として情報を伝達します。その時にニューロンとニューロンをつなぐシナプスのつながりの強さによって、情報の伝わりやすさが変わってきます。

ニューラルネットワークではこの情報伝達プロセスをエッジという部分で”重み”という機械的な方法で模倣します。

ディープラーニングの仕組み

ディープラーニングはニューラルネットワークをベースにしています。

ディープラーニングは長い間解決されていなかったニューラルネットワーク特有のとある課題（以下に記述）を”多層（ディープ）化”するといった工夫で解決しています。そのためディープラーニングと呼ばれています。

作成：AINOW編集部

ニューラルネットワークは「入力層」→「隠れ層」→「出力層」で情報の表現を行いますが、それでは単純な情報しか処理、表現できないため、情報の複雑さに対応するように”層”の数を増やしたものをディープニューラルネットワーク(Deep Neural Network: DNN)と言います。

ディープラーニング（深層学習）は層を増やし、複雑さに対応したおかげで分析精度が飛躍を遂げているのが特徴です。

▶関連記事｜【図解】ディープラーニングの仕組みを徹底解説>>

ディープラーニングができる4つのこと

ディープラーニングでできることは、主に4つ上げられます。

画像認識
音声処理
自然言語処理
ロボットによる異常探知

画像認識の面では、人間を超えるほどの精度と言われています。できることとしては「物体認識」

「顔認識」「文字認識」の3つで、様々な分野や業界に利用されています。

▶関連記事｜画像認識とは｜機能・事例・仕組み・導入方法など徹底解説>>

音声処理においても、活躍しています。身近な例だと「Amazon Eco」「Google Home」と言った音声を認識して使うサービスです。ある音声技術においては、複数人で話していても認識できるなど能力がとても優れいています。

自然言語処理は、普段話してる言葉で日本語や英語のことを指します。それらを正しく認識、処理するためにディープラーニングの技術が使われています。自動翻訳の技術でも使われているもので、書いた文章の文脈をしっかりと把握して、翻訳してくれます。

▶関連記事｜「自然言語処理（NLP）」とは？>>

ロボットにおける異常探知は、自動運転などに使われています。搭載されたカメラによって、道路に潜む危険を完治してくれます。ディープラーニングにおける空間把握能力によるものです。

ディープラーニングができることについて詳しく説明している記事は以下リンクから読むことができます。興味のある人はぜひ、ご覧ください。

ディープラーニングの5手法

今回はディープラーニングには複数の学習方法があるうちの主要な手法について紹介します。

作成：AINOW編集部

ディープニューラルネットワークから発展した有名な技術は大きく分けて4つです。それぞれの手法が特定の分野に適しており、それらを組み合わせたりすることでより良い成果を出しています。

ディープニューラルネットワーク (DNN)とは

有名な４つの技術の説明に入る前に、それら４技術のベースとなっているディープラーニングについて説明します。

ディープニューラルネットワーク（DNN: Deep Neural Network）はその名の通り、ニューラルネットワーク内の層が多層（ディープ）化されている仕組みになっています。

以下の画像をみても分かる通り、非常に多くの層が組み合わさっています。この多層化で情報の複雑さに対応しています。

freeCodeCamp HP より引用

畳み込みネットワーク (CNN)とは

畳み込みネットワーク (CNN：Convolutional Neural Network)は画像認識に適した手法です。ディープラーニングの研究の中で最も進められている画像認識、物体検出、領域推定などの画像分野で活用されています。

Medium -「Simple Image classification using deep learning — deep learning series 2」より引用

この分野で重要なのは、画像の特徴をどのように取り込むかです。これまでのニューラルネットワークでは画像処理の際に多くの画像特徴情報を失っていましたが、CNNによって画像をそのまま2次元で処理できる様になりました。

“畳み込み(Convolution)”という言葉の由来は二項演算という計算の一方法の名前です。ちなみにCNNでは「画像から “特徴”を抽出する操作」を「畳み込み」と言います。画像処理で不可欠な手法がCNNなのです。

再帰型ニューラルネットワーク (RNN)とは

再帰型(リカレント)ニューラルネットワーク(Recurrent Neural Network)は時系列の情報に適した手法です。

世の中には時間に依存する情報が多くあるため、RNNも非常に重要な手法です。

例えば電車の乗車率は朝6-9時と夕方6-9時が最も多かったり、SNSの使用は昼休みや帰宅時間帯に多くなるなど、時間軸に沿って何かパターンを持っている情報は意外と多いのです。

CNNやこれまでのニューラルネットワークでは時系列の情報の喪失が多かったのですが、RNNによって時系列データをそのまま利用できるようになっています。

一般的にデータであれば新しく入力されたデータの方が基本的には重要度が高いですが、時系列データの場合は、「今の時点では関係はないが、将来のある時点では関係がある」という可能性もあるため、一概に古いデータを軽視できません。

この時系列特有の特徴に対して、RNNやRNNの発展形であるLSTM(Long-Short Term Memory)という手法は過去と将来のデータの重要度をバランスよく保てるような仕組みを兼ね備えており、上記の問題を解決できるようになっています。

RNNやLSTMは音声認識や自然言語処理などにも使用され、Google 翻訳などにも活用されています。私たちの知らないところで活躍していますね。
以下はその音声認識の活用事例をまとめた記事になります。

▶関連記事｜AI音声認識ってなに？仕組みからおすすめサービスまで>>

オートエンコーダとは

オートエンコーダ(自己符号化器：Autoencoder)とは、ニューラルネットワークを利用してデータを抽象化する(次元削減するという)手法の一つです。

AIで処理するデータはさまざまな複雑さをはらんでいます。ニューラルネットワークでは「隠れ層」を利用して、その複雑なデータをシンプルなものに変えますが、オートエンコーダなら、同様のことができるだけでなく、ニューラルネットワークのみの時よりも性能の良いモデルを作ることができます。

オートエンコーダを行うことで、複雑な情報をそのまま処理するのではなく、データを抽象化し、データ量を減らすことで大規模な学習が可能となり、ニューラルネットワークの応用領域が広がりました。

昔からニューラルネットワークは存在していましたが、「勾配消失」という課題が解決できずに下火になっていました。しかし、その課題を解決することで、「データの抽出化」や「大規模な学習」を可能にしたオートエンコーダが2006年に導入されたことで再び人気になりました。

ちなみにオートエンコーダから発展した“変分オートエンコーダ(VAE)”が現在は主流です。今回は説明を省略しますが、興味があったらぜひ調べてみてください！

敵対的生成ネットワーク (GAN)とは

最後に紹介するのはGANです。敵対的生成ネットワーク(Generative Adversarial Network)は現在、主に画像分野において好成績を残している手法です。GANは2つのネットワークで構成されており、一つは生成器(ジェネレータ)でもう一つは識別器(ディスクリミネータ)と言います。

ジェネレータ：ある値を入力値として受け取り、画像データを出力する。
ディスクリミネータ：ジェネレータが出力した画像データを受け取り、本物か偽物かを予測して出力する。

ジェネレータはディスクリミネータが間違えるような画像を作るように学習していき、ディスクリミネータは偽物をきちんと見抜けるように学習していきます。この2つがイタチごっこをすることで、お互いの精度をどんどん上げていきます。

機械が自動的に精度を上げていくGANはこれまで他の手法ではなかなか達成できていなかった、驚くような成果をもたらしています。

▶関連記事｜敵対的生成ネットワークの台頭【前編】>>

▶関連記事｜敵対的生成ネットワークの台頭【後編】>>

以下の動画はGANを利用した”ディープフェイク”と呼ばれる動画です。本物のオバマ元大統領のデータ（画像、動画、音声など）を使い、GANを通して訓練、生成されたものです。

動画内では偽オバマ元大統領が、本物のオバマ大統領の動画に合わせてリアルタイムで話しています。

LSTM法（Long Short Term Memory）とは

LSTM（長・短期記憶）とは、NN（ニューラルネットワーク）の一種です。特徴としては、従来のRNNでは学習できなかった長期依存を学習可能にしているところで、応用分野としては感情分析、言語モデリング、音声認識、動画解析などがあります。

RNNでも時系列のデータを扱うことはできましたが、LSTMによって、より短い学習時間で確実に学習できるようになりました。

RNNやLSTMは音声認識や自然言語処理などにも使用され、Google 翻訳などにも活用されています。私たちの知らないところで活躍していますね。

ディープラーニングの実用例

ここではディープラーニングの実用例について紹介します。一度は聞いたことのある例を３つほど取り上げました。

囲碁チャンピオンを打ち破ったAlphaGo

2017年、米Google傘下のDeepMind社が開発した囲碁AI “Alpha Go”は人類最強と言われていた柯潔（カ・ケツ）棋士に全勝した話です。ニュースでも大きく報じられ、ディープラーニングの能力の高さを象徴した事例となっています。

Asia Societyより引用

ボードゲームで最も難しいと言われている囲碁には約10の360乗通りという天文学数的な組み合わせが考えられるため、人間最強の棋士に勝つには今までの機械学習方法では到底不可能でした。

しかし、ディープラーニングと強化学習 (強化学習とは?)などの既存の技術の組み合わせによってそれを可能にしたのです。

ちなみにAlphaGoが強くなりすぎ、これ以上成長しても仕方ないということで、Deepmind社はAlphaGoを囲碁の分野から引退させる決定したそうです。誕生してから5年弱で引退とは驚きですね。

以下はAlpha Goの凄さの秘密に迫った記事です。気になる方はぜひ読んでみてください。

▶関連記事｜ボードゲーム界最強はAI？−AlphaGoの凄さとは>>

競争が進む自動運転技術

AlphaGoの他に馴染みがあるディープラーニングの事例は自動運転技術(Autonomous Driving)ではないでしょうか？

多くの自動車関連の企業に加えて、Waymo (ウェイモ: Google傘下)やTesla (テスラ)、百度 (バイドゥ)なども参入している競争が激しい分野です。

国内ではトヨタやNISSANなどの自動車メーカーをはじめ、DeNAなどのIT企業や自動運転の要素技術を開発するベンチャーも生まれています。

NAVIDIA HPより引用

囲碁のようなゲームは完全情報ゲームと呼ばれ、環境が変わることはなく、ルールに則って勝敗が決定します。一方、自動運転車を実現するためには常に変動する環境への対応や、さまざまな物体の認識・処理の必要性などもネックとなっていました。

しかし、カメラの映像を通したディープラーニングによる環境認識や、レーザー光を使ったセンサの一種で、対象物までの距離や位置や形状まで正確に検知できるLiDAR（ライダー）という技術によって得られるデータから近い将来、自動運転レベル４ (特定の場所でなど条件付きで運転手が乗らずに走れる)までは実現可能と言われています。

自動車事故の90%以上は運転者の人為ミスが占めています。近年、自動車事故も多発している状況を考慮すると、自動運転の実現により安全な社会を構築できる可能性があります。以下の記事も参考にしてください。

AI専門ニュースメディア AINOW

自動運転とは? 各レベル説明と15の実例を紹介

https://ainow.ai/2019/09/09/175323/

以下の動画は自動運転技術で世界1位のWaymo(ウェイモ)が2017年に公開した自動運転のテスト走行の動画です。運転席に誰もいない状態で公道を走るその様子は近未来感があふれていますね。昨今、ニュースなどで度々取り上げられている自動運転ですが、自動運転とはなに...

メルカリが取り組む「最高の出品体験」

近年は日本一ダウンロードされているフリマアプリであるメルカリは「売ることを空気にすること」、つまり限りなく簡単にすることを目指してAI技術を利用しています。

TECH PLAY HPより引用

出品してから売れるまでをAIで最適化する「Selling AI」にフォーカスして、質の良い大量のデータをもとにディープラーニングや転移学習、知識転移を駆使しています。

TECH PLAY

メルカリが「AI領域に最注力し、テックカンパニーとして世界を目指す」と宣言｜TEC...

https://techplay.jp/column/547/

3月28日、メルカリは報道関係者向けにAI技術説明会を開催した。取締役CPO（Chief Product Officer）の濱田優貴氏は「テックカンパニーとして世界を目指す」と力強く宣言。その最注力領域としてあげたのがAIである。メルカリでのAI活用はどのように進んでいるのか。す...

ディープラーニングベースの将棋AI「dlshogi」

dlshogiは将棋ソフト大会「電竜戦」において優勝したソフトで、GPUにて動くディープラーニングを実装している将棋AIです。

従来のソフトでは、かなりの局面を読み込まないと将棋の一手を打つことができませんでしたが、ディープラーニングを使うと、読む局面が少なくてもいい。

▶関連記事｜AIが棋力向上をサポート？将棋の世界で活躍するAIとは>>

▶関連記事｜ボードゲーム界最強はAI？−AlphaGoの凄さとは>>

dlshogiは実際にダウンロードすることができるので、気になった人は実行環境を整えた後にやってみるといいでしょう。

▶世界将棋AI 電竜戦バージョン>>

h3 自動翻訳「DeepL翻訳」

DeepLはドイツの会社が言語向けの人工知能システムを開発しているDeepL社によって提供されているものです。深層学習を利用して翻訳しており、自動翻訳といえばGoogle翻訳もありますが、ニューラルネットワークが異なります。

Google翻訳ではRNN(リカレントニューラルネットワーク)を用いているのに対して、DeepLはCNN(畳み込みニューラルネットワーク)を用いて実行されます。DeepLの方が複雑な処理が可能であるため、Google翻訳よりもニュアンスを含んだ自然に近い翻訳を可能にしています。

▶関連記事｜今話題のDeepL翻訳－威力と限界を徹底解説－>>

▶関連記事｜使うべきAI翻訳は？【翻訳機など7サービスとメリットを紹介】>>

h3 創薬を行う「AtomNet」

ディープラーニングを活用した、医療用のAIです。エボラ出血熱に関する7,000点もの薬をたった一日で解析し、病原体に効果的に働くかどうか判断したほど、高性能です。

アメリカのベンチャーが開発したもので、AtomNetとスーパーコンピューター、アルゴリズムを組合させることで、創薬を強く推し進めてくれます。

▶関連記事｜AIは創薬の課題を解決できるのか？>>

音声合成ソフト

ディープラーニングの技術を用いることで、音声を自然な声に変換することができます。使うソフトによってはリアルタイムでの音声変換が可能で、YouTubeでの配信活動やライブ配信での利用が可能になっています。

男性の声であってもまるで、自然な女性の声に変換することもできるのです。

ディープラーニングの導入プロセス

これまでディープラーニングについて説明していきました。では実際にディープラーニングを導入するにはどのようなステップを踏むべきなのでしょうか。

以下は基本的な機械学習のステップを図式化したものです。これを参考にしてみてください。

作成：AINOW編集部

主な流れは

既存業務・事業にAIで何ができるかを知る
Proof of Concept (PoC：概念検証)で実際のデータを用いて機械学習のモックアップ構築にトライする
モックアップを本番運用レベルまで進化させ、その他のシステムの環境を整える
実際に機械学習を運用し、精度のモニタリングとチューニングをし、システムの監視や機能改善を測る

の様になり、これらはフェーズごとの最低必要コストの目安(推定額)で以下の画像のような平均になるそうです。

作成：AINOW編集部

しかしながら注意点として、ディープラーニングを導入するためには膨大なデータが必要で、そのデータを学習するコストも必要とされます。技術的な指標だけでなく、売上などビジネス的な指標でディープラーニングをしっかり評価し、適材適所で活用していくことが重要です。

ディープラーニングを使わなくても、他の機械学習のアルゴリズムや簡単なデータサイエンスのモデルで代替可能なケースも多いため、事業ややりたいことの目的を明確にし、柔軟な機械学習の導入を行いましょう。

ディープラーニングの導入について、より詳しく知りたい方は以下の記事を参考にしてください。

▶関連記事｜初心者のためのAI教科書>>

AIを学べる講座まとめ(無料講座も含む)

AIエンジニアの需要が急増しています。国内でも数々の企業が優秀なAIエンジニアに対して、高い報酬を提示するなど、AIに精通した人材の獲得に尽力しています。例えば、2019年秋頃に富士通は優秀なAIエンジニアには4000万円もの報酬を与えると発表し、話題になりました。

今、AIエンジニアを目指そうと決意した人も多いのではないでしょうか。しかし、AIエンジニアになるためには、数学的な知識も必要でなかなかハードルが高いと感じている人も多いのではないでしょうか。

そこで以下の記事では、AIエンジニアのスキルを習得することができる講座をオンライン・オフラインに分けてご紹介ています。

▶関連記事｜未経験からAIを学べる講座23選>>

ディープラーニングについて学べる書籍

2019年2月4日、日本ディープラーニング協会（JDLA）ホームページ上にて、「日本ディープラーニング協会 G検定合格者が選ぶディープラーニング関連おすすめ書籍ランキング」が公開されました。

JDLAによるG検定は、「事業にディープラーニングを活用する人材」を対象とし、エンジニアだけでなく、経営者や企画者などビジネスサイドの人も受験する検定です。

この記事ではG検定の合格者約500人が選んだオススメ書籍や、テーマ別のオススメの書籍、またオススメのサイトやTwitterアカウントまで幅広く紹介します。漠然とAI・人工知能について学びたいと考えている方におすすめです。ぜひ自分に合った本からAIについて学び、奥深いディープラーニングの知識もつけてみてください！

ディープラーニング関連の資格＆検定

G検定とは

受験資格	制限なし
実施概要	試験時間：120分知識問題（多肢選択式・220問程度）オンライン実施（自宅受験）
出題範囲	シラバスより出題
受験費	一般13,200円（税込）学生5,500円（税込）

G検定(ジェネラリスト検定)は受験者がディープラーニングを事業に活用できるような知識を持っているかを試す試験のことです。

G検定を受験することで、DX人材へのステップアップになることや、ITやディープラーニングの知識を持っていることを証明できます。一部の企業ではマーケティング職や経営企画職ではAIを用いた業務を行っていますし、エンジニア任せではない、実務的な知識習得が可能です。

G検定について詳細に知りたい方や、関連する検定を知りたい方は以下のリンクから飛ぶことで解決できます。

▶関連記事｜ディープラーニングの知識を問うG検定とは!？>>

▶関連記事｜【2021年版】AI関連資格をまとめて解説！>>

▶関連記事｜AI関連の検定おすすめ5選>>

ディープラーニングの利活用を進める日本ディープラーニング協会（JDLA）

日本ディープラーニング協会（JDLA）は日本の産業がディープラーニングをより有効に活用して、産業競争力を高めていくことを目指し、東京大学大学院工学系研究科特任准教授の松尾豊氏を理事長とし、ディープラーニングの有識者が中心となって、産業促進を促すために設立された団体です。AINOWのメディアパートナーです。

ディープラーニングの資格検定試験「G検定」や「E資格」を設けて人材育成に取り組むほか、ディープラーニングを活用したコンテストなども開催し、ディープラーニングの普及に努めています。

AI専門ニュースメディア AINOW