HOME/ AINOW編集部 /画像認識とは|機能・事例・仕組み・導入方法など徹底解説
2019.07.11

画像認識とは|機能・事例・仕組み・導入方法など徹底解説

最終更新日:

近年、私たちの生活とAIは切っても切り離せない関係になりつつあります。そんなAIの得意分野の一つが画像認識です。

画像認識とは、その名の通り画像からパターンを認識して「何が映っているか」を特定する技術を指します。2012年、画像認識はディープラーニングにより精度が大きく向上し、それ以降さまざまな場面で活用されるようになりました。

しかし、画像認識の概要を知らない方や、大まかにしか理解していない方も多いでしょう。

そこで今回は、「画像認識とは」を詳しく解説しつつ、画像認識の歴史や活用事例、導入におけるポイントまで紹介していきます。

画像認識とは

画像認識とは、簡単に言うと「画像から何が映っているのかを認識する技術」です。

ディープラーニングと呼ばれる手法によって精度が格段に向上し、現在の画像認識は、ときに人間を超える能力を発揮します。

画像認識について理解するのにぴったりな画像があります。

こちらは、アトムテック株式会社が2020年12月に正式提供を開始した「AI人数カウントサービス」の画像です。

AI人数カウントサービスでは、ディープラーニング技術により画像から人間を特定してカウントすることで、コロナ禍の3密を可視化できます。

椅子や柱は検出されることなく、人間だけをうまく検出していますよね。

このように、画像認識は対象物の特徴を捉えたものを検出し、それが何かを特定することができます。

画像認識にできること

画像認識の技術は主に以下の認識ができます。

  • 物体認識
  • 顔認識
  • 文字認識

これらは、さまざまな分野に応用が可能です。

例えば、人間の書いた文字をコンピュター上で編集可能な形で出力したり、通常時の画像と違うものを検出して異常とみなしたりできます。

また、スマホの顔認証セキュリティや写真の加工アプリなど、画像認識は私たちの身近なところでも頻繁に使われています。

画像認識の歴史

コンピュータによる画像認識研究

コンピュータによる本格的な画像認識研究が始まったのは1960年代です。

対象は 宇宙開発、核物理学、医学などの先端分野に限られており、当初は人工衛星画像の画質改善や、印刷物の文字を表す2値画像の認識などに活用されていました。

コンピュータによる画像認識は、非常に高度かつ複雑な処理が必要になります。そのため当時は、技術が足りず研究が難航する状態が続きました。

1970年代からはコンピュータが大学や研究室や普及しだし、それに伴って画像認識技術も発達していきました。

機械学習の登場

2000年代に入ってからは、計算機やデジタル機器の技術革新で、データの高速処理が可能になり、画像認識がさらに発展していきます。

インターネットの普及も相まって、画像認識技術は一般的な存在として世の中に広がっていきました。「デジタルカメラ」や「ネットでの画像検索」などが、その最たる例です。

また、大量のデータからパターンを見つける「機械学習」を、画像認識に応用することで、より効率的かつ正確な画像認識ができるようになりました。

ディープラーニングの登場

2012年、ILSVRCという大規模な画像認識コンテストにてトロント大学のチームが圧勝したことをきっかけに、画像認識はさらに躍進します。

このコンテストは2012年以前、毎年1%~2%単位でエラー率を減少させていました。

しかしこの2012年のトロント大学は、ディープラーニングの手法の一つである「CNN(畳み込みニューラルネットワーク)」を活用したことにより10%程度もエラー率を改善したのです。

2012年以降の画像認識におけるエラー率の推移

衝撃の結果がディープラーニングへの注目を集めAIブームを引き起こすきっかけになりました。画像認識は今でもディープラーニングのメジャーな活用方法です。

現在の画像認識コンテストでは、上位のほとんどのモデルがディープラーニング(CNN)を利用しており、正答率は95%以上と、すでに人間のレベルを超える領域に達しています。

ディープラーニングの魅力は「人間がデータ内の特徴を指定しなくてもAIが自動で画像から特徴を取り出して、アルゴリズム作成までしてくれる」という点です。

ディープラーニングが登場して以降、技術者がいなくても比較的容易に画像認識ができるようになったため、現在はさまざまな場面で画像認識の活用が進んでいます。

▼ディープラーニングの画像認識について詳しくはこちら

画像認識の仕組み

ここからは「コンピューターやAIがどのようにして画像認識をしているのか」ということについて解説していきます。

画像認識行うには、まず画像処理(画像から対象物を抽出)をしなければなりません。

私たちは、容易に画像に写っている対象物が何なのかを判断できます。例えば、下記の画像を見たとき、犬が1匹写っていることは一瞬で理解できますよね。

私たちが画像の犬を視覚で理解できる一方で、コンピュータは以下のように画像データを「ピクセル毎の情報(色合い、明るさ)の集合体」として捉えます

AINOW編集部作成

画像の対象物はさまざまな角度、大きさ、明るさ存在しており、ノイズだらけの情報から対象物を認識しなければなりません。

そのため、「この画像に何が写っているのか」を理解しやすくなるように、4つの処理を行います。

  1. 画像のノイズや歪みを除去
  2. 明るさや色合いを調整
  3. オブジェクトの輪郭を強調
  4. オブジェクトの領域を切り出す(領域抽出)

このようなステップを踏むことで、コンピュータは画像処理を行い、画像の情報(色・明るさなど)を抽出します。

領域抽出が完了したら、次は画像認識です。

従来の画像認識では、機械学習が使われていました。

機械学習では、大量の画像データとラベル(画像データが何を表すか)を与え、その組み合わせをもとにして自動でラベル毎の画像データの特徴を学習します。

しかし、従来の機械学習では、画像から特徴を抽出することをコンピュータのみで行うのは困難であり、特徴データを人間が与える必要がありました。

そこで登場したのが、前述にもあったディープラーニングです。

ディープラーニングを利用する画像認識では、大量の画像データさえ与えれば、そこから自動で特徴データを抽出できます。

例えば、猫の画像を従来のシステムが猫と判断するには、耳の形や髭の本数、顔の形や色など、細かい部分までエンジニアが定義しなければなりませんでした。

しかし、ディープラーニングでは、大量の画像を学習することで特徴を自動的に取得し、それが猫なのか、犬なのかを判断することが可能です。

特徴の識別が難しい画像認識の分野は、特にディープラーニングの学習能力の恩恵を受けやすく、物体認識の精度を格段に向上させられます。

画像認識の活用事例

現在、世の中ではさまざまな分野で画像認識の活用が進んでいます。ここでは、画像認識の活用事例を8つ紹介します。

製造業の不良品検知

富士通は、画像認識AIの自動外観検査機を製造ラインに導入することで、不良品検出の精度や人手不足の解消を解決しようと試みています。

この検査機は、製品組み立て完了後に、装置カバー面に貼られるCPUスペックやWindowsのバー状んなどのラベル情報、キーボードの印字言語などに間違いがないか、画像認識技術で自動的に判別することが可能です。

医療の画像診断

図 医師の診断(緑)とコンピュータの自動検出(紫)が示した早期胃がんの領域

医師の診断(緑)とコンピュータの自動検出(紫)が示した早期胃がんの領域(出典:国立がん研究センター公式サイト

理科学研究所国立 国立がんセンターは、AIの画像認識を早期胃がんの検出に活用しています。

早期胃がんは形状が多様であり専門家でも認識が困難でしたが、ディープラーニングを活用した画像認識技術を用いたことで、陽性的中率93.4%、陰性的中率83.6%の高精度の掲出法を確立しました。

画像認識搭載のドローンで農薬を散布

株式会社オプティムは、ドローンやロボットなどが撮影した画像をディープラーニングで解析し、害虫などが検出されたと判定された際に、その地点へドローンが移動し、ピンポイントで農薬を散布する製品を開発しました。

同テクノロジーはすでに実用段階に入っており、大豆では90%~99%の農薬使用量の削減に成功しています。

河川のひび割れを検知

八千代エンジニヤリングは、株式会社ブレインパッドのディープラーニングシステムを河川の護岸コンクリートの維持管理に活用し、損傷などの点検を効率化しました。

人間による目視で劣化状況を調査していましたが、点検や改善には熟練の技術が必要となるため、多くの手間とコストがかかってしまいます。

しかし同システム導入すると、現場での対応工数は1/5に削減され、技術者による目視点検と遜色ない精度で点検することに成功しました。

交通誘導警備

株式会社KB-eye forは、工事現場に画像認識AIを使った警備システムを開発しました。

道路工事の交通誘導ではカメラで車両や通行人を検出して警備員に無線で状況を知らせ、警備員の死角をAIで補います。

これにより、警備会社の人手不足を解消できるほか、警備員のスキルに頼らず事故を未然に防ぐことにもつながります。

無人レジ店舗

高輪ゲートウェイ駅には、「TOUCH TO GO」という無人AI決済店舗があります。

TOUCH TO GOは、ウォークスルー型の完全キャッシュレス店舗です。

天井などに無数に設置されたカメラの映像をAIが認識し、入店した来店客と手に取った商品をリアルタイムに認識し、決済エリアに来店客が立つとタッチパネルに商品と購入金額を表示します。

商品を持ったら、出口でタッチパネルの表示内容を確認して支払いすれば購入は完了です。

無人レジ店舗は買い物をスムーズに行えるほか、人件費も削減できるため、今後さまざまな場所で広がっていくことが予想されます。

▼TOUCH TO GOについて詳しくはこちら

自動運転

AIベンチャー企業Preferred Networksは、画像認識技術の一つである「領域分割システム(画像セグメンテーション)」の開発を行っており、そのシステムを自動運転の技術開発に活用しています。

上記の画像から分かるように、人、車、自転車、ガードレール、トンネル、交通標識、信号などのさまざまな物体を認識して色分けしています。

この精緻な画像認識を可能にする領域分割システムは、自動運転に必要不可欠な技術です。

空港の顔認証システム

成田空港では、出国ゲートにAIの顔認証システムを導入しています。

今までは出国ゲートにスタッフが立ち、顔写真との見比べや出国の押印していたため、常に長蛇の列が発生していました。

そこでIC旅券のICチップ内の顔の画像と、顔認証ゲートのカメラで撮影された顔の画像を照合するシステムを導入したところ、数秒で完了するスムーズな手続きが可能になりました。

画像認識導入のプロセス

ここまで画像認識の活用事例を紹介してきましたが、実際に画像認識を導入したい場合はどうすれば良いのでしょうか。

画像認識モデルの作成には大きく3つのプロセスがあります。

  1. 目的とそれに応じた認識モデルの精度を決定
  2. それを基にデータを収集してモデルを作成
  3. 開発したモデルの評価を繰り返して精度を向上

このようなプロセスを経るAI導入では、3つの躓きやすいポイントがあります。

  • 開発技術が自社にない
  • 既存の業務、事業の定義が不足している
  • データの量の不足や整理の不足

特に開発技術が自社にない場合の多くは、導入受注企業などと相談しながら解決してくことになります。

つまり、画像認識モデルの作成における3つのプロセスで最も大事なことは、「目的の設定」です。

人の命が関わる産業なのか、費用が削減できれば良いのか、どのくらいの予算規模で開発するのかなど、既存の事業のあり方によって画像認識を含めたAIに求められる役割も変わります。

そのため、目的の部分を開発サイドに丸投げせずに、自社でもきちんと考えることが重要です。

画像認識の今後

画像認識に関する市場や技術は、今後伸びていくことが予想されます。

2020年3月、株式会社富士キメラ総研は、「画像・音声AI/次世代インターフェース市場の現状と将来展望」を発表しました。

同発表によると、2025年の画像認識関連技術の国内市場は、2018年の3.1倍である746億円になると予想されています。

画像認識は、製造業における不良品検知や社会インフラの確認、建造物の保全業務などのほか、顔認証システムや自動運転技術など応用範囲が非常に幅広いため、市場規模の拡大が期待されています。

しかし、新型コロナウイルスが画像認識の市場に影響を及ぼす可能性もあるため、この予想通りに市場が拡大していくか、定かではありません。

まとめ

今回は、「画像認識」について解説してきました。いかがだったでしょうか。

人間の目によって行われている仕事は膨大にあるため、画像認識は技術の進歩と発想次第で、さまざまな活用の可能性が秘められています。

画像認識は、AIの中でも特に市場が拡大している分野です。

異常検知や顔認証などのメジャーな活用事例はもちろん、最近ではカメラで手書き文字を認識して、文字データに変換する技術「AI-OCR」の活用も進んでいます。

今後も活用の幅を広げ、より私たちの身近な存在になるであろう画像認識の動向には目が離せません。

▼YouTubeでもこの記事について解説中!

 

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

ローコード開発 デメリット アイキャッチ画像

【初心者でもわかる】大注目のローコード開発!メリット、デメリットとともに解説

【2021年最新版】ローコード開発無料ツール3選 | 特徴徹底解説!

ローコード アイキャッチ

ローコード開発ツールとは?トレンドになっている理由は?

【ツール紹介あり】ローコード開発とは?メリット・デメリットも紹介!のアイキャッチ画像

【ツール紹介あり】ローコード開発とは?メリット・デメリットも紹介!

ノーコード開発ツール アイキャッチ画像

【完全版】ノーコード開発ツールとは?メリット・選定ポイントも解説!

ノーコードツールのアイキャッチ画像

【用途別】おすすめのノーコードツール|選定ポイントも紹介

【無料版も掲載】ノーコード開発ツール紹介|知識なしのアプリ開発のアイキャッチ画像

【無料版も掲載】ノーコードでできるアプリ開発ツール紹介

【2021版】無料ではじめられるノーコードツール徹底比較!

広告管理ツールについての解説記事:アイキャッチ画像

【3分で読める】広告管理ツールとは?厳選ツールやメリットも紹介

広告管理の解説記事のアイキャッチ画像

【2021年最新版】広告管理とは?厳選ツールやメリットまで徹底解説

あなたにおすすめの記事

ローコード開発 デメリット アイキャッチ画像

【初心者でもわかる】大注目のローコード開発!メリット、デメリットとともに解説

【2021年最新版】ローコード開発無料ツール3選 | 特徴徹底解説!

ローコード アイキャッチ

ローコード開発ツールとは?トレンドになっている理由は?

【ツール紹介あり】ローコード開発とは?メリット・デメリットも紹介!のアイキャッチ画像

【ツール紹介あり】ローコード開発とは?メリット・デメリットも紹介!

ノーコード開発ツール アイキャッチ画像

【完全版】ノーコード開発ツールとは?メリット・選定ポイントも解説!

ノーコードツールのアイキャッチ画像

【用途別】おすすめのノーコードツール|選定ポイントも紹介

【無料版も掲載】ノーコード開発ツール紹介|知識なしのアプリ開発のアイキャッチ画像

【無料版も掲載】ノーコードでできるアプリ開発ツール紹介

【2021版】無料ではじめられるノーコードツール徹底比較!

広告管理ツールについての解説記事:アイキャッチ画像

【3分で読める】広告管理ツールとは?厳選ツールやメリットも紹介

広告管理の解説記事のアイキャッチ画像

【2021年最新版】広告管理とは?厳選ツールやメリットまで徹底解説