最終更新日:
OCRとは、画像データから文字を認識して、機械が読み取れる形に変換する技術です。AI技術を取り入れることで、さらに精度を増し、活用の幅が広がっています。
この記事では、OCRとAI-OCRに違いはあるのか。AIによってできるようになったのはどんなことか?そんな「AI-OCRって何だろう?」という疑問にお答えします。
さらに、実際にOCRを使いたい人に向けて、無料ソフトから有料ソフト、定型帳票に特化してものから非定型帳票に対応したものまで、目的別に分類したOCRソフトを紹介します。
【この記事でわかること】 ※クリックすると見出しにジャンプします |
目次
AI-OCRとは
AI-OCRとは、OCRとAIを融合させたツールです。
▶《2022年決定版》AI OCRツールのおすすめ5選を比較!選び方のポイントも紹介>>
OCRとは?
OCRとは、Optical Character Recognitionの略で日本語では「光学的文字認識」と言われる技術です。
手書きの文字や印刷された文字を、光を当てることで認識してテキストデータにすることを指します。この技術を使えば、手作業で行うデータ入力を効率化することが出来ます。
今では無料で使えるスマホアプリも出ているように身近な技術になっています。精度をあげた理由にはAI技術があります。機械学習により、文字を認識する機能がより高精度になり、かなり実用的に進歩しました。
AIとOCRの関係
それではAI-OCRとは何でしょうか。ズバリ、AI技術を使ったOCR、あるいはAIによって生成されたモデルを搭載したOCRを指します。
今日広く使われているほとんどのOCRは、AI技術を活用しています。単にOCRと呼ばれていても、AI-OCRであることがほとんどです。
従来のOCRは、AIの力を借りてAI-OCRとなることで、進化しました。
それではAIによって何が変わったのでしょうか。今日のAIブームは、ディープラーニングと呼ばれる技術が、ブレイクスルーを起こしたことに始まります。
AI-OCRもこの技術の恩恵にあずかっています。手書き文字は、人によって特徴が出るうえに、細かな違いで意味が変わってしまします。例えば、「ン」と「ソ」の違いは人間でも誤ってしまいます。これを機械に読み取ってもらうのですから大変です。
これを、実用可能にしたのがディープラーニングです。
▼関連記事はこちら
AI-OCRの導入が進んだ背景
AI-OCRが導入され始めた背景として、AIの進化と生産性向上を求める動きが挙げられます。
近年、AIはあらゆる分野で活用が広がり、企業ではDX化も進んでいます。また、労働力が不足している中、生産性を向上させることは企業の課題でした。
そのため、読みといづらい手書きの文字や印刷された文字を正確にデータ化できるAI-OCRは多くの企業で活用が広がっています。
AI-OCRのメリットとデメリット
AI-OCRにはメリット、デメリットがあります。以下でそれぞれ解説します。
メリット
ここではAI-OCRを業務に導入するメリットを紹介します。
メリットは以下のようなものです。
- 効率化ができる
- 人によって差がでない
- RPAなどと組み合わせることができる。
まず、効率化についてです。私たちが一言一句文字を読んで、文字起こしするプロセスを機械が一瞬で行ってくれます。人間は、その時間を他の業務にあてることが可能になります。
また、人によって文字をどう読むかを画一的な規格に則ってできるのも大きなポイントです。
さらに、OCRはRPAなどと組み合わせることで更なる力を発揮します。RPA(Robotic Process Automation)とは、私たちの行う定型業務を機械に代替させる概念です。AIとともに注目されています。
例えば、OCRで読み取った文書を、RPAによって分類して指定のフォルダに入れることなどができます。
このように、機械が読み取れる形に変換するOCRは、他のテクノロジーとも相性抜群です。
デメリット
次に、AI-OCRを業務に導入する際のデメリットを紹介します。
デメリットは以下のようなものが挙げられます。
- 文字を認識できない場合もある
- フォーマットによっては対応できない
文字認識について、確かにAIは人間よりも正確に文字を読み取れます。しかし、それでも間違えることはあるということです。そのため、AI-OCRを導入した後も直接人間の目で最終確認することが重要となります。
また、フォーマットについて、どのフォーマットに対応できるかは導入するAI-OCRごとに異なります。このことから、AI-OCRを導入する際は、対応フォーマットを確認しておくことが必要です。
AI-OCRの種類
AI-OCRの種類ごとの違いを紹介します。この種類は読み取る帳票の「種類」と「フォーマット」によって分類されます。帳票の「種類」は「汎用・業務特化」に、「フォーマット」は「定型・非定型」に分かれています。
そして、AI-OCRは以下の3つの種類があります。
それぞれ解説します。
汎用×定型フォーマット型
まず、汎用×定型フォーマット型は種類が「汎用」でフォーマットが「定型」の帳票を読み取るタイプのものです。この場合、帳票の種類は問われませんが、事前に作業で帳票のフォーマットを定義しておくことが必要となります。
定型フォーマットの方が帳票を抽出する際の精度が高くなるというメリットがありますが、一方でフォーマット定義の作業にはある程度の時間がかかるというデメリットもあります。
汎用×非定型フォーマット型
次に、汎用×非定型フォーマット型は種類が「汎用」でフォーマットが「非定型」の帳票を読み取るタイプのものです。この場合は帳票の種類やフォーマットの定義を考えることなく使うことができます。
ただし、定型フォーマットよりも精度は低くなります。
業務特化×非定型フォーマット型
最後に業務特化×非定型フォーマット型は、種類が「業務特化」でフォーマットが「非定型」であるため、特定の業務に特化した帳票であれば、非定型フォーマット型でもすぐ業務に使用できるタイプです。
特定の業務に特化しているためAIが事前に学習を済ませており、利用者はそのまま使うことが可能となります。
OCRソフトの選び方
OCRを使う際には、その目的に合わせたソフトを使うことが大切です。
例えば、個人でも無料で使えるのOCRも出てきています。会社の資料や、講義の資料をテキストデータに変換すれば、自分なりのメモや資料の編集ができます。
一方で、企業単位でより大規模にOCRを導入する場合は選ぶ基準も大きく変わってきます。何を読み取るのかというインプットと、何のために出力するのかというアウトプットを意識して選択をしましょう。
目的別オススメOCR9選【比較表】
サービス | 目的 |
Office Lens | 無料で使える |
Cam Scanner | 無料で使える |
Eight | 無料で使える |
DX Suite | 手書きの文字を読み取る |
tegaki | 手書きの文字を読み取る |
FlyDate Scan | 非定型帳票に対応 |
Flax Scanner | 非定型帳票に対応 |
Recielu | 特化型 |
sweeep | 特化型 |
OCRの目的別に分けてまとめてみました。
それぞれ解説します。
スマホで無料で使いたい
今では個人でも無料でOCRを簡単に使うことが出来ます。例えば、授業や講演でのレポートや、資料作成などに活用できます。
ここでは、スマホで使えるOCRを紹介します。
Office Lens
Office Lensはマイクロソフトが開発しているソフトウェアです。こちらのアプリでは、ホワイトボードやスライドの写真を簡単に編集することができます。撮影された文字はOCRによりデータ化されるので、編集することも可能です。OneNoteやOne Driveへの連携も簡単にできます。
Cam Scanner
Cam Scannerは、googleが開発しているOCRソフトです。撮影することで、余分な余白を削除して電子データベースにすることができます。文字を認識して編集するのも可能です。ドキュメントの管理や共有の機能も充実していて汎用性が高いアプリです。
Eight
Eightは名刺交換・管理に特化したソフトで、OCRも活用しています。名刺を写真で撮るだけで文字を認識してデータ化してくれます。そこから、メッセージを送る機能なども付いています。
手書きの文字を読み取らせたい
手書きの文字は、どうしても人それぞれの特徴が出てしまいます。そのため、従来は読み取りが困難でした。しかし、AI技術を活用することでかなりの程度まで正確に読み取ることができるようになっています。
AI insideのDX Suite
DX Suiteは株式会社富士キメラ総研の調査により、AI-OCR市場のシェアNo.1だと判明したサービスです。乱筆文字などのあらい手書きのデータの高い精度で読み取ることができます。RPAツールとの連携や、大規模同時アクセスにも対応していています。
Cogent-labのtegaki
tegakiは文字通り手書きの文字を強みにしたソフトです。AINOWでもリリース前の取材をしています。多様な言語とや業界用語に対応していて、読み取りの精度にも強みがあります。
非定型帳票に対応したOCRが良い
非定型帳票とは、文字通りそれぞれの事業所の独自の規格による書類のことです。以下で紹介するAI-OCRはそのような非定型帳票を読み取ることにも強みがあるものです。
Fly dataの FlyDate Scan
Flydata scanは、AI-OCRによって非構造化データから構造化データを生み出します。特に、非定型帳票の読み取りが強みです。記載ミスを自動訂正する機能も搭載しています。
CinnamonのFlax Scanner
こちらの商品は非定型帳票対応のAI-OCRです。オンプレミス・プライベート環境を専門に取り扱っているので、社外秘の情報を対象にする場合でも安心して使用できます。論点抽出や、自動分類などにも対応していることを強みとしています。
特化型のOCRを探している
ここでは、特定の形式に特化したOCRを紹介します。
レしるのRecielu
Recieluは、無料でデジタル領収書発行サービスを展開しています。サービスは発行サービスと管理サービスの2つです。データを補完するセキュリティにも大きく力を入れています。
オートメ―ションラボのsweeep
sweeepは請求書に特化したOCRです。請求書をデータ化して仕分けた後に会計システムに連携してダウンロードをすることができます。クラウド型のOCRですぐに使用することができるのもポイントです。
おわりに
AI技術によってOCRの精度は大きく向上し、手書き文字の認識の可能性も広がっています。今後、さまざまな分野でOCRが活用されていくことが予想されます。
ITRによるとOCRの市場規模は年々増加しており、2017年度に34億円だった市場規模は2022年度は約2倍の67億円になるとしています。(https://www.itr.co.jp/report/marketview/M18001600.html)
自分の目的に合ったOCRツールを選定し、業務を少しでも効率化できるようにしてみましょう。