AI-OCRとは? AIとOCRの関係から目的別ソフト紹介まで

最終更新日:

OCRとは、画像データから文字を認識して、機械が読み取れる形に変換する技術です。AI技術を取り入れることで、さらに精度を増し、活用の幅が広がっています。

この記事では、OCRとAI-OCRに違いはあるのか。AIによってできるようになったのはどんなことか?そんな「AI-OCRって何だろう?」という疑問にお答えします。

さらに、実際にOCRを使いたい人に向けて、無料ソフトから有料ソフト、定型帳票に特化してものから非定型帳票に対応したものまで、目的別に分類したOCRソフトを紹介します。

AI-OCRとは

OCRとは?

OCRとは、Optical Character Recognitionの略で日本語では「光学的文字認識」と言われる技術です。

手書きの文字や印刷された文字を、光を当てることで認識してテキストデータにすることを指します。この技術を使えば、手作業で行うデータ入力を効率化することが出来ます。

今では無料で使えるスマホアプリも出ているように身近な技術になっています。精度をあげた理由にはAI技術があります。機械学習により、文字を認識する機能がより高精度になり、かなり実用的に進歩しました。

AIとは

AIとは(artificial intelligence)の略で、日本語で人工知能のことです。

しかし、一口にAIと言ってもその言葉が指す対象は多岐に渡ります。専門家の間でも固まった定義は存在しません。

例えば、松尾豊氏はAIの定義を

人工的に作られた人間のような知能、ないしそれを作る技術。人間のように知的であるとは、「気づくことのできる」コンピュータ、つまり、データの中から特徴量を生成し現象をモデル化できるコンピュータという意味である。

引用:(出典)松尾豊「人工知能は人間を超えるか」(KADOKAWA)p.45

としています。

AIとOCRの関係

それではAI-OCRとは何でしょうか。ズバリ、AI技術を使ったOCR、あるいはAIによって生成されたモデルを搭載したOCRを指します。

今日広く使われているほとんどのOCRは、AI技術を活用しています。単にOCRと呼ばれていても、AI-OCRであることがほとんどです。

従来のOCRは、AIの力を借りてAI-OCRとなることで、進化しました。

それではAIによって何が変わったのでしょうか。今日のAIブームは、ディープラーニングと呼ばれる技術が、ブレイクスルーを起こしたことに始まります。

AI-OCRもこの技術の恩恵にあずかっています。手書き文字は、人によって特徴が出るうえに、細かな違いで意味が変わってしまします。例えば、「ン」と「ソ」の違いは人間でも誤ってしまいます。これを機械に読み取ってもらうのですから大変です。

これを、実用可能にしたのがディープラーニングです。

AI-OCRのメリット

ここではAI-OCRを業務に導入するメリットを紹介します。

メリットは以下のようなものです。

  • 効率化ができる
  • 人によって差がでない
  • RPAなどと組み合わせることができる。

まず、効率化についてです。私たちが一言一句文字を読んで、文字起こしするプロセスを機械が一瞬で行ってくれます。人間は、その時間を他の業務にあてることが可能になります。

また、人によって文字をどう読むかを画一的な規格に則ってできるのも大きなポイントです。

さらに、OCRはRPAなどと組み合わせることで更なる力を発揮します。RPA(Robotic Process Automation)とは、私たちの行う定型業務を機械に代替させる概念です。AIとともに注目されています。

例えば、OCRで読み取った文書を、RPAによって分類して指定のフォルダに入れることなどができます。

このように、機械が読み取れる形に変換するOCRは、他のテクノロジーとも相性抜群です。

OCRソフトの選び方

OCRを使う際には、その目的に合わせたソフトを使うことが大切です。

例えば、個人でも無料で使えるのOCRも出てきています。会社の資料や、講義の資料をテキストデータに変換すれば、自分なりのメモや資料の編集ができます。

一方で、企業単位でより大規模にOCRを導入する場合は選ぶ基準も大きく変わってきます。何を読み取るのかというインプットと、何のために出力するのかというアウトプットを意識して選択をしましょう。

目的別オススメOCR

OCRの目的別に分けてまとめてみました。一緒に見ていきましょう。

スマホで無料で使いたい

今では個人でも無料でOCRを簡単に使うことが出来ます。例えば、授業や講演でのレポートや、資料作成などに活用できます。

ここでは、スマホで使えるOCRを紹介します。

Office Lens

Office Lensはマイクロソフトが開発しているソフトウェアです。こちらのアプリでは、ホワイトボードやスライドの写真を簡単に編集することができます。撮影された文字はOCRによりデータ化されるので、編集することも可能です。OneNoteやOne Driveへの連携も簡単にできます。

Cam Scanner

Cam Scannerは、googleが開発しているOCRソフトです。撮影することで、余分な余白を削除して電子データベースにすることができます。文字を認識して編集するのも可能です。ドキュメントの管理や共有の機能も充実していて汎用性が高いアプリです。

Eight

Eightは名刺交換・管理に特化したソフトで、OCRも活用しています。名刺を写真で撮るだけで文字を認識してデータ化してくれます。そこから、メッセージを送る機能なども付いています。

手書きの文字を読み取らせたい

手書きの文字は、どうしても人それぞれの特徴が出てしまいます。そのため、従来は読み取りが困難でした。しかし、AI技術を活用することでかなりの程度まで正確に読み取ることができるようになっています。

AI insideのDX Suite

DX Suiteは株式会社富士キメラ総研の調査により、AI-OCR市場のシェアNo.1だと判明したサービスです。乱筆文字などのあらい手書きのデータの高い精度で読み取ることができます。RPAツールとの連携や、大規模同時アクセスにも対応していています。

Cogent-labのtegaki

tegakiは文字通り手書きの文字を強みにしたソフトです。AINOWでもリリース前の取材をしています。多様な言語とや業界用語に対応していて、読み取りの精度にも強みがあります。

非定型帳票に対応したOCRが良い

非定型帳票とは、文字通りそれぞれの事業所の独自の規格による書類のことです。以下で紹介するAI-OCRはそのような非定型帳票を読み取ることにも強みがあるものです。

Fly dataの FlyDate Scan

Flydata scanは、AI-OCRによって非構造化データから構造化データを生み出します。特に、非定型帳票の読み取りが強みです。記載ミスを自動訂正する機能も搭載しています。

CinnamonのFlax Scanner

こちらの商品は非定型帳票対応のAI-OCRです。オンプレミス・プライベート環境を専門に取り扱っているので、社外秘の情報を対象にする場合でも安心して使用できます。論点抽出や、自動分類などにも対応していることを強みとしています。

特化型のOCRを探している

ここでは、特定の形式に特化したOCRを紹介します。

レしるのRecielu

Recieluは、無料でデジタル領収書発行サービスを展開しています。サービスは発行サービスと管理サービスの2つです。データを補完するセキュリティにも大きく力を入れています。

オートメ―ションラボのsweeep

sweeepは請求書に特化したOCRです。請求書をデータ化して仕分けた後に会計システムに連携してダウンロードをすることができます。クラウド型のOCRですぐに使用することができるのもポイントです。

おわりに

AI技術によってOCRの精度は大きく向上し、手書き文字の認識の可能性も広がっています。今後、さまざまな分野でOCRが活用されていくことが予想されます。

ITRによるとOCRの市場規模は年々増加しており、2017年度に34億円だった市場規模は2022年度は約2倍の67億円になるとしています。(https://www.itr.co.jp/report/marketview/M18001600.html

自分の目的に合ったOCRツールを選定し、業務を少しでも効率化できるようにしてみましょう。

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する