OCRとは?
~「OCR技術」と「AI-OCR技術」の違い~
公開日:2023 / 5 / 31更新日:2024 / 1 / 19
“ OCRとは? ”
Optical Character Recognition(光学式文字読取)の略で、活字や手書き文字などを画像データとして取り込み、編集可能なテキストデータ(文字コード)に変換する技術のことです。
本サイトでは、OCRに関するさまざまな疑問にお答えします。
これまでのOCR技術とは?
すべての工程を「AI」ではなく、「人」が設計します。
「人」が決めたルールの範囲内で認識結果を導き出すのが、これまでのOCR技術です。

新たなAI-OCR技術とは?
「人」が決めたルールの範囲外の文字にも対応できるため、これまで文字認識できなかったものが認識可能になります。「AI」が繰り返し学習した内容に基づいて、認識対象の特徴や識別するポイント・ルールを導き出すことで識字率が向上します。

(例)手書き文字の「島根県松江市母衣町」と「島根県松江市学園南」を認識する場合
~教師データを学習したAI-OCRが自ら特徴を抽出し、文字・画像を認識~
「これまでのOCR技術」と
「新たなAI-OCR技術」の違いとは?
これまでのOCR技術では、「人」の癖が入る手書き文字など、無数に存在する文字の特徴すべてを登録しきれないため、正確な認識が困難です。新たなAI-OCR技術では、文字ごとに異なる特徴を自動で抽出するため、より正確な文字認識が可能になります。

「これまでのOCR技術」と「新たなAI-OCR技術」
それぞれの強みとは?
もちろん「これまでのOCR技術」にも強みがあります。認識対象となる文字のパターンが限られる活字や免許証、保険証などに強みを発揮します。「これまでのOCR技術」と「新たなAI-OCR技術」を適材適所で組み合わせることで、より効果を発揮すると言えます。

AI-OCRをもっと知りたい!
AI-OCRって、どんなふうに文字を認識しているのか、パナソニックが独自開発した技術をもとにご紹介します。
AI-OCRの技術 #1
文字列の塊ではなく、文字を1つずつ取り出すことにより認識精度を上げています。
OCR技術 | 「文字列の塊」で認識され、意図した領域の検出が困難・・・
|
---|

AI-OCR技術 | 「文字列を1文字ずつ検出」、意図した領域の検出が可能!
|
---|
AI-OCRの技術 #2
文字同士の境界を含めて「AI」に学習させることで、認識精度が大幅に向上します。
OCR技術 | 文字同士の境界があいまいな複数文字の認識が困難・・・ |
---|

AI-OCR技術 | 未知の文字への対応でフリーピッチの文字列も高精度で認識! |
---|
AI-OCRの技術 #3
AI-OCRで読み取り可能な手書き文字の画像例をご紹介します。
申込書や請求書、アンケート用紙などに記入された住所・氏名・会社名・電話番号などの手書き文字を認識します。※

(例1)領域からはみ出した文字列

(例2)上下の文字が領域内に入った文字列

(例3)下線付きの文字列

AI-OCRの技術 #4
AI-OCRで読み取り可能な情景内の文字認識技術をご紹介します。
従来のOCR技術では正確に認識することが困難だった、カメラ画像などの複雑な背景と一体化している文字や、白抜き文字・飾り文字などの特殊文字(情景内文字)を検出・認識します。※
OCR技術 | 文字に背景があるものやロゴ文字は、文字の検出・認識が困難・・・ |
---|

AI-OCR技術 | 背景ノイズの影響を受けずに文字検出が可能! |
---|
※ すべての文字が認識できるわけではありません。ご導入に際し、「無料体験版」にてお手持ちの文書の認識精度をご確認ください。詳しくはお問い合わせください。
関連記事
パナソニック ソリューションテクノロジー株式会社では、注文書や請求書などの入力や転記作業に対応した「WisOCR for 注文書・請求書」と、申込書や作業報告書・検査表などのあらゆる紙帳票の入力や転記作業に対応した「WisOCR」という2つのAI-OCR製品をご用意しております。AI-OCRの導入を検討されている方は、ぜひ一度お問い合わせください。