• 技術紹介

OCRとは?
~「OCR技術」と「AI-OCR技術」の違い~

公開日:2023 / 5 / 31更新日:2024 / 1 / 19

“ OCRとは? ”

Optical Character Recognition(光学式文字読取)の略で、活字や手書き文字などを画像データとして取り込み、編集可能なテキストデータ(文字コード)に変換する技術のことです。

本サイトでは、OCRに関するさまざまな疑問にお答えします。

これまでのOCR技術とは?


すべての工程を「AI」ではなく、「人」が設計します。
「人」が決めたルールの範囲内で認識結果を導き出すのが、これまでのOCR技術です。

【日本語活字・手書き文字認識エンジン】(1)文字特性解析技術で、文字の特徴を抽出 (2)パターンマッチング技術で、あらかじめ登録されている文字にどれだけ近いかを計算 (3)単語辞書による言語処置で、文字列の前後関係でより正確な文字認識を実施
(例)手書き文字の「島根県松江市」を認識する場合

新たなAI-OCR技術とは?


「人」が決めたルールの範囲外の文字にも対応できるため、これまで文字認識できなかったものが認識可能になります。「AI」が繰り返し学習した内容に基づいて、認識対象の特徴や識別するポイント・ルールを導き出すことで識字率が向上します。

【AI技術を活用したOCRエンジン】AI-OCRが自動で特徴を抽出・分類!人の手によるロジック設計は不要で、特徴が無数に存在する手書き文字の認識精度が向上

(例)手書き文字の「島根県松江市母衣町」と「島根県松江市学園南」を認識する場合
~教師データを学習したAI-OCRが自ら特徴を抽出し、文字・画像を認識~

「これまでのOCR技術」と
「新たなAI-OCR技術」の違いとは?


これまでのOCR技術では、「人」の癖が入る手書き文字など、無数に存在する文字の特徴すべてを登録しきれないため、正確な認識が困難です。新たなAI-OCR技術では、文字ごとに異なる特徴を自動で抽出するため、より正確な文字認識が可能になります。

【OCR技術】 (1)一文字ずつ切り出す (2)特徴抽出 (3)分類 (4)人間が設計したルール ※無数に存在する文字の特徴すべてをカバーしきれず正確な認識が困難…/【AI-OCR技術】 (1)大量の文字データを学習 (2)特徴抽出・分類 (3)AI-OCRの学習範囲 ※AI-OCRが文字ごとに異なる特徴を自動で抽出より正確な文字認識が可能!
(例)手書き文字の「島根県松江市母衣町」を認識する場合

「これまでのOCR技術」と「新たなAI-OCR技術」
それぞれの強みとは?


もちろん「これまでのOCR技術」にも強みがあります。認識対象となる文字のパターンが限られる活字や免許証、保険証などに強みを発揮します。「これまでのOCR技術」と「新たなAI-OCR技術」を適材適所で組み合わせることで、より効果を発揮すると言えます。

【OCR技術の強み】大量データが無くても一定レベルの認識が可能、GPUが無くても処理が可能、多様な実行環境に対応/【AI-OCR技術の強み】未知のものにも対応可能、大量の学習データがあればより高精度の認識結果を得られる、追加学習による認識精度向上

AI-OCRをもっと知りたい!


AI-OCRって、どんなふうに文字を認識しているのか、パナソニックが独自開発した技術をもとにご紹介します。

AI-OCRの技術  #

文字列の塊ではなく、文字を1つずつ取り出すことにより認識精度を上げています。

OCR技術

「文字列の塊」で認識され、意図した領域の検出が困難・・・

文字列の塊での認識イメージ
黒画素の塊を領域ごとにまとめて、文字・表・画像・図形などの領域に振り分けるため、領域のまとまりが意図しないものになってしまう。

AI-OCR技術

「文字列を1文字ずつ検出」、意図した領域の検出が可能!

文字列を1文字ずつ検出するイメージ
文字そのものを1文字ごとに検出することで、検出された文字を単語などのまとまった単位として成形することができる。

AI-OCRの技術  #

文字同士の境界を含めて「AI」に学習させることで、認識精度が大幅に向上します。

OCR技術

文字同士の境界があいまいな複数文字の認識が困難・・・

AI-OCR技術

未知の文字への対応でフリーピッチの文字列も高精度で認識!

AI-OCRの技術  #

AI-OCRで読み取り可能な手書き文字の画像例をご紹介します。

申込書や請求書、アンケート用紙などに記入された住所・氏名・会社名・電話番号などの手書き文字を認識します。

氏名・住所の手書き文字イメージ

(例1)領域からはみ出した文字列

領域からはみ出した手書き文字イメージ

(例2)上下の文字が領域内に入った文字列

上下の文字が領域内に入った手書き文字イメージ

(例3)下線付きの文字列

下線付きの手書き文字イメージ

AI-OCRの技術  #

AI-OCRで読み取り可能な情景内の文字認識技術をご紹介します。

従来のOCR技術では正確に認識することが困難だった、カメラ画像などの複雑な背景と一体化している文字や、白抜き文字・飾り文字などの特殊文字(情景内文字)を検出・認識します。

OCR技術

文字に背景があるものやロゴ文字は、文字の検出・認識が困難・・・

AI-OCR技術

背景ノイズの影響を受けずに文字検出が可能!

※ すべての文字が認識できるわけではありません。ご導入に際し、「無料体験版」にてお手持ちの文書の認識精度をご確認ください。詳しくはお問い合わせください。

関連記事



パナソニック ソリューションテクノロジー株式会社では、注文書や請求書などの入力や転記作業に対応した「WisOCR for 注文書・請求書」と、申込書や作業報告書・検査表などのあらゆる紙帳票の入力や転記作業に対応した「WisOCR」という2つのAI-OCR製品をご用意しております。AI-OCRの導入を検討されている方は、ぜひ一度お問い合わせください。

  AI-OCRのお役立ち資料


  AI-OCRの社内導入に向けて
稟議書に記載すべき3つの要素

データ入力業務の効率化を目的に「WisOCR for 注文書・請求書」を導入する際、社内向けの稟議書作成でお役立ていただける内容となっております。

  AI-OCRの導入前、必ずトライアルで
確認しておきたい3つのポイント

トラブルを未然に防ぐために、AI-OCRの導入前にトライアルでチェックしておきたい3つのポイントについて、詳しく解説します。

  注文書・請求書のDXで乗り越えるべき
3つのハードルとは!?

注文書・請求書のDXにおける“ハードル”と、その乗り越え方について解説していきます。
 

OCRソフトをお探しの方、OCR機能の組み込み開発をご検討中の方
お気軽にお問い合わせください!