第37回:シリーズ『AIで進化するOCR新事情』(2/2)

いま話題の「AI OCR」が変えること

AI OCRで可能になる文字認識

AI OCRも、人のように手書き文の意味を解釈して文字を認識するわけではありません。ただし、正しいデータのインプットによって学習したAI OCRは、あたかも文の意味を解釈しているかのように、自由手書き文字を高精度で認識することができます。

では、AI OCRによって具体的にどのような文字認識が可能になるのでしょうか──。以下では、パナソニック ソリューションテクノロジーがディープラーニング技術を用いて開発した「AI手書き文字認識」エンジンを使いながら、AI OCRによる文字認識の例をいくつかご紹介します。

まずは、以下の手書き文字サンプルと認識結果をご覧ください。

サンプル(1)手書き氏名の例
サンプル(2)手書き住所の例

このように、AI OCRでは、自由手書きの氏名や住所などを高い精度で認識できます。

上のサンプルのように、それぞれの筆跡はバラバラで、「太」や「大」という文字の形状を比べてもかなり違います。従来のOCRでは、こうした自由手書き文字を正しく認識することはできませんでした。しかも、住所の場合、上述したような「ハイフン(-)」の判別など、認識を困難にする因子がさまざまに絡まってきます。それでも、AI OCRでは、非常に高い精度で自由手書き文字が認識できるのです。

このような文字認識が可能なのは、AI OCRが、ディープラーニングで獲得した文字認識のアルゴリズムを使って文字を認識しているためです。それは例えば、猫の形状がさまざまであるにもかかわらず、ディープラーニングで正しく学習したAIの頭脳が、猫を猫として精度よく認識できるのと同じと言えます。また、ディープラーニングで正しく学習した頭脳は、文全体をとらえ、文字の前後関係から特定の場所に入る文字を高い精度で予測できます。そのため、住所にある「ハイフン(-)」を漢数字の「いち(一)」などではなく正しくハイフンであると認識できるわけです。

ちなみに、パナソニック ソリューションテクノロジーでは現在、AI手書き文字認識のエンジンを「クラウドOCRサービス」(顧客企業のシステムにOCR機能を実装するためのWeb API群)の一つとして提供しています。このWeb API「クラウドAI OCRサービス」を使うことで、さまざまなアプリケーションやシステムから、簡単にAI OCRの機能を使うことが可能になります。また、帳票OCRとクラウドAI OCRサービスとの連携も実現され、帳票OCRの機能として、AI OCRの機能を使うことも可能です。

次回は、こうしたAI OCRソリューションについて、さらに詳しくご紹介します。

バックナンバー





























商品に関するお問い合わせ

パナソニック ソリューションテクノロジー株式会社 お問い合わせ受付窓口
電話番号: 0570-087870
   受付時間: 9時~12時、13時~17時30分(土・日・祝・当社指定休業日を除く)

お問い合わせイメージ お問い合わせイメージ

※ 記載されている会社名、商品名は各社の商標または登録商標です。なお、本文中では™、®マークは基本的に明記していません。