第37回:シリーズ『AIで進化するOCR新事情』(1/2)

いま話題の「AI OCR」が変えること

昨今、OCR技術にAI(人工知能)技術を融合させた「AI OCR」が注目を集めています。本シリーズでは、こうしたAIによるOCR技術の進化に着目しながら、最新のOCRで何が可能になり、その活用によってどのようなメリットが得られるかについて3回に分けてお話しします。その初回である今回は、話題のAI OCRにフォーカスを絞ります。

「AI OCR」とはそもそも何か

読者の皆様もよくご存じのとおり、「OCR」とは、「Optical Character Recognition」、または「Optical Character Reader」の略称で、光学文字認識(または、読み取り)技術のことです。

例えば、イメージスキャナーなどで読み取った文書は画像データですので、そのままでは文書内の文字は、文字データ(テキストデータ)としてコンピューターに認識されません。それをテキストデータとして認識されるように変換するのが、OCRの役割となります。言い換えれば、画像である文字を、「これは文字である」と認識して、テキストデータへと変換するのがOCRの機能ということです。

こうしたOCRの能力を、AIの技術(多くの場合、ディープラーニング技術)を使って強化した仕組みが「AI OCR」と呼ばれています。

メインの役割は「自由手書き文字」の認識

AI OCRでは、OCRのどの能力が強化されているのでしょうか──。その答えは、手書き文字を認識する能力です。

実のところ、従来のOCR技術は、手書き文字を認識するのが苦手でした。理由はシンプルで、手書きの文字は人によって形状が大きく異なるからです。

OCRは、言葉や文の意味を理解して文字を認識しているわけではなく、基本的には、「このフィールド内の画像は文字である」という指定や、文字の形状に基づいて、文字を認識してテキストデータへの変換を行います。

言うまでもなく、コンピューターを使って書かれたような文字・活字は、同じ書体の同じ文字であれば、誰が書いても形状はまったく同じです。ゆえに、OCRに認識させやすいと言えます。

ところが、手書き文字は、同じ文字でも人によって形状が千差万別です。そのため、従来のOCRに、それを文字として正しく認識させるのは困難でした。

また、例えば、他人が書いたカタカナの「ソ(そ)」が、「ン(ん)」や「リ(り)」に見えたりすることがあります。私たち人間は、文脈からそれが「ソ」であると判断できますが、一般的なOCRにはそれができません。また、手書きの住所にある「ハイフン(-)」にしても、人は一文の全体を見てそれが住所の記述であると理解でき、かつ、住所におけるハイフンの登場パターンを知っているので、「ハイフン(-)」を「ハイフン」としてすぐに認識できます。ところが、それを知らないOCRにとっては、手書き住所にある「ハイフン(-)」が「ハイフン」なのか、「音引き(ー)」なのか、あるいは、漢数字の「いち(一)」であるかの判別が難しかったのです。

もちろん、これまでのOCR製品の中にも、手書き文字認識の機能を持った製品があり、パナソニックの帳票用OCRソフトウェア「帳票OCR」でも、以前から手書き文字認識の機能をサポートしていました。ただし、そこには多くの制約があり、帳票OCRにしても、文字ごとに枠で区切られたテキストのみに対応し、自由に記述された手書き文字(以下、「自由手書き文字」)は認識できなかったのです。

このようなOCRの文字認識の限界を打ち破り、自由手書き文字の認識を可能にすべく登場したのがAI OCRです。

AI OCRにおける手書き文字認識の原理は、例えば、「猫」について学習した(ディープラーニングで学んだ)AIが、猫の画像を見て、それが猫であると認識できるのと同様です。猫の画像を猫と認識する頭脳は、数多くの猫の画像を学習させることで構築していきますが、手書き文字を認識する頭脳も、手書き文の画像を大量に学習させることで構築していきます。そして、学習済みの頭脳をOCR機能と統合することで、自由手書き文字を高い精度で認識し、テキストデータへと変換できるAI OCRが実現されるのです。

バックナンバー





























商品に関するお問い合わせ

パナソニック ソリューションテクノロジー株式会社 お問い合わせ受付窓口
電話番号: 0570-087870
   受付時間: 9時~12時、13時~17時30分(土・日・祝・当社指定休業日を除く)

お問い合わせイメージ お問い合わせイメージ

※ 記載されている会社名、商品名は各社の商標または登録商標です。なお、本文中では™、®マークは基本的に明記していません。