帳票のOCR認識

帳票をOCR認識するためには、まず帳票を画像データとして読み込みます。
「帳票OCR サーバー版」では、スキャナーや複合機からスキャンして、サーバー内のフォルダーに保存された画像ファイルを画像データとして読み込んでOCR認識します。

スキャナーから読み込み認識までのイメージ図

帳票の読み込み

■ 画像ファイルから読み込む

画像ファイルからの読み込みイメージ

「帳票OCR サーバー版」に読み込める画像ファイル形式は、BMPファイル、TIFFファイル、JPEGファイル、およびPDFファイル※1 です。

※1 画像のみのPDFファイルに限り対応しています。 セキュリティを設定したPDFファイルやアウトライン化したPDFファイルは読み込みできません。その他、形式によっては読み込みできない場合があります。

読み込んだ帳票画像の編集

「帳票OCR サーバー版」では、文字認識精度の向上に役立つ画像編集機能をご用意しています。

■ 傾き補正

表示されている画像を対象に、自動的に傾斜角度を検出し、傾き補正を行います。スキャナーからの読み込みで、斜めに取り込んでしまった場合でも自動的に傾きを補正します。

傾き補正イメージ

■ ノイズ除去

読み込んだモノクロ画像(2値画像)を範囲指定して、ノイズ(黒点状の汚れ)を除去できます。画像データにノイズがある場合に使用します。ノイズ除去を行うと、認識率がアップします。

■ 回転

画像データを回転させて向きを変更します。縦のものを横に読み込んだり、逆さまに読み込んだ場合に、画像を回転できます。

回転イメージ